본문 바로가기
  • 콩's 코딩노트
머신러닝/머신러닝 할 때 꼭 짚고 넘어갈 것

Pandas의 groupby 함수 사용법

by Cong_S 2022. 5. 11.

groupby 함수는 원하는 컬럼만 묶어 데이터를 살펴볼 수 있는 아주 편리한 함수이다.

Pandas 에서는 어떻게 사용하는지 알아보자.

다음과 같은 데이터프레임이 있다.

 

이 때 날짜 별로 가격이 어떻게 변하는지 확인해보려한다.

 

이렇게 날짜 ('Date' 컬럼) 별로 가격('AveragePrice'컬럼) 의 변화를 알아볼 때

groupby 함수를 쓰면 편리하게 알아볼 수 있다.

df_date = df.groupby('Date')['AveragePrice'].mean()                
# groupby 한 이유는 같은 날짜의 데이터가 여러개이기 때문이고, 
# mean 함수는 하루동안 가격의 평균값을 구하기 위해서이다.

특히 날짜를 보면 같은 날짜가 여러번 반복되어있어 하나의 그룹으로 묶어줄 필요가 있기 때문에

groupby 함수를 사용한다.

다음과 같이 날짜별 시간대 별 평균가의 하루 평균가를 구할 수 있다.

 

비주얼라이징 해보자.

df_date.plot()
plt.show()

 

댓글