Pandas의 groupby 함수 사용법

groupby 함수는 원하는 컬럼만 묶어 데이터를 살펴볼 수 있는 아주 편리한 함수이다.

Pandas 에서는 어떻게 사용하는지 알아보자.

다음과 같은 데이터프레임이 있다.

이 때 날짜 별로 가격이 어떻게 변하는지 확인해보려한다.

이렇게 날짜 ('Date' 컬럼) 별로 가격('AveragePrice'컬럼) 의 변화를 알아볼 때

groupby 함수를 쓰면 편리하게 알아볼 수 있다.

df_date = df.groupby('Date')['AveragePrice'].mean()                
# groupby 한 이유는 같은 날짜의 데이터가 여러개이기 때문이고, 
# mean 함수는 하루동안 가격의 평균값을 구하기 위해서이다.

특히 날짜를 보면 같은 날짜가 여러번 반복되어있어 하나의 그룹으로 묶어줄 필요가 있기 때문에

groupby 함수를 사용한다.

다음과 같이 날짜별 시간대 별 평균가의 하루 평균가를 구할 수 있다.

비주얼라이징 해보자.

df_date.plot()
plt.show()

DataFrame에서 문자열로 된 날짜 컬럼을 , datetime64로 변경하는 방법 / Pandas Series의 dt 속성 사용법 (0)	2022.05.11
read_csv 함수의 error_bad_lines = False 파라미터의 사용법 (0)	2022.05.11
WordCloud 에서 배경모양을 바꿔보자. (0)	2022.05.10
Grid Serch 에 대해 알아보자. (0)	2022.05.09
머신러닝에서 신규 데이터를 예측하는 순서 / Scaler (스케일러)나 Encoder(인코더)의 fit_transform() 과 transform() 함수 사용법 (0)	2022.05.06