groupby 함수는 원하는 컬럼만 묶어 데이터를 살펴볼 수 있는 아주 편리한 함수이다.
Pandas 에서는 어떻게 사용하는지 알아보자.
다음과 같은 데이터프레임이 있다.
이 때 날짜 별로 가격이 어떻게 변하는지 확인해보려한다.
이렇게 날짜 ('Date' 컬럼) 별로 가격('AveragePrice'컬럼) 의 변화를 알아볼 때
groupby 함수를 쓰면 편리하게 알아볼 수 있다.
df_date = df.groupby('Date')['AveragePrice'].mean()
# groupby 한 이유는 같은 날짜의 데이터가 여러개이기 때문이고,
# mean 함수는 하루동안 가격의 평균값을 구하기 위해서이다.
특히 날짜를 보면 같은 날짜가 여러번 반복되어있어 하나의 그룹으로 묶어줄 필요가 있기 때문에
groupby 함수를 사용한다.
다음과 같이 날짜별 시간대 별 평균가의 하루 평균가를 구할 수 있다.
비주얼라이징 해보자.
df_date.plot()
plt.show()
'머신러닝 > 머신러닝 할 때 꼭 짚고 넘어갈 것' 카테고리의 다른 글
DataFrame에서 문자열로 된 날짜 컬럼을 , datetime64로 변경하는 방법 / Pandas Series의 dt 속성 사용법 (0) | 2022.05.11 |
---|---|
read_csv 함수의 error_bad_lines = False 파라미터의 사용법 (0) | 2022.05.11 |
WordCloud 에서 배경모양을 바꿔보자. (0) | 2022.05.10 |
Grid Serch 에 대해 알아보자. (0) | 2022.05.09 |
머신러닝에서 신규 데이터를 예측하는 순서 / Scaler (스케일러)나 Encoder(인코더)의 fit_transform() 과 transform() 함수 사용법 (0) | 2022.05.06 |
댓글