scatter함수로 만든 상관계수 차트는 한눈에 알아보기는 쉽지만 데이터의 수가 많아질수록
어느 곳에 데이터가 많이 뭉쳐있는지는 파악하기가 힘들어진다.
이럴때 데이터들의 밀도를 색으로 나타내주는 Heat Map을 사용하면 밀도까지 알아보기 쉬워진다.
df.shape
plt.hist2d(data = df, x = 'displ', y ='comb', cmin = 0.5, cmap = 'viridis_r', bins = 20)
plt.colorbar()
plt.title('Displ Vs Comb')
plt.xlabel('Displacement (L)')
plt.ylabel('Combined Fuel Eff (mpg)')
plt.show()
히트맵 차트는 다음과 같다.
특별히 알아둬야할 파라미터 값에는 cmap과 bins 가 있다.
cmap에 viridis_r 로 색을 반전시킬 수 있다.
bins 값으로 사각형들을 더 촘촘히 바꿔 정밀한 히트맵을 만들 수 있다.
댓글