본문 바로가기
  • 콩's 코딩노트
머신러닝/머신러닝 할 때 꼭 짚고 넘어갈 것

머신러닝 전 꼭 알고 가자! - 상관계수 결과를 히트맵으로 보여주는 방법

by Cong_S 2022. 5. 5.

scatter함수로 만든 상관계수 차트는 한눈에 알아보기는 쉽지만 데이터의 수가 많아질수록

어느 곳에 데이터가 많이 뭉쳐있는지는 파악하기가 힘들어진다.

 

이럴때 데이터들의 밀도를 색으로 나타내주는 Heat Map을 사용하면 밀도까지 알아보기 쉬워진다.

df.shape

plt.hist2d(data = df, x = 'displ', y ='comb', cmin = 0.5, cmap = 'viridis_r', bins = 20)
plt.colorbar()

plt.title('Displ Vs Comb')
plt.xlabel('Displacement (L)')
plt.ylabel('Combined Fuel Eff (mpg)')

plt.show()

히트맵 차트는 다음과 같다. 

특별히 알아둬야할 파라미터 값에는 cmap과 bins 가 있다.

cmap에 viridis_r 로 색을 반전시킬 수 있다.

bins 값으로 사각형들을 더 촘촘히 바꿔 정밀한 히트맵을 만들 수 있다. 

댓글