본문 바로가기
  • 콩's 코딩노트
Python/Python 문법

38. 라이브러리( Library ) (1) - 맷플롯립 ( Matplotlib ) : 데이터프레임의 시각화 (plot , countplot, pie)

by Cong_S 2022. 5. 2.

Tidy Data, 말 그대로 정연하게 정리된 자료를 말한다.

행과 열로 이루어져 하나의 데이터프레임으로 정리된 자료를 말한다. 

 

이런 자료를 한눈에 더 보기 쉽게 차트와 히스토그램으로 만들어주는 두 라이브러리에 대해 알아보자.

  • Matplotlib
  • Seaborn 

이 두 가지 라이브러리로 데이터프레임으로 정리된 데이터를 시각화시킬 수 있다.

두 가지 모두 골고루 자주 사용하게 된다.

 

 

가장 기본적인 plot 함수는 x 와 y에 입력한 값 그대로 꺾인 선의 형태로 나오는 그래프이다.

파라미터 값은 x축과  y축의 값 입력이다.

차트를 시각화시키면 메모리가 같이 찍혀나오는데 show 함수로 감추고 출력할 수 있다.

Seaborn 라이브러리에서도 똑같이 사용가능하다.

 

각 데이터 양을 막대 그래프의 형태로 표현할 수 있는 countplot 함수이다.

양을 표현하는만큼 자주 사용하게 될 형태의 그래프이다.

파라미터 값에 data, x축, y축, color 등을 입력한다.

위와 같은 방법으로 정렬도 가능하다.

arange함수와 index 함수로 정렬하는 원리.

차트를 만들다보면 문자열 데이터들이 겹쳐 안보일때가 있는데 그땐 

xticks(rotation) 으로 문자열의 각도를 조정하는 방법과 문자열을 y축으로 두는 방법으로 해결할 수 있다.

 

전체 100%를 나눠 비율을 볼 때 사용하게 될 그래프이다.

전체 중의 일부의 양을 비교할 때 많이 사용하니

value_count 함수로 양을 파악해 많이 사용하게 된다.

 

댓글