본문 바로가기
  • 콩's 코딩노트
머신러닝/머신러닝 할 때 꼭 짚고 넘어갈 것

read_csv 함수의 error_bad_lines = False 파라미터의 사용법

by Cong_S 2022. 5. 11.

우리는 데이터를 관리할 때 거의 매번 사용하게 되는 함수가 있다.

바로 Pandas 의 read_csv 함수이다.

이 read_csv 함수는 파라미터 값으로 error_bad_lines이라는 파라미터 값을 가지고 있다.

 

이 파라미터 값은 불러오는 csv 파일에 정상적이지 않은 컬럼이나 다른 행보다 더 많거나 적은 컬럼을 가진 행이 있는 등

비정상적이고 에러가 생길 수 있는 데이터들을 삭제하고 경고창도 뜨지 않게 해주는 파라미터이다.

 

실제 적용 시 비정상적인 부분이 있다면

아래와 같은 메세지가 뜨고 파일을 정상적으로 불러올 수 있게 된다.

chicago_df_1 =  pd.read_csv('Chicago_Crimes_2005_to_2007.csv', error_bad_lines=False)
chicago_df_2 =  pd.read_csv('Chicago_Crimes_2008_to_2011.csv', error_bad_lines=False)
chicago_df_3 =  pd.read_csv('Chicago_Crimes_2012_to_2017.csv', error_bad_lines=False)

댓글