read_csv 함수의 error_bad_lines = False 파라미터의 사용법

우리는 데이터를 관리할 때 거의 매번 사용하게 되는 함수가 있다.

바로 Pandas 의 read_csv 함수이다.

이 read_csv 함수는 파라미터 값으로 error_bad_lines이라는 파라미터 값을 가지고 있다.

이 파라미터 값은 불러오는 csv 파일에 정상적이지 않은 컬럼이나 다른 행보다 더 많거나 적은 컬럼을 가진 행이 있는 등

비정상적이고 에러가 생길 수 있는 데이터들을 삭제하고 경고창도 뜨지 않게 해주는 파라미터이다.

실제 적용 시 비정상적인 부분이 있다면

아래와 같은 메세지가 뜨고 파일을 정상적으로 불러올 수 있게 된다.

chicago_df_1 =  pd.read_csv('Chicago_Crimes_2005_to_2007.csv', error_bad_lines=False)
chicago_df_2 =  pd.read_csv('Chicago_Crimes_2008_to_2011.csv', error_bad_lines=False)
chicago_df_3 =  pd.read_csv('Chicago_Crimes_2012_to_2017.csv', error_bad_lines=False)

저작자표시

'머신러닝 > 머신러닝 할 때 꼭 짚고 넘어갈 것' 카테고리의 다른 글

Time Series 데이터를 처리할 때 사용하는 resample 함수의 사용법과,이 함수를 사용하기 위해 인덱스를 설정하는 방법 (0)	2022.05.12
DataFrame에서 문자열로 된 날짜 컬럼을 , datetime64로 변경하는 방법 / Pandas Series의 dt 속성 사용법 (0)	2022.05.11
Pandas의 groupby 함수 사용법 (0)	2022.05.11
WordCloud 에서 배경모양을 바꿔보자. (0)	2022.05.10
Grid Serch 에 대해 알아보자. (0)	2022.05.09