우리는 데이터를 관리할 때 거의 매번 사용하게 되는 함수가 있다.
바로 Pandas 의 read_csv 함수이다.
이 read_csv 함수는 파라미터 값으로 error_bad_lines이라는 파라미터 값을 가지고 있다.
이 파라미터 값은 불러오는 csv 파일에 정상적이지 않은 컬럼이나 다른 행보다 더 많거나 적은 컬럼을 가진 행이 있는 등
비정상적이고 에러가 생길 수 있는 데이터들을 삭제하고 경고창도 뜨지 않게 해주는 파라미터이다.
실제 적용 시 비정상적인 부분이 있다면
아래와 같은 메세지가 뜨고 파일을 정상적으로 불러올 수 있게 된다.
chicago_df_1 = pd.read_csv('Chicago_Crimes_2005_to_2007.csv', error_bad_lines=False)
chicago_df_2 = pd.read_csv('Chicago_Crimes_2008_to_2011.csv', error_bad_lines=False)
chicago_df_3 = pd.read_csv('Chicago_Crimes_2012_to_2017.csv', error_bad_lines=False)
'머신러닝 > 머신러닝 할 때 꼭 짚고 넘어갈 것' 카테고리의 다른 글
Time Series 데이터를 처리할 때 사용하는 resample 함수의 사용법과,이 함수를 사용하기 위해 인덱스를 설정하는 방법 (0) | 2022.05.12 |
---|---|
DataFrame에서 문자열로 된 날짜 컬럼을 , datetime64로 변경하는 방법 / Pandas Series의 dt 속성 사용법 (0) | 2022.05.11 |
Pandas의 groupby 함수 사용법 (0) | 2022.05.11 |
WordCloud 에서 배경모양을 바꿔보자. (0) | 2022.05.10 |
Grid Serch 에 대해 알아보자. (0) | 2022.05.09 |
댓글