[Pandas] UnicodeDecode 에러 : utf-8 인코딩 문제
판다스로 read_csv를 사용해서 csv 파일을 읽을 때, 특정 문자열 때문에 에러가 발생하는 경우가 있다.
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 22: invalid start byte
이 에러를 해결하는 방법은 encoding='CP949'을 아래와 같이 추가해주는 것이다.
df = pd.read_csv("xxx.csv", encoding='CP949')
'Statictics & Math & Data Science > 파이썬 데이터 분석' 카테고리의 다른 글
[LightGBM] LGBM는 어떻게 사용할까? (설치,파라미터튜닝) (0) | 2020.01.27 |
---|---|
[Regression] Ridge and Lasso Regression in Python (3) - Lasso (0) | 2019.01.31 |
[Regression] Ridge and Lasso Regression in Python (2) - Ridge (0) | 2019.01.31 |
[Regression] Ridge and Lasso Regression in Python (1) - Polynomial (0) | 2019.01.31 |
[Regression] Piecewise Regression with numpy (0) | 2019.01.29 |