Statictics & Math & Data Science/파이썬 데이터 분석

[Pandas] read_csv 시 UnicodeDecode 에러 : utf-8 인코딩 문제

Taewon Heo 2020. 4. 23. 13:38

[Pandas] UnicodeDecode 에러 : utf-8 인코딩 문제

 

판다스로 read_csv를 사용해서 csv 파일을 읽을 때, 특정 문자열 때문에 에러가 발생하는 경우가 있다.

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 22: invalid start byte

이 에러를 해결하는 방법은 encoding='CP949'을 아래와 같이 추가해주는 것이다.

df = pd.read_csv("xxx.csv", encoding='CP949')