레이블이 UnicodeDecode인 게시물을 표시합니다. 모든 게시물 표시
레이블이 UnicodeDecode인 게시물을 표시합니다. 모든 게시물 표시

2020년 7월 9일 목요일

[파이썬] 파일 읽기 에러

파이썬을 이용한 읽기를 진행하고 있다.
여기서 아래와 같은 에러코드를 만났다.

UnicodeDecodeError: 'cp949' codec can't decode byte 0xec in position 35: illegal multibyte sequence

내용적으로 보았을 때
cp949 코덱
UnicodeDecode 를 할수 없다는 이야기다.

기본적으로 파이썬은
ANSI를 사용하는데
'UTF-8' / 'UTF-16' / 'EUC-KR' 를 기본으로 사용하지 않는다.

따라서 화일을 사용할때
정의해주어야 한다.

file = open('email.html', 'r')


을 으로

file = open('email.html', 'r', encoding='UTF-8')

정의해주어야 한다.