UnicodeDecodeError: 'utf-8' codec bayt kodunu çözemiyor

Question

Daha

Kaynak Non AMP-version Düzenle

UnicodeDecodeError: 'utf-8' codec bayt kodunu çözemiyor

İşte benim kodum,

for line in open('u.item'):
#read each line

bu kodu her çalıştırdığımda aşağıdaki hatayı veriyor:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte

Bunu çözmeye çalıştım ve open() işlevine fazladan bir parametre ekledim, kod şöyle görünüyor;

for line in open('u.item', encoding='utf-8'):
#read each line

Ancak yine aynı hatayı veriyor. O zaman ne yapmalıyım! Lütfen yardım edin.

desertnaut

Edited question 2019ööp2öö10 Temmuz 2019 в 10:02

Programlama

character-encoding python python-3.x

2013ööp55öö5 Ekim 2013 в 5:55

30 görünümler

Mark Ransom

Kaynak Non AMP-version Düzenle

Dosyanız aslında utf-8 kodlu veri içermiyor, başka bir kodlama içeriyor. Bu kodlamanın ne olduğunu bulun ve open çağrısında bunu kullanın.

Örneğin Windows-1252 kodlamasında 0xe9, é karakteri olacaktır.

29

0

Yorumlar (2)

user6832484

Kaynak Non AMP-version Düzenle

Bunları arayan biri varsa, bu Python 3'te bir CSV dosyasını dönüştürmek için bir örnektir:

try:
    inputReader = csv.reader(open(argv[1], encoding='ISO-8859-1'), delimiter=',',quotechar='"')
except IOError:
    pass

user812786

Edited answer 2016ösp51ös20 Eylül 2016 в 8:51

2

0

Yorumlar (0)

SujitS · Accepted Answer · 2013-10-31T12:35:45+00:00

Çözüm

SujitS

Kaynak Non AMP-version Düzenle

Mark Ransom tarafından önerildiği gibi, bu sorun için doğru kodlamayı buldum. Kodlama "ISO-8859-1" idi, bu nedenle open("u.item", encoding="utf-8") yerine open('u.item', encoding = "ISO-8859-1") yazmak sorunu çözecektir.

aryeh

Edited answer 2015ööp19öö3 Ekim 2015 в 3:19

354

0

Yorumlar (6)