UnicodeDecodeError: 'utf-8' kodek ne more dekodirati bajta

Question

Več

Vir: Različica brez AMP Uredi

UnicodeDecodeError: 'utf-8' kodek ne more dekodirati bajta

Tukaj je moja koda,

for line in open('u.item'):
#read each line

vsakič, ko zaženem to kodo, se pojavi naslednja napaka:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte

Poskušal sem to rešiti in dodati dodaten parameter v open(), koda je videti takole;

for line in open('u.item', encoding='utf-8'):
#read each line

Vendar se spet pojavi ista napaka. Kaj naj potem storim! Prosim za pomoč.

desertnaut

Edited question Ndopoldan 24p3.7.20192tni 24trdopoldanni julij 2019 в 10:02

Programiranje

character-encoding python python-3.x

Ndopoldan 32p31.10.20133tni 32trdopoldanni oktober 2013 в 5:55

13 ogledi

Mark Ransom

Vir: Različica brez AMP Uredi

Vaša datoteka dejansko ne vsebuje podatkov v kodiranju utf-8, temveč neko drugo kodiranje. Ugotovite, katero je to kodiranje, in ga uporabite v klicu open.

V kodiranju Windows-1252 bi bil na primer 0xe9 znak é.

29

0

Komentarji (2)

user6832484

Vir: Različica brez AMP Uredi

Če jih kdo išče, je to primer za pretvorbo datoteke CSV v Pythonu 3:

try:
    inputReader = csv.reader(open(argv[1], encoding='ISO-8859-1'), delimiter=',',quotechar='"')
except IOError:
    pass

user812786

Edited answer Npopoldan 28p14.9.20162tni 28trpopoldanni september 2016 в 8:51

2

0

Komentarji (0)

SujitS · Accepted Answer · 2013-10-31T12:35:45+00:00

Rešitev

SujitS

Vir: Različica brez AMP Uredi

Kot je predlagal Mark Ransom, sem našel pravo kodiranje za to težavo. Kodiranje je bilo "ISO-8859-1", zato bo zamenjava open("u.item", encoding="utf-8") z open('u.item', encoding = "ISO-8859-1") rešila problem.

aryeh

Edited answer Ndopoldan 17p7.10.20152tni 17trdopoldanni oktober 2015 в 3:19

354

0

Komentarji (6)