UnicodeDecodeError: 'utf-8' コーデックはバイトをデコードできません。

Question

さらに

ソース非AMP版編集

UnicodeDecodeError: 'utf-8' コーデックはバイトをデコードできません。

以下は私のコードです、

for line in open('u.item'):
#read each line

このコードを実行すると、必ず次のようなエラーが出ます：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte

これを解決するために、open()に追加のパラメータを追加しようとしたところ、コードは次のようになりました；

for line in open('u.item', encoding='utf-8'):
#read each line

しかし、また同じエラーが出ます。どうしたらいいのでしょうか！助けてください。

desertnaut

編集された質問 3日 7月 2019 в 10:02

プログラミング

character-encoding python python-3.x

31日 10月 2013 в 5:55

18 ビュー

質問へのコメント (4)

Ryoji Kuwae Neto

ソース非AMP版編集

ISO 8859-1は、主に音声認識APIを使用している場合、大幅に節約できます。

例:

file = open('../Resources/' + filename, 'r', encoding="ISO-8859-1");

44

0

解説 (2)

Mark Ransom

ソース非AMP版編集

あなたのファイルは実際にはutf-8でエンコードされたデータではなく、他のエンコーディングが含まれています。そのエンコーディングが何であるかを調べ、openコールでそれを使用します。

例えばWindows-1252のエンコーディングでは、0xe9はéという文字になります。

29

0

解説 (2)

Shashank

ソース非AMP版編集

これを試して、パンダを使用して読んでください。

pd.read_csv('u.item', sep='|', names=m_cols , encoding='latin-1')

21

0

解説 (1)

Jeril

ソース非AMP版編集

Python 2を使用している場合、次の解決策があります。

import io
for line in io.open("u.item", encoding="ISO-8859-1"):
    # do something

encodingパラメータは open()では機能しないため、次のエラーが発生します。

。
TypeError: 'encoding'は、この関数の無効なキーワード引数です。
< / pre>。

11

0

解説 (4)

Ozcar Nguyen

ソース非AMP版編集

次の問題を解決できます。 。 open(your_file_path、 'rb')の行の場合: 。 'rb'はバイナリモードでファイルを読み取っています。続きを読むここ。これが役立つことを願っています。!

6

0

解説 (1)

user6832484

ソース非AMP版編集

もしこれらを探している人がいたら、これはPython 3でCSVファイルを変換するための例です：

try:
    inputReader = csv.reader(open(argv[1], encoding='ISO-8859-1'), delimiter=',',quotechar='"')
except IOError:
    pass

user812786

編集した答え 14日 9月 2016 в 8:51

2

0

解説 (0)

xtluo

ソース非AMP版編集

時々「filepath」が実際にファイルではない「open(filepath)」の場合、同じエラーが発生するため、最初に開こうとしているファイルが存在することを確認します。

import os
assert os.path.isfile(filepath)

これが役立つことを願っています。

2

0

解説 (0)

SujitS · Accepted Answer · 2013-10-31T12:35:45+00:00

ソリューション

SujitS

ソース非AMP版編集

Mark Ransomの提案により、その問題に適したエンコーディングを見つけました。そのエンコーディングは "ISO-8859-1" でしたので、open("u.item", encoding="utf-8") を open('u.item', encoding = "ISO-8859-1") に置換すれば問題は解決します。

aryeh

編集した答え 7日 10月 2015 в 3:19

354

0

解説 (6)