UnicodeDecodeError: 'utf8' codec kan't dekode byte 0xa5 i posisjon 0: ugyldig startbyte

Jeg bruker Python-2.6 CGI skript, men fant denne feilen i serverloggen mens jeg gjorde json.dumps(),

Traceback (most recent call last):
  File "/etc/mongodb/server/cgi-bin/getstats.py", line 135, in <module>
    print json.dumps(​​__get​data())
  File "/usr/lib/python2.7/json/__init__.py", line 231, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 201, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode
    return _iterencode(o, 0)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

Her ,

__getdata()-funksjonen returnerer ordbok {} .

Før jeg postet dette spørsmålet har jeg referert dette av spørsmål os SO.


OPPDATERINGER

Følgende linje skader JSON-koderen,

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

Jeg har en midlertidig løsning for det

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

Men jeg er ikke sikker på om det er riktig måte å gjøre det på.

Løsning

Feilen skyldes at det er et ikke-ascii-tegn i ordboken, og det kan ikke kodes/dekodes. En enkel måte å unngå denne feilen på er å kode slike strenger med encode()-funksjonen som følger (hvis a er strengen med ikke-ascii-tegn):

a.encode('utf-8').strip()
Kommentarer (2)

Angi standardkoder øverst i koden din

import sys
reload(sys)
sys.setdefaultencoding("ISO-8859-1")
Kommentarer (0)

Følgende linje gjør vondt JSON-koder,

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

Jeg har en midlertidig løsning på det

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

Markerer dette som riktig som en midlertidig løsning (Ikke sikker).

Kommentarer (0)