UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

Χρησιμοποιώ σενάρια "Python-2.6 CGI", αλλά βρήκα αυτό το σφάλμα στο αρχείο καταγραφής του διακομιστή ενώ κάνω "json.dumps()`",

Traceback (most recent call last):
  File "/etc/mongodb/server/cgi-bin/getstats.py", line 135, in <module>
    print json.dumps(​​__get​data())
  File "/usr/lib/python2.7/json/__init__.py", line 231, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 201, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode
    return _iterencode(o, 0)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

Εδώ ,

Η συνάρτηση __getdata() επιστρέφει λεξικό {} .

Πριν από τη δημοσίευση αυτής της ερώτησης έχω αναφερθεί αυτό της ερώτησης os SO.


ΕΝΗΜΕΡΩΣΕΙΣ

Η ακόλουθη γραμμή βλάπτει τον κωδικοποιητή JSON,

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

Βρήκα μια προσωρινή λύση για αυτό

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

Αλλά δεν είμαι σίγουρος αν είναι ο σωστός τρόπος για να το κάνω.

Λύση

Το σφάλμα οφείλεται στο γεγονός ότι υπάρχει κάποιος χαρακτήρας μη-ascii στο λεξικό και δεν μπορεί να κωδικοποιηθεί/αποκωδικοποιηθεί. Ένας απλός τρόπος για να αποφύγετε αυτό το σφάλμα είναι να κωδικοποιήσετε τέτοιες συμβολοσειρές με τη συνάρτηση encode() ως εξής (αν a είναι η συμβολοσειρά με μη-ascii χαρακτήρα):

a.encode('utf-8').strip()
Σχόλια (2)

Ορίστε τον προεπιλεγμένο κωδικοποιητή στην αρχή του κώδικά σας

import sys
reload(sys)
sys.setdefaultencoding("ISO-8859-1")
Σχόλια (0)

Η ακόλουθη γραμμή βλάπτει τον κωδικοποιητή JSON,

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

Βρήκα μια προσωρινή λύση για αυτό

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

Σημειώνοντας αυτό ως σωστό ως προσωρινή διόρθωση (Δεν είμαι σίγουρος γι' αυτό).

Σχόλια (0)