Dlaczego Python nie potrafi przetworzyć danych JSON?

Mam ten JSON w pliku:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [
        "id": "valore"
    ],
    "om_points": "value",
    "parameters": [
        "id": "valore"
    ]
}

Napisałem ten skrypt, aby wydrukować wszystkie dane JSON:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Ten program podnosi jednak wyjątek:

Traceback (most recent call last):
  File "<pyshell#1>", line 5, in <module>
    data = json.load(f)
  File "/usr/lib/python3.5/json/__init__.py", line 319, in loads
    return _default_decoder.decode(s)
  File "/usr/lib/python3.5/json/decoder.py", line 339, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib/python3.5/json/decoder.py", line 355, in raw_decode
    obj, end = self.scan_once(s, idx)
json.decoder.JSONDecodeError: Expecting ',' delimiter: line 13 column 13 (char 213)

Jak mogę sparsować JSON i wyodrębnić jego wartości?

Rozwiązanie

Twoje dane nie są w poprawnym formacie JSON. Masz [] kiedy powinieneś mieć {}:

  • [] są dla tablic JSON, które w Pythonie nazywają się list.
  • {} są dla obiektów JSON, które są nazywane dict w Pythonie

Oto jak powinien wyglądać Twój plik JSON:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": {
        "id": "valore"
    },
    "om_points": "value",
    "parameters": {
        "id": "valore"
    }
}

Następnie możesz użyć swojego kodu:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Z danymi, możesz teraz również znaleźć wartości, takie jak:

data["maps"][0]["id"]
data["masks"]["id"]
data["om_points"]

Wypróbuj je i zobacz, czy zaczyna to mieć sens.

Komentarze (14)

Twoje data.json powinno wyglądać tak jak poniżej:

{
 "maps":[
         {"id":"blabla","iscategorical":"0"},
         {"id":"blabla","iscategorical":"0"}
        ],
"masks":
         {"id":"valore"},
"om_points":"value",
"parameters":
         {"id":"valore"}
}

Twój kod powinien być:

import json
from pprint import pprint

with open('data.json') as data_file:    
    data = json.load(data_file)
pprint(data)

Zauważ, że to działa tylko w Pythonie 2.6 i wyżej, ponieważ zależy to od with-statement. W Pythonie 2.5 użyj from __future__ import with_statement, w Pythonie

Komentarze (7)
data = []
with codecs.open('d:\output.txt','rU','utf-8') as f:
    for line in f:
       data.append(json.loads(line))
Komentarze (5)