Waarom kan Python deze JSON data niet parsen?

Ik heb deze JSON in een bestand:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [
        "id": "valore"
    ],
    "om_points": "value",
    "parameters": [
        "id": "valore"
    ]
}

Ik heb dit script geschreven om alle JSON data af te drukken:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Dit programma maakt echter een uitzondering:

Traceback (most recent call last):
  File "<pyshell#1>", line 5, in <module>
    data = json.load(f)
  File "/usr/lib/python3.5/json/__init__.py", line 319, in loads
    return _default_decoder.decode(s)
  File "/usr/lib/python3.5/json/decoder.py", line 339, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib/python3.5/json/decoder.py", line 355, in raw_decode
    obj, end = self.scan_once(s, idx)
json.decoder.JSONDecodeError: Expecting ',' delimiter: line 13 column 13 (char 213)

Hoe kan ik de JSON ontleden en de waarden extraheren?

Oplossing

Uw gegevens zijn geen geldig JSON formaat. U heeft [] terwijl u {} zou moeten hebben:

  • [] zijn voor JSON arrays, die list worden genoemd in Python
  • {} zijn voor JSON objecten, die dict heten in Python

Hier's hoe je JSON bestand eruit zou moeten zien:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": {
        "id": "valore"
    },
    "om_points": "value",
    "parameters": {
        "id": "valore"
    }
}

Dan kunt u uw code gebruiken:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Met data, kan je nu ook waarden vinden zoals dit:

data["maps"][0]["id"]
data["masks"]["id"]
data["om_points"]

Probeer die eens uit en kijk of het zin begint te krijgen.

Commentaren (14)

Je data.json zou er zo uit moeten zien:

{
 "maps":[
         {"id":"blabla","iscategorical":"0"},
         {"id":"blabla","iscategorical":"0"}
        ],
"masks":
         {"id":"valore"},
"om_points":"value",
"parameters":
         {"id":"valore"}
}

Uw code moet zijn:

import json
from pprint import pprint

with open('data.json') as data_file:    
    data = json.load(data_file)
pprint(data)

Merk op dat dit alleen werkt in Python 2.6 en hoger, omdat het afhankelijk is van het with-statement. In Python 2.5 gebruik je from __future__ import with_statement, in Python

Commentaren (7)
data = []
with codecs.open('d:\output.txt','rU','utf-8') as f:
    for line in f:
       data.append(json.loads(line))
Commentaren (5)