Accès aux statistiques gouvernementales à partir d'aujourd'hui (31 octobre 2014) Il semble que l'API Web a été publiée. http://www.e-stat.go.jp/api/
Une liste des données disponibles se trouve à l'URL ci-dessous. Il y a beaucoup de recensement aux statistiques du travail. http://www.e-stat.go.jp/api/api-info/api-data/
Ça a l'air intéressant! Le disque que j'ai utilisé pour ça.
Tout d'abord, accédez à cette page et enregistrez-vous en tant qu'utilisateur. http://www.e-stat.go.jp/api/regist-login/ Entrez votre adresse e-mail et votre nom.
Une notification est arrivée à votre adresse e-mail, alors cliquez dessus pour l'activer.
Ensuite, connectez-vous. Obtenez l'ID de l'application. Il semble y avoir jusqu'à 3 pièces d'identité par personne. À partir de maintenant, l'ID de l'application sera xxx.
La procédure est la suivante.
#!/usr/bin/env python
#-*- coding: utf-8 -*-
import httplib2
import lxml.etree
import pylab
import matplotlib.font_manager as fm
#Réglage initial
h = httplib2.Http('.cache')
key = "xxx"
baseUrl = "http://api.e-stat.go.jp/rest/1.0/app"
statsCode = "00200521"
#Premières données pour le code des statistiques gouvernementales 00200521
# (Recensement de 1980)Récupérez l'ID de données de
print "getStatusList..."
cmd = "%s/getStatsList?appId=%s&statsCode=%s"
response, content = h.request(cmd % (baseUrl, key, statsCode))
xml = lxml.etree.fromstring(content)
dataid = xml.xpath('//LIST_INF')[0].attrib["id"]
#Extraire les données réelles en utilisant l'ID de données comme clé
print "getStatusData..."
cmd = "%s/getStatsData?appId=%s&statsDataId=%s"
response, content = h.request(cmd % (baseUrl, key, dataid))
xml = lxml.etree.fromstring(content)
#Extraction du nom de la catégorie
categories = {}
for c in xml.xpath("//CLASS_OBJ"):
categories[c.attrib["id"]] = {"name": c.attrib["name"],
"labels": {}}
print c.attrib["id"]
for label in c.xpath("CLASS"):
print label.attrib["name"], label.attrib["code"]
categories[c.attrib["id"]]["labels"][label.attrib["code"]] = label.attrib["name"]
#Extraire la valeur
values = [{"cat01": v.attrib["cat01"],
"cat02": v.attrib["cat02"],
"cat03": v.attrib["cat03"],
"area": v.attrib["area"],
"value": int(v.text)}
for v in xml.xpath('//VALUE')]
#Tranche d'âge(cat03)Agrégation par
c = categories["cat03"]
data = []
labels = []
for code in sorted(c["labels"].keys())[1:]:
labels.append(c["labels"][code])
data.append(sum([v["value"] for v in values if v["cat03"] == code]))
print data
#terrain
width = 0.5
x = pylab.arange(len(data))
prop = fm.FontProperties(fname='/Library/Fonts/Osaka.ttf') # for mac
pylab.barh(x, data, width)
pylab.yticks(x + width / 2, labels)
pylab.show()
Cliquez ici pour les résultats
Manuel officiel http://www.e-stat.go.jp/api/wp/wp-content/uploads/2014/10/API-spec.pdf
Interface pour toucher l'API du web http://www.e-stat.go.jp/api/sample/testform/