Est-ce hier ou avant-hier? Il y a eu un grand tremblement de terre. Je viens de vivre le deuxième tremblement de terre. À cause de cela, j'ai parcouru le site Web de l'Agence météorologique en tremblant, mais je n'ai rien écrit de particulier. Je me demande s'il était occupé. Il a été publié quelques minutes après la fin du tremblement de terre.
Maintenant, prenons le bulletin de tremblement de terre de l'Agence météorologique comme une histoire. Cependant, tout le monde peut facilement le voir sur le site Web de l'Agence météorologique. Lien
Le programme récupère l'historique avec la fonction get, puis le chemin de l'argument (patch du fichier d'écriture) Écrivez le résultat dans.
Si vous l'exécutez tel quel, une erreur se produira ou un fichier appelé info.text sera créé et écrit sur le bureau.
L'environnement d'exploitation est Python 2.7 OSX 10.10.5
La bibliothèque est ・ Urllib2 (acquisition HTML) ・ Belle soupe4 (grattage) En utilisant, J'ai converti le code de caractère en utf-8. (Contrôle de fonctionnement uniquement pour OSX)
#coding: utf-8
def get(path):
import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen("http://www.jma.go.jp/jp/quake/quake_sindo_index.html"), "lxml")
infotable = soup.find_all("div", attrs={"id": "info", "class": "infotable"})
body = [i.text.encode("utf-8") for i in infotable]
with open(path, "w") as f:
f.write("".join(body))
if __name__ == "__main__":
path = "desktop/info.text"
get(path)
Recommended Posts