Pour le moment, la série continue. Je prévois de continuer à écrire l'analyse des données acquises à l'avenir. (des plans)
$ python yahoo_news_rss.py
alors,
Yahoo!Sujets d'actualité-Haut
http://dailynews.yahoo.co.jp/fc/world/nuclear_weapons/?id=6160968
Le document de rupture du TNP n'a pas pu être adopté et clos
http://dailynews.yahoo.co.jp/fc/domestic/injury_case/?id=6160975
4 hommes morts et blessés arrêtés
http://dailynews.yahoo.co.jp/fc/economy/coffee_chain/?id=6160962
Plus d'un millier de personnes au Starba Tottori Open
http://dailynews.yahoo.co.jp/fc/economy/apparel/?id=6160961
Barbary va bien, mettant fin au contrat en juin
http://dailynews.yahoo.co.jp/fc/science/life_on_earth/?id=6160969
Le concept de «zéro» est-il reconnu par les singes?
http://dailynews.yahoo.co.jp/fc/sports/prowrestling/?id=6160973
Première chirurgie d'urgence au masque de tigre
http://dailynews.yahoo.co.jp/fc/entertainment/broad_casting/?id=6160945
Répulsion de diffuser en direct Yuko Ando confus
http://dailynews.yahoo.co.jp/fc/domestic/obituary/?id=6160936
Mort de l'idole de la lutte contre la maladie, Maruyama
Je vais vous expliquer comment utiliser facilement RSS jusqu'au point où il apparaît.
RSS est un terme général désignant plusieurs formats de documents permettant de compiler et de diffuser facilement des mises à jour sur divers sites Web tels que les actualités et les blogs.
De wiki. En d'autres termes, il est difficile de faire du vrai grattage, mais on a l'impression qu'il est facile à assembler pour l'acquisition d'informations.
Utilisez feedparser pour analyser les flux RSS.
Alors, installez l'analyseur de flux [this](http: // otiai10.hatenablog.com/entry/2012/05/04/180950)が参考になった。
Comme vous pouvez le voir en vous référant à Documentation, maintenons les deux touches suivantes.
entries
A list of dictionaries. Each dictionary contains data from a different entry. Entries are listed in the order in which they appear in the original feed.
feed
A dictionary of data about the feed.
Pour les clés internes de chacun, reportez-vous à la Documentation pour une liste.
yahoo fournit RSS à [Comme ça](http://headlines.yahoo.co.jp/rss/list http://headlines.yahoo.co.jp/rss/list). Alors, voici comment analyser le XML retourné en frappant cette URL dans un dictionnaire.
yahoo_news_rss.py
import feedparser
RSS_URL = "http://rss.dailynews.yahoo.co.jp/fc/rss.xml"
yahoo_news_dic = feedparser.parse(RSS_URL)
La nouvelle est maintenant dans le dictionnaire. Consultez la documentation de feedparser pour voir quelle est la structure.
Donc, ci-dessous est où le titre complet et le titre et le lien de chaque article sont affichés.
yahoo_news_rss.py
print yahoo_news_dic.feed.title
for entry in yahoo_news_dic.entries:
title = entry.title
link = entry.link
print link
print title
Et comme c'était au début
Yahoo!Sujets d'actualité-Haut
http://dailynews.yahoo.co.jp/fc/world/nuclear_weapons/?id=6160968
Le document de rupture du TNP n'a pas pu être adopté et clos
http://dailynews.yahoo.co.jp/fc/domestic/injury_case/?id=6160975
4 hommes morts et blessés arrêtés
http://dailynews.yahoo.co.jp/fc/economy/coffee_chain/?id=6160962
Plus d'un millier de personnes au Starba Tottori Open
http://dailynews.yahoo.co.jp/fc/economy/apparel/?id=6160961
Barbary va bien, mettant fin au contrat en juin
http://dailynews.yahoo.co.jp/fc/science/life_on_earth/?id=6160969
Le concept de «zéro» est-il reconnu par les singes?
http://dailynews.yahoo.co.jp/fc/sports/prowrestling/?id=6160973
Première chirurgie d'urgence au masque de tigre
http://dailynews.yahoo.co.jp/fc/entertainment/broad_casting/?id=6160945
Répulsion de diffuser en direct Yuko Ando confus
http://dailynews.yahoo.co.jp/fc/domestic/obituary/?id=6160936
Mort de l'idole de la lutte contre la maladie, Maruyama
Cela sort avec un sentiment.
Comme mentionné ci-dessus, le code source est également ici.
Recommended Posts