La dernière fois, nous avons utilisé find_all pour afficher les en-têtes, mais cette fois, nous utilisons class_ pour afficher les en-têtes. De plus, Yahoo! J'ai décidé de gratter le Japon.
Dans [1] Importer de belles soupes et demandes
In[1]
from bs4 import BeautifulSoup
import requests
Dans [2] requêtes sur Yahoo! Obtenez l'URL du Japon et affichez le texte
In[2]
toget_url =requests.get("https://www.yahoo.co.jp/")
toget_url.text
In [3] Analysé avec Beautiful Soup et html.parser
In[3]
soup = BeautifulSoup(toget_url.text,"html.parser")
Jusqu'à présent, c'est la même chose que la dernière fois sauf que les variables et l'URL ont été modifiées.
Recherche par find_all basée sur In [4] class_ =
In[4]
heading =soup.find_all(class_="TRuzXRRZHRqbqgLUCCco9")
Yahoo! Avec des outils de développement! Lorsque j'ai vérifié la rubrique Japon, j'ai trouvé que "TRuzXRRZHRqbqgLUCCco9" était utilisé dans la rubrique. N'oubliez pas _ (trait de soulignement) lors de la recherche par classe_.
Tourner avec In [5] pour que l'instruction affiche le contenu
In[5]
for heading_name in heading:
print(heading_name)
L'en-tête peut maintenant être affiché.
Recommended Posts