Grattage avec belle soupe sur ordinateur portable jupyter.
Dans [1] Importer une belle soupe
In[1]
from bs4 import BeautifulSoup
Dans [2] Stockez le html de l'article que vous souhaitez gratter dans la variable kiji
In[2]
kiji = """<html>
<head>
<title>Je l'ai posté sur Qiita</title>
</head>
<body>
<p class="title">
<b>Défiez Qiita pour la sortie.</b>
</p>
<p class="article">
<b>Je ferai de mon mieux pour écrire un article.</b>
</p>
</body>
</html>"""
Écrivez le code HTML que vous souhaitez stocker entre "" "et" "".
Dans [3] Chargez le code HTML stocké dans la variable kiji dans BeautifulSoup.
In[3]
soup = BeautifulSoup(kiji,"html.parser")
Écrivez BeautifulSoup (variable contenant le code HTML stocké, "l'analyseur (analyseur) que vous souhaitez utiliser"). Cette fois, c'est (kiji, "html.parser"). Veillez à ne pas oublier de placer l'analyseur dans "" ou d'écrire. Comme htmlparser.
Utilisez la soupe In [4] avec joliment pour le rendre plus facile à voir.
In[4]
print(soup.prettify())
En utilisant prettify (), il est superposé et facile à voir.
In [4] Résultat de sortie
In[4]
<html>
<head>
<title>
Je l'ai posté sur Qiita
</title>
</head>
<body>
<p class="title">
<b>
Défiez Qiita pour la sortie.
</b>
</p>
<p class="article">
<b>
Je ferai de mon mieux pour écrire un article.
</b>
</p>
</body>
</html>
Dans [5] Afficher le titre
In[5]
print(soup.html.head.title)
In[5]Résultat de sortie
<title>Je l'ai posté sur Qiita</title>
Recommended Posts