[Mémo] Comment utiliser BeautifulSoup4 (1) Afficher html

Grattage avec belle soupe sur ordinateur portable jupyter.

Dans [1] Importer une belle soupe

In[1]


from bs4 import BeautifulSoup

Dans [2] Stockez le html de l'article que vous souhaitez gratter dans la variable kiji

In[2]


kiji = """<html>
        <head>
           <title>Je l'ai posté sur Qiita</title>
        </head>
        <body>
           <p class="title">
              <b>Défiez Qiita pour la sortie.</b>
           </p>
        <p class="article">
              <b>Je ferai de mon mieux pour écrire un article.</b>
           </p>
        </body>
   </html>"""

Écrivez le code HTML que vous souhaitez stocker entre "" "et" "".

Dans [3] Chargez le code HTML stocké dans la variable kiji dans BeautifulSoup.

In[3]


soup = BeautifulSoup(kiji,"html.parser")

Écrivez BeautifulSoup (variable contenant le code HTML stocké, "l'analyseur (analyseur) que vous souhaitez utiliser"). Cette fois, c'est (kiji, "html.parser"). Veillez à ne pas oublier de placer l'analyseur dans "" ou d'écrire. Comme htmlparser.

Utilisez la soupe In [4] avec joliment pour le rendre plus facile à voir.

In[4]


print(soup.prettify())

En utilisant prettify (), il est superposé et facile à voir.

In [4] Résultat de sortie

In[4]


<html>
 <head>
  <title>
Je l'ai posté sur Qiita
  </title>
 </head>
 <body>
  <p class="title">
   <b>
Défiez Qiita pour la sortie.
   </b>
  </p>
  <p class="article">
   <b>
Je ferai de mon mieux pour écrire un article.
   </b>
  </p>
 </body>
</html>

Dans [5] Afficher le titre

In[5]


print(soup.html.head.title)

In[5]Résultat de sortie


<title>Je l'ai posté sur Qiita</title>

Recommended Posts

[Mémo] Comment utiliser BeautifulSoup4 (1) Afficher html
[Mémo] Comment utiliser BeautifulSoup4 (2) Afficher l'en-tête de l'article avec les demandes
[Mémo] Comment utiliser BeautifulSoup4 (3) Afficher l'en-tête de l'article avec class_
Comment utiliser cron (mémo personnel)
[Mémo] Comment utiliser Google MµG
Comment utiliser Python-shell
Remarques sur l'utilisation de tf.data
Comment utiliser virtualenv
Comment utiliser Seaboan
Comment utiliser le shogun
Comment utiliser Pandas 2
Comment utiliser Virtualenv
Comment utiliser numpy.vectorize
Comment utiliser pytest_report_header
Comment utiliser partiel
Comment utiliser Bio.Phylo
Comment utiliser SymPy
Comment utiliser x-means
Comment utiliser WikiExtractor.py
Comment utiliser IPython
Comment utiliser virtualenv
Comment utiliser Matplotlib
Comment utiliser iptables
Comment utiliser numpy
Comment utiliser TokyoTechFes2015
Comment utiliser venv
Comment utiliser le dictionnaire {}
Comment utiliser Pyenv
Comment utiliser la liste []
Comment utiliser python-kabusapi
Comment utiliser OptParse
Comment utiliser le retour
Comment utiliser pyenv-virtualenv
Comment utiliser imutils
Comment utiliser Qt Designer
Comment utiliser la recherche triée
[gensim] Comment utiliser Doc2Vec
python3: Comment utiliser la bouteille (2)
Remarques sur l'utilisation d'AIST Spacon ABCI
Comprendre comment utiliser django-filter
Comment utiliser le générateur
Remarques sur la façon d'utiliser lors de la combinaison de pandas.
[Python] Comment utiliser la liste 1
Comment utiliser FastAPI ③ OpenAPI
Comment utiliser Python Argparse
Comment utiliser IPython Notebook
Comment utiliser Pandas Rolling
[Note] Comment utiliser virtualenv
Comment utiliser les dictionnaires redis-py
Python: comment utiliser pydub
[Python] Comment utiliser checkio
[Aller] Comment utiliser "... (3 périodes)"
Comment faire fonctionner GeoIp2 de Django
[Python] Comment utiliser input ()
Comment utiliser le décorateur
[Introduction] Comment utiliser open3d
Comment utiliser Python lambda
Comment utiliser Jupyter Notebook