Installer avec pip install beautiful soup4
J'ai pensé qu'il serait correct d'utiliser l'analyseur par défaut, j'ai donc utilisé le paramètre par défaut html.parser
au lieu de lxml
.
import requests
from bs4 import BeautifulSoup
url = input()
html = requests.get(url)
soup = BeautifulSoup(html.content, "html.parser")
Fondamentalement, cela devrait être bien.
・ Recherche d'identifiant (un seul peut être recherché
soup.find (id =" id nom ")
・ Recherche par sélecteur CSS (un seul peut être recherché
ʻIng.select_one ("nom du sélecteur css") `
Lors de la recherche de tous les éléments correspondant à votre recherche
Si id
find_all (id nom)
avec sélecteur css
select (nom d'attribut .class)
Voir aussi: [Différences dans la façon d'utiliser find_all () et select () dans Beautiful Soup]
(https://gammasoft.jp/blog/difference-find-and-select-in-beautiful-soup-of-python/)
Utilisez select_one (.A.B)
pour rechercher des choses comme<h3 class = "A B">
(qui ont plusieurs attributs de classe).
Recommended Posts