Installer avec pip install beautiful soup4
J'ai pensé qu'il serait correct d'utiliser l'analyseur par défaut, j'ai donc utilisé le paramètre par défaut html.parser au lieu de lxml.
import requests
from bs4 import BeautifulSoup
url = input()
html = requests.get(url)
soup = BeautifulSoup(html.content, "html.parser")
Fondamentalement, cela devrait être bien.
・ Recherche d'identifiant (un seul peut être recherché
soup.find (id =" id nom ")
・ Recherche par sélecteur CSS (un seul peut être recherché
ʻIng.select_one ("nom du sélecteur css") `
Lors de la recherche de tous les éléments correspondant à votre recherche
Si id
find_all (id nom)
avec sélecteur css
select (nom d'attribut .class)
Voir aussi: [Différences dans la façon d'utiliser find_all () et select () dans Beautiful Soup]
(https://gammasoft.jp/blog/difference-find-and-select-in-beautiful-soup-of-python/)
Utilisez select_one (.A.B) pour rechercher des choses comme<h3 class = "A B">(qui ont plusieurs attributs de classe).
Recommended Posts