Comment obtenir des données à partir d'une page Web Ici
Utilisez le module re de la bibliothèque standard. Document officiel
import re
from html import unescape
from urllib.parse import urljoin
#Obtenir des données html à partir de la page Web
for partial_html in re.findall(Expressions régulières):
#Obtenez des informations spécifiques avec une expression régulière à partir des informations acquises
#Dans l'expression régulière, re.search()faire
Python pine pour libxml2 et libxslt, des bibliothèques bien connues pour le traitement XML écrites en langage C. Document officiel
import lxml.html
a =Lire le fichier html
html = a.getroot()
#Convertissez tous les éléments en attributs href en URL absolues en fonction de l'URL de l'argument
html.make_link_absolute(URL)
for b in html.cssselect(Spécifiez l'élément avec le sélecteur CSS):
#Obtenir l'élément
Recommended Posts