Le deuxième jour après avoir commencé à apprendre Python par moi-même, j'ai essayé le simple grattage WEB. Je l'ai fait en référence à certains sites. Postez-le pour des notes personnelles. Cette fois ** · Titre ** ** ・ h2 ** Extrayez deux éléments.
-Installer le module de requêtes
commander
pip install requests
-Installez le module Beautiful Soup
commander
pip install beautifulsoup4
code
import requests
from bs4 import BeautifulSoup
#URL que vous souhaitez obtenir
url = "*********"
#Obtenez du HTML en envoyant une requête HTTP avec une URL comme argument
response = requests.get(url)
#Le code de caractère est automatiquement codé
response.encoding = response.apparent_encoding
#Analyse HTML
bs = BeautifulSoup(response.text, 'html.parser')
#Extrait du titre
title_tag = bs.find('title')
print(title_tag.text)
#Extraire l'élément h2
h2_tags = bs.select('h2')
for h2_tag in h2_tags:
print(h2_tag.text)
・ Travaillez toujours à côté de l'informatique
Recommended Posts