J'ai décidé de gratter pour une raison quelconque dans mon travail, alors j'ai essayé à la hâte de l'utiliser.
sc.py
import urllib.request
import bs4
url = 'http://www.XXXXXX.jp'
html = urllib.request.urlopen(url)
soup = bs4.BeautifulSoup(html, 'html.parser')
title = soup.select('.lxl-inCateList ul li a dl dt')
price = soup.find_all("dd", class_="l-price")
for i in title:
a = (i.string)
print (a)
for i in price:
b = (i.string)
print (b)
C'est une source qui n'a pas l'air belle,
a = (i.string)
Ce faisant, les balises HTML inutiles pourraient être supprimées.
soup.find_all("dd", class_="l-price")
C'est vraiment pratique de pouvoir aller voir des cours. J'aurais aimé savoir plus tôt ... Avec un besoin soudain, la tâche de «rassembler ceci et cela du site dans un document» devient aussitôt plus facile.
Recommended Posts