Je suis ** Shun ** étudiant la programmation. Récemment, je me suis intéressé à Python, j'ai donc lu "** Comprendre Python ". Ce livre vous apprendra la syntaxe de base de Python et comment faire du web scraping. [ Un livre Python que vous pouvez comprendre couramment **] (https://www.amazon.co.jp/%E3%82%B9%E3%83%A9%E3%82%B9%E3%83%A9%E3%82%8F%E3%81%8B%E3%82%8BPython-%E5%B2%A9%E5%B4%8E-%E5%9C%AD/dp/4798151092/ref=asc_df_4798151092/?tag=jpgo-22&linkCode=df0&hvadid=295686767484&hvpos=1o1&hvnetw=g&hvrand=17010285472902510266&hvpone=&hvptwo=&hvqmt=&hvdev=c&hvdvcmdl=&hvlocint=&hvlocphy=1009343&hvtargid=pla-526272651553&psc=1&th=1&psc=1/)
En termes simples, c'est une technologie qui extrait les informations que vous souhaitez sur un site Web.
Maintenant que j'ai appris le scraping Web, je vais l'essayer. Le site de grattage cette fois est le site officiel de Bandoli (https://bang-dream.com/) Pourquoi avez-vous essayé ce site? .. .. Je voulais l'image ci-dessous.
J'ai créé un dossier appelé Qiita avec VScode. Je voudrais l'enregistrer dans ce dossier appelé Qiita. Ouvrez ensuite une invite de commande et exécutez la commande suivante. L'installation va démarrer.
$ > pip install requests --user
$ > pip install BeautifulSoup4 --user
Une fois l'installation terminée, j'aimerais ouvrir un terminal et vérifier si l'installation a réussi.
$ >>> import requests
>>>
$ >>> from bs4 import BeautifulSoup
>>>
Si aucun message ne s'affiche à ce stade, l'installation est réussie. Si vous obtenez le message d'erreur suivant ici, l'installation a échoué. Dans un tel cas, vérifiez si l'ordinateur est connecté à Internet et réinstallez-le avec la commande pip.
$ >>> import requests
Traceback (most recent call last ) :
File "<stdin>" , line 1 , in <module>
ModuleNotFoundError : No module named " requests "
>>>
J'ai enregistré le contenu suivant dans le dossier Qiita sous le nom Qiita01.py. Un commentaire est également publié.
Qiita01.py
import requests
from bs4 import BeautifulSoup
result = requests.get("https://bang-dream.com/")
soup = BeautifulSoup(result.text, "html.parser")
img = soup.find_all('img')
print(img)
import requests
Déclaration d'utilisation de la bibliothèque de requêtes
from bs4 import beautifulsoup
Importer une bibliothèque externe beautifulsoup
result = requests.get("https://bang-dream.com/")Saisissez l'URL que vous souhaitez récupérer ici
#### **` soup = BeautifulSoup(result.text, "html.parser")Spécifiez la chaîne de caractères que vous souhaitez analyser pour le traitement BeautifulSoup et le type de traitement à analyser réellement`**
img = soup.find_all('img')dans la méthode find[img]Spécifiez le caractère
|Mesot|une fonction|
|:--------|------|
| find_all() |Recherche la balise spécifiée dans le devis et renvoie une liste contenant toutes les correspondances|
``` print(img) ```production
### Résultat de sortie
![キャプチャ03_LI.jpg](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/541905/797a1cf9-34e4-e62a-2cba-6396c4dedbed.jpeg)
Si vous le regardez dans le terminal, vous verrez quelque chose comme ça. Ouvrons le lien dessiné par la ligne rouge. Si vous voyez l'image suivante, le grattage est réussi.
![579de894-5bc4-4371-a0a0-da781af22bfa.jpg](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/541905/68492ed6-94b2-a5ca-f52b-055d71f3eef5.jpeg)
## Impressions
Pourquoi avez-vous écrit un article rudimentaire? ?? Certaines personnes peuvent penser cela. La réponse est simple, je n'ai eu que de nombreux articles ... Je veux approfondir Python davantage.