Essayez Python qui vous intéressait. L'environnement est Windows 10.
Anaconda3 Distribution Python. Vous pouvez DL avec Python seul, mais si vous regardez un peu Anaconda3, qui contient déjà des bibliothèques fréquemment utilisées, semble être meilleur, donc je vais le mettre ici. J'ai téléchargé le programme d'installation graphique 64 bits suivant (466 Mo) et l'ai installé par défaut. https://www.anaconda.com/products/individual
Après l'installation, ajoutez l'emplacement du fichier binaire aux variables d'environnement. C:\Users\xxxxxx\anaconda3
VS code Recherchez par code VS et téléchargez. Après l'installation, ajoutez ce qui suit à partir de l'extension dans le menu de gauche.
Si vous pouvez afficher la version en tapant la commande suivante à partir de l'invite de commande, le paramètre d'environnement est terminé.
python
C:\Users\xxxxxx> python -V
Python 3.8.3
Créez un répertoire de test et créez-y un fichier de type "test.py".
test.py
print("test!!")
Sélectionnez "Terminal" dans View pour afficher le terminal. Puisque PowerShell démarre dans le répertoire du fichier py ouvert, exécutez la commande suivante. Ensuite, "test !!" s'affiche.
powershell
PS C:\Users\xxxxx\workspace\test> python test.py
test!!
Essayez de gratter. Beautiful Soup semble être utile. ** Assurez-vous de vérifier le fichier robots.txt et les conditions d'utilisation pour voir si cela est autorisé avant de gratter! !! ** **
test.py
import requests
import pandas as pd
from bs4 import BeautifulSoup
#URL à gratter
url = 'xxxxxxxx'
response = requests.get(url)
response.encoding = response.apparent_encoding
#Convertir en objet BeautifulSoup
bs = BeautifulSoup(response.text, 'html.parser')
#Récupère la balise h2 avec class123 spécifié dans l'attribut class
tags = bs.find_all('h2', attrs={'class': 'class123'})
for tag in tags:
print(tag,end='\n')
Si vous obtenez une erreur du type "numpy not found", le chemin est manquant. Ajoutez le répertoire de bibliothèque suivant à la variable d'environnement et redémarrez VScode. C:\Users\xxxxx\anaconda3\Library\bin
Le grattage était beaucoup plus facile que Javascript.
Recommended Posts