Scraping avec Selenium en Python (Basic)

J'ai décidé d'étudier le grattage et j'ai essayé d'utiliser le navigateur avec Selenium, je vais donc le résumer brièvement.

Ce qui a été utilisé

Préparez un pilote pour votre navigateur

Pour faire fonctionner le navigateur, il est nécessaire de préparer un pilote pour chaque navigateur. Puisque nous utilisons Chrome cette fois, téléchargez ChromeDriver depuis le Site officiel.

Installez Selenium

Installez le sélénium avec pip

pip install selenium

Essayez d'ouvrir la page Web

Navigateur ouvert

webdriver.Chrome(driver_path)



 Ouvrir la page Web

#### **`driver.get(URL)`**
```get(URL)


 Fermer la page Web

#### **`driver.close()`**
```close()


 Quittez le navigateur (fermez toutes les fenêtres)

#### **`driver.quit()`**
```quit()


``` python
from selenium import webdriver
driver = webdriver.Chrome(driver_path)
driver.get(URL)
driver.close()
driver.quit()

Essayez d'accéder à l'élément

Pour accéder à l'élément HTML, vous pouvez spécifier l'élément à partir de l'identifiant, de la classe, du nom, etc. et l'obtenir.

Référence

Obtenir par identifiant

driver.find_element_by_id('ID')



 Obtenir par classe

#### **`driver.find_element_by_class_name('CLASS_NAME')`**
```find_element_by_class_name('CLASS_NAME')


 Obtenir par nom

#### **`driver.find_element_by_name('NAME')`**
```find_element_by_name('NAME')


 Obtenir avec le texte du lien

#### **`driver.find_elements_by_link_text('LINK_TEXT')`**
```find_elements_by_link_text('LINK_TEXT')


 Obtenez des éléments imbriqués en spécifiant le chemin

#### **`driver.find_elements_by_xpath(".//a")`**

action

Utilisez la page Web en agissant sur l'élément acquis.

Référence

Cliquez sur le bouton

driver.find_element_by_id('Btn').click()



 Entrez des caractères dans le formulaire

#### **` driver.find_element_by_name('From').send_keys("text") `**

Etre prêt

Souvent, le processus s'exécute et une erreur se produit avant la fin du chargement de l'écran. Vous pouvez attendre quelques secondes que les éléments nécessaires pour gérer cela.

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

WebDriverWait(driver, WAIT_SECOND).until(EC.presence_of_element_located((By.CLASS_NAME, 'Btn')))

Fonctionnement du navigateur

Fonctionnons légèrement sur la base de ce qui précède.

Essayez de cliquer sur le bouton

Par exemple, si vous souhaitez appuyer sur le bouton d'achat sur un certain site

<Écran> スクリーンショット_2016-11-21_13_22_52.png

スクリーンショット_2016-11-21_13_27_44.png
from selenium import webdriver
driver = webdriver.Chrome(driver_path)
driver.get(URL)
driver.find_element_by_class_name('new_addToCart').click()
driver.quit()

Comme ça, find_element_by_class_name () récupère l'élément et click () provoque l'action de clic.

Essayez de saisir du texte

Entrez un mot-clé de recherche dans la zone de recherche et appuyez sur le bouton de recherche.

<Écran> スクリーンショット_2016-11-21_13_49_25.png

スクリーンショット_2016-11-21_13_48_53.png
from selenium import webdriver
driver = webdriver.Chrome(driver_path)
driver.get(URL)
driver.find_element_by_id('searchWords').send_keys("search text")
driver.find_element_by_id('searchBtn').click()	

Cela entrera automatiquement "texte de recherche" dans la zone de recherche et recherche.

Résumé

Si vous apprenez les opérations de base telles que la pression des boutons et la saisie de texte, vous aurez l'impression que la plupart des opérations sont faciles. Après tout, l'avantage de pouvoir effectuer un traitement parallèle est excellent en effectuant des opérations de navigateur par programme. Cependant, si vous lancez beaucoup de navigateurs, votre PC deviendra extrêmement lourd, vous devez donc faire attention à cela.

Recommended Posts

Scraping avec Selenium en Python (Basic)
Grattage au sélénium en Python
Grattage avec du sélénium en Python
Grattage avec du sélénium [Python]
Grattage avec Selenium + Python Partie 1
Grattage avec chromedriver en python
Grattage avec Tor en Python
Grattage avec Selenium + Python Partie 2
Grattage au sélénium
Grattage au sélénium ~ 2 ~
Grattage avec Python
Grattage avec Python
Grattage avec Python, Selenium et Chromedriver
Grattage avec du sélénium
J'étais accro au grattage avec Selenium (+ Python) en 2020
Pratiquer le web scraping avec Python et Selenium
Grattage réussi avec Selenium
Grattage en Python (préparation)
Essayez de gratter avec Python.
Tri de base en Python
Grattage avec Python + PhantomJS
ScreenShot avec Selenium (édition Python)
Scraping avec Python + PyQuery
Scraping RSS avec Python
Connectez-vous à Yahoo Business avec Selenium Python
Réalisez le scraping avec le sélecteur Python et CSS en 1 minute
Envoyer HTTP avec l'en-tête d'authentification de base en Python
Écrivez un "bot" de scraping web sans tête de base en Python avec Beautiful Soup 4
J'ai essayé de gratter avec Python
Web scraping avec python + JupyterLab
Refactoring appris avec Python (Basic)
[Python] Scraping dans AWS Lambda
Exploitez LibreOffice avec Python
Authentification BASIC avec bouteille Python
Grattage festif avec Python, scrapy
Débogage avec pdb en Python
[Python] Utilisation d'OpenCV avec Python (basique)
Python: travailler avec Firefox avec du sélénium
Gérer les sons en Python
Tweet avec image en Python
Combiné avec ordinal en Python
Web scraping avec Selenium (Python)
Scraping prévisions météorologiques avec python
[Python] [SQLite3] Exploiter SQLite avec Python (basique)
[Python + Selenium] Conseils pour le grattage
J'ai essayé de gratter avec du python
Web scraping débutant avec python
Gratter la page i-town avec du sélénium
Reconnaissance des nombres dans les images avec Python
Essayez de gratter les données COVID-19 Tokyo avec Python
Essayez de gratter avec Python + Beautiful Soup
Tester avec des nombres aléatoires en Python
Scraping avec Node, Ruby et Python
GOTO en Python avec Sublime Text 3
Travailler avec LibreOffice en Python: import
Analyse CSS avec cssutils en Python
Web scraping avec Python Première étape
J'ai essayé webScraping avec python.