Il est difficile de sauvegarder les images de la recherche d'images et de collecter les images une par une, j'ai donc trouvé un pilote que je devrais rechercher, donc je vais le résumer avec ma propre satisfaction.
Installez google_images_dwonload Page ⇒
$pip install google_images_download
$pip install os
$pip install glob
$pip install chromedriver
Est nécessaire, alors installez-le. S'il n'y a pas d'application "chromedriver" dans le chromedriver, https://chromedriver.chromium.org/downloads Téléchargez plus et stockez dans le fichier chromedriver.
C'est tout ce qu'on peut en dire
・ Pycharm ・ Python 3.7.4 ・ Windows10
déclaration d'importation
from google_images_download import google_images_download
import glob
import os
Contenu Cette fois, le mot recherché est "ONE OK ROCK". Définissez la limite = 100 et définissez le nombre d'images sur 100.
config = {
"Records": [
{
"keywords": "ONE OK ROCK LIVE",
"no_numbering": True,
"limit": 100,
"output_directory": "images",
"image_directory": "ONE OK ROCK",
"chromedriver": "C\\[path to chromedirver]\chromedriver\chromedriver.exe",
}
]
}
Écrivez fermement le chemin d'accès au pilote Chrome.
response = google_images_download.googleimagesdownload()
for rc in config["Records"]:
response.download(rc)
Pour le moment, omettez l'image gif. (Parce que c'est ennuyeux)
gifImgs = glob.glob("images" + os.sep + "*" + os.sep + "*.gif")
print(f"removing gif files: {len(gifImgs)} files")
_ = [os.remove(f) for f in gifImgs]
Vous pouvez l'obtenir en faisant ce qui précède dans l'ordre.
Ce grattage est bon pour recueillir des informations et est très pratique. C'est assez différent d'obtenir une image d'une page, donc j'écrirai à ce sujet dans un article séparé. Il n'est écrit que brièvement, alors vérifiez les détails.
Recommended Posts