Je viens de renommer le post-traitement après le scraping posté dans Scraping from google images with google-images-download. Je ne fais pas ça difficile.
from google_images_download import google_images_download
import glob
import os
from PIL import Image
Ajoutez «from PIL import Image» à la précédente.
config = {
"Records": [
{
"keywords": "Sho Hirano",
"limit": 10,
"no_numbering": True,
"output_directort": "images",
"image_directory": "Sho Hirano",
"chromedriver": "C\\[path to chromedirver]\chromedriver\chromedriver.exe",
}
]
}
response = google_images_download.googleimagesdownload()
for rc in config["Records"]:
response.download(rc)
gifImgs = glob.glob("images" + os.sep + "*" + os.sep + "*.gif")
print(f"removing gif files: {len(gifImgs)} files")
_ = [os.remove(f) for f in gifImgs]
Jusqu'à ce point, le même que la dernière fois. Pour cela, insérez le code suivant. Ici, le fichier image est renommé à l'aide de la fonction énumérer dans l'instruction for.
files = glob.glob('./*.jpg')
for (i, old_name) in enumerate(files):
new_name = ('./shohirano_{0:03d}.jpg'.format(i + 1))
os.rename(old_name, new_name)
print(old_name + " → " + new_name)
Le contenu de l'impression est le suivant.
C:\[path to image]\280full.jpg → C:\[path to dir]\shohirano_001.jpg
C:\[path to image]\2966d3c610bf42015a1f853410848b5c.jpg → C:\[path to dir]\shohirano_002.jpg
C:\[path to image]\300px-Hirano_Sho-p2.jpg → C:\[]\shohirano_003.jpg
C:\[path to image]\4f3340a3005c32ffcc64728b75b70792.jpg → C:\[path to dir]\shohirano_004.jpg
C:\[path to image]\5o0JZc.jpg → C:\[path to dir]\shohirano_005.jpg
C:\[path to image]\d8ea5b8f0f2ae32dbf5a62c00c8c3c3e.jpg → C:\[path to dir]\shohirano_006.jpg
C:\[path to image]\ed909d1bd55e96e5bab12881b350f28964e30aa3.jpg → C:\[path to dir]\shohirano_007.jpg
C:\[path to image]\MV5BODk2YzAyNGUtNTI0Yi00MDllLWFlNDUtNGJlMjAwMThmM2Q5XkEyXkFqcGdeQXVyNDQxNjcxNQ@@._V1_UY1200_CR565,0,630,1200_AL_.jpg → C:\[path to dir]\shohirano_008.jpg
C:\[path to image]\NEOBK-2298759.jpg → C:\[path to dir]\shohirano_009.jpg
C:\[path to image]\Sho_Hirano-p2.jpg → C:\[path to dir]\shohirano_010.jpg
De cette façon, vous pouvez renommer en numéros de série. Au fait, j'ai choisi Hirano Shiya, mais c'est un beau mec. c'est tout. (Minna Tanaka a perdu la raison)
scrapy ├── downloads │ ├── Sho Hirano │ │ ├──shohirano_001.jpg │ │ └── ... │ └── ... └── scrapy.ipynb Si vous exécutez un fichier avec le nom de quelqu'un d'autre, il s'accumulera dans les téléchargements.
Si vous augmentez ce nombre et ne stockez que le visage découpé sous forme de fichier, vous pouvez l'utiliser comme données d'apprentissage. Pour la reconnaissance faciale, etc.
Recommended Posts