Renommer le numéro de série des images récupérées

introduction

Je viens de renommer le post-traitement après le scraping posté dans Scraping from google images with google-images-download. Je ne fais pas ça difficile.

Code source


from google_images_download import google_images_download
import glob
import os
from PIL import Image

Ajoutez «from PIL import Image» à la précédente.

config = {
    "Records": [
        {
            "keywords": "Sho Hirano",
            "limit": 10,
            "no_numbering": True,
            "output_directort": "images",
            "image_directory": "Sho Hirano",
            "chromedriver": "C\\[path to chromedirver]\chromedriver\chromedriver.exe",
        }
    ]
}

response = google_images_download.googleimagesdownload()
for rc in config["Records"]:
    response.download(rc)

gifImgs = glob.glob("images" + os.sep + "*" + os.sep + "*.gif")
print(f"removing gif files: {len(gifImgs)} files")
_ = [os.remove(f) for f in gifImgs]

Jusqu'à ce point, le même que la dernière fois. Pour cela, insérez le code suivant. Ici, le fichier image est renommé à l'aide de la fonction énumérer dans l'instruction for.

files = glob.glob('./*.jpg')
for (i, old_name) in enumerate(files):
    new_name = ('./shohirano_{0:03d}.jpg'.format(i + 1))
    os.rename(old_name, new_name)
    print(old_name + " → " + new_name)

Le contenu de l'impression est le suivant.

C:\[path to image]\280full.jpg → C:\[path to dir]\shohirano_001.jpg
C:\[path to image]\2966d3c610bf42015a1f853410848b5c.jpg → C:\[path to dir]\shohirano_002.jpg
C:\[path to image]\300px-Hirano_Sho-p2.jpg → C:\[]\shohirano_003.jpg
C:\[path to image]\4f3340a3005c32ffcc64728b75b70792.jpg → C:\[path to dir]\shohirano_004.jpg
C:\[path to image]\5o0JZc.jpg → C:\[path to dir]\shohirano_005.jpg
C:\[path to image]\d8ea5b8f0f2ae32dbf5a62c00c8c3c3e.jpg → C:\[path to dir]\shohirano_006.jpg
C:\[path to image]\ed909d1bd55e96e5bab12881b350f28964e30aa3.jpg → C:\[path to dir]\shohirano_007.jpg
C:\[path to image]\MV5BODk2YzAyNGUtNTI0Yi00MDllLWFlNDUtNGJlMjAwMThmM2Q5XkEyXkFqcGdeQXVyNDQxNjcxNQ@@._V1_UY1200_CR565,0,630,1200_AL_.jpg → C:\[path to dir]\shohirano_008.jpg
C:\[path to image]\NEOBK-2298759.jpg → C:\[path to dir]\shohirano_009.jpg
C:\[path to image]\Sho_Hirano-p2.jpg → C:\[path to dir]\shohirano_010.jpg

Résultats dans le fichier

スクリーンショット (24).png De cette façon, vous pouvez renommer en numéros de série. Au fait, j'ai choisi Hirano Shiya, mais c'est un beau mec. c'est tout. (Minna Tanaka a perdu la raison)

Structure des fichiers

scrapy ├── downloads │  ├── Sho Hirano │  │  ├──shohirano_001.jpg │  │  └── ... │  └── ... └── scrapy.ipynb Si vous exécutez un fichier avec le nom de quelqu'un d'autre, il s'accumulera dans les téléchargements.

Utilisation

Si vous augmentez ce nombre et ne stockez que le visage découpé sous forme de fichier, vous pouvez l'utiliser comme données d'apprentissage. Pour la reconnaissance faciale, etc.

Recommended Posts

Renommer le numéro de série des images récupérées
Téléchargez un grand nombre d'images sur Wordpress
Comment augmenter le nombre d'images de jeux de données d'apprentissage automatique
[Python] Lecture facile des fichiers image du numéro de série avec OpenCV
10. Compter le nombre de lignes
Obtenez le nombre de chiffres
Liste des images Docker personnalisées
Placement optimal de plusieurs images
Calculez le nombre de changements
Accélérer le chargement des images Python
TensorFlow Pour apprendre d'un grand nombre d'images ... ~ (presque) solution ~