Télécharger en masse des images à partir d'une URL de site spécifique avec python

Juger si l'URL acquise est un bus relatif ou un chemin absolu, et s'il s'agit d'un chemin relatif, ne faites pas le travail d'en faire un chemin absolu cette fois Veuillez noter que le chemin img est un programme créé à la condition que seul le chemin absolu soit utilisé sur le site que vous souhaitez acquérir, donc si vous essayez d'acquérir une image à partir d'un site utilisant un chemin relatif, une ERREUR se produira. ~~ Je vais écrire l'explication détaillée (?) Du code dans le blog lié ci-dessous. ~~ (Le blog a été publié) (Prévu à compter du 11 août 2014)

`downloadImg.py`


# -*- coding: utf-8 -*- 

import urllib
import urllib2
import os.path
import sys
from HTMLParser import HTMLParser

def download(url):
    img = urllib.urlopen(url)
    localfile = open(os.path.basename(url),'wb')
    localfile.write(img.read())
    img.close()
    localfile.close()

class imgParser(HTMLParser):

    def __init__(self):
        HTMLParser.__init__(self)

    def handle_starttag(self,tagname,attribute):
        if tagname.lower() == "img":
            for i in attribute:
                if i[0].lower() == "src":
                    img_url=i[1]
                    #Création d'un fichier qui recueille les URL des photos acquises
                    f = open("collection_url.txt","a")
                    f.write("%s\t"%img_url)
                    f.close()
        
if __name__ == "__main__":

    print('Saisissez l'URL du site sur lequel vous souhaitez obtenir la photo.')
    input_url = raw_input('>>>  ')
    serch_url = input_url
    htmldata = urllib2.urlopen(serch_url)
    
    print('Obtention actuelle de fichiers image...')

    parser = imgParser()
    parser.feed(htmldata.read())

    parser.close()
    htmldata.close()

    #Lire le fichier généré
    f = open("collection_url.txt","r")
    for row in f:
        row_url = row.split('\t')
        len_url = len(row_url)
    f.close()

    number_url = []

    for i in range(0,(len_url-1)):
        number_url.append(row_url[i])

    for j in range(0,(len_url-1)):
        url = number_url[j]
        download(url)

    print('Le téléchargement de l'image est terminé.')

    #Supprimer le fichier
    os.remove("collection_url.txt")

Twitter :@fantmsite ~~ Blog: Fantm Site-BLOG ~~

Recommended Posts

Télécharger en masse des images à partir d'une URL de site spécifique avec python

Télécharger en masse des images à partir d'une URL spécifique avec python

Téléchargement par lots d'images à partir d'une URL spécifique avec la version modifiée de python

Télécharger des images à partir de la liste d'URL en Python

Scraping depuis un site authentifié avec python

[Python] Téléchargez l'image d'origine à partir de la recherche d'images Google

Convertissez des PDF en images en masse avec Python

Charger des images à partir d'une URL à l'aide de Pillow dans Python 3

Télécharger automatiquement des images avec grattage

Images en bordure avec python Partie 1

Avec skype, notifiez avec skype de python!

Télécharger le fichier csv avec python

Reconnaissance des nombres dans les images avec Python

Obtenez des commandes PowerShell à partir d'un site d'analyse dynamique de logiciels malveillants avec BeautifulSoup + Python

Appeler C depuis Python avec DragonFFI

Télécharger des images de «Irasutoya» à l'aide de Scrapy

Utilisation de Rstan de Python avec PypeR

Téléchargement de fichiers implémenté avec Python + Bottle

Installez Python à partir des sources avec Ansible

Impossible de télécharger des images avec Google_images_download

Extraire du texte d'images avec Python

Publiez plusieurs images Twitter avec python

Exécutez Aprili depuis Python sur Orange

Publier une image de Python sur Tumblr

Animez plusieurs images fixes avec Python

Charger une image gif avec Python + OpenCV

Appelez python de nim avec Nimpy

Charger fbx depuis python avec cinema4d

Travailler avec des images DICOM en Python

Télécharger et télécharger des images avec Falcon

[Python] Essayez de reconnaître les caractères des images avec OpenCV et pyocr

Téléchargez le rapport XBRL de titres, rapport trimestriel, rapport financier d'EDINET / TDNET avec Python

Collecter des informations sur Twitter avec Python (API Twitter)

Recevoir des données textuelles de mysql avec python

Obtenir le code HTML de l'élément avec du sélénium Python

[Note] Obtenir des données de PostgreSQL avec Python

Lire un fichier audio à partir de Python avec interruption

Créez wordcloud à partir de votre tweet avec python3

Amplifiez les images pour l'apprentissage automatique avec Python

Lire le fichier CSV avec python (Télécharger et analyser le fichier CSV)

Exclure les tweets contenant des URL avec tweepy [Python]

Type de téléchargement de partage HTTP réalisé avec Python

Capturer des images avec Pupil, python et OpenCV

Tweet de python avec Twitter Developer + Tweepy

Téléchargez les données de cours des actions japonaises avec Python

Efficacité commerciale à partir de zéro avec Python

Décrypter les fichiers cryptés avec openssl depuis python avec openssl

Manipulation d'Azure CosmosDB à partir de Python Part.2

Acquisition d'images depuis une caméra avec Python + OpenCV

Télécharger des fichiers sur le Web avec Python

Site de courses de chevaux Web scraping avec Python

[python, openCV] base64 Reconnaissance faciale dans les images

Premiers pas avec Dynamo de Python boto

[Python] Lire des images avec OpenCV (pour les débutants)

Essayez d'appeler Python depuis Ruby avec une économie

Obtenez des images d'utilisateurs spécifiques sur Twitter

Ajouter du bruit gaussien aux images avec python2.7

Téléchargez facilement des mp3 / mp4 avec python et youtube-dl!

Utilisation des fonctions C ++ de python avec pybind11