Télécharger en masse des images à partir d'une URL de site spécifique avec python

Juger si l'URL acquise est un bus relatif ou un chemin absolu, et s'il s'agit d'un chemin relatif, ne faites pas le travail d'en faire un chemin absolu cette fois Veuillez noter que le chemin img est un programme créé à la condition que seul le chemin absolu soit utilisé sur le site que vous souhaitez acquérir, donc si vous essayez d'acquérir une image à partir d'un site utilisant un chemin relatif, une ERREUR se produira. ~~ Je vais écrire l'explication détaillée (?) Du code dans le blog lié ci-dessous. ~~ (Le blog a été publié) (Prévu à compter du 11 août 2014)

downloadImg.py


# -*- coding: utf-8 -*- 

import urllib
import urllib2
import os.path
import sys
from HTMLParser import HTMLParser

def download(url):
    img = urllib.urlopen(url)
    localfile = open(os.path.basename(url),'wb')
    localfile.write(img.read())
    img.close()
    localfile.close()

class imgParser(HTMLParser):

    def __init__(self):
        HTMLParser.__init__(self)

    def handle_starttag(self,tagname,attribute):
        if tagname.lower() == "img":
            for i in attribute:
                if i[0].lower() == "src":
                    img_url=i[1]
                    #Création d'un fichier qui recueille les URL des photos acquises
                    f = open("collection_url.txt","a")
                    f.write("%s\t"%img_url)
                    f.close()
        
if __name__ == "__main__":

    print('Saisissez l'URL du site sur lequel vous souhaitez obtenir la photo.')
    input_url = raw_input('>>>  ')
    serch_url = input_url
    htmldata = urllib2.urlopen(serch_url)
    
    print('Obtention actuelle de fichiers image...')

    parser = imgParser()
    parser.feed(htmldata.read())

    parser.close()
    htmldata.close()

    #Lire le fichier généré
    f = open("collection_url.txt","r")
    for row in f:
        row_url = row.split('\t')
        len_url = len(row_url)
    f.close()

    number_url = []

    for i in range(0,(len_url-1)):
        number_url.append(row_url[i])

    for j in range(0,(len_url-1)):
        url = number_url[j]
        download(url)

    print('Le téléchargement de l'image est terminé.')

    #Supprimer le fichier
    os.remove("collection_url.txt")

Twitter :@fantmsite ~~ Blog: Fantm Site-BLOG ~~

Recommended Posts

Télécharger en masse des images à partir d'une URL de site spécifique avec python
Télécharger en masse des images à partir d'une URL spécifique avec python
Téléchargement par lots d'images à partir d'une URL spécifique avec la version modifiée de python
Télécharger des images à partir de la liste d'URL en Python
Scraping depuis un site authentifié avec python
[Python] Téléchargez l'image d'origine à partir de la recherche d'images Google
Convertissez des PDF en images en masse avec Python
Charger des images à partir d'une URL à l'aide de Pillow dans Python 3
Télécharger automatiquement des images avec grattage
Images en bordure avec python Partie 1
Avec skype, notifiez avec skype de python!
Télécharger le fichier csv avec python
Reconnaissance des nombres dans les images avec Python
Obtenez des commandes PowerShell à partir d'un site d'analyse dynamique de logiciels malveillants avec BeautifulSoup + Python
Appeler C depuis Python avec DragonFFI
Télécharger des images de «Irasutoya» à l'aide de Scrapy
Utilisation de Rstan de Python avec PypeR
Téléchargement de fichiers implémenté avec Python + Bottle
Installez Python à partir des sources avec Ansible
Impossible de télécharger des images avec Google_images_download
Extraire du texte d'images avec Python
Publiez plusieurs images Twitter avec python
Exécutez Aprili depuis Python sur Orange
Publier une image de Python sur Tumblr
Animez plusieurs images fixes avec Python
Charger une image gif avec Python + OpenCV
Appelez python de nim avec Nimpy
Charger fbx depuis python avec cinema4d
Travailler avec des images DICOM en Python
Télécharger et télécharger des images avec Falcon
[Python] Essayez de reconnaître les caractères des images avec OpenCV et pyocr
Téléchargez le rapport XBRL de titres, rapport trimestriel, rapport financier d'EDINET / TDNET avec Python
Collecter des informations sur Twitter avec Python (API Twitter)
Recevoir des données textuelles de mysql avec python
Obtenir le code HTML de l'élément avec du sélénium Python
[Note] Obtenir des données de PostgreSQL avec Python
Lire un fichier audio à partir de Python avec interruption
Créez wordcloud à partir de votre tweet avec python3
Amplifiez les images pour l'apprentissage automatique avec Python
Lire le fichier CSV avec python (Télécharger et analyser le fichier CSV)
Exclure les tweets contenant des URL avec tweepy [Python]
Type de téléchargement de partage HTTP réalisé avec Python
Capturer des images avec Pupil, python et OpenCV
Tweet de python avec Twitter Developer + Tweepy
Téléchargez les données de cours des actions japonaises avec Python
Efficacité commerciale à partir de zéro avec Python
Décrypter les fichiers cryptés avec openssl depuis python avec openssl
Manipulation d'Azure CosmosDB à partir de Python Part.2
Acquisition d'images depuis une caméra avec Python + OpenCV
Télécharger des fichiers sur le Web avec Python
Site de courses de chevaux Web scraping avec Python
[python, openCV] base64 Reconnaissance faciale dans les images
Premiers pas avec Dynamo de Python boto
[Python] Lire des images avec OpenCV (pour les débutants)
Essayez d'appeler Python depuis Ruby avec une économie
Obtenez des images d'utilisateurs spécifiques sur Twitter
Ajouter du bruit gaussien aux images avec python2.7
Téléchargez facilement des mp3 / mp4 avec python et youtube-dl!
Utilisation des fonctions C ++ de python avec pybind11