Utilisez BeautifulSoup pour extraire un lien contenant une chaîne d'un fichier HTML

-Extraire les liens contenant "mp4" des fichiers HTML. -Utilise une belle soupe.


from BeautifulSoup import BeautifulSoup

open_name = raw_input('Open html file: ')
save_name = raw_input('Save file name: ')

f = open(open_name)
html = f.read()
f.close()

f2 = open(save_name, 'w')

soup = BeautifulSoup(html)

for link in soup.findAll("a"):
    if "mp4" in link.get("href"): # "mp4"Extraire les liens contenant
        f2.writelines(link.get('href') + '¥n')

f2.close()

J'ai fait référence au débordement de pile lié ci-dessous. Veuillez indiquer s'il existe un autre bon moyen.

référence: python - how can I get href links from html code - Stack Overflow https://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code/3075568#3075568

Recommended Posts

Utilisez BeautifulSoup pour extraire un lien contenant une chaîne d'un fichier HTML
Essayez d'extraire une chaîne de caractères d'une image avec Python3
Comment utiliser NUITKA-Utilities hinted-compilation pour créer facilement un fichier exécutable à partir d'un script Python
Convertir une chaîne en image
Sortie de la ligne contenant la chaîne de caractères spécifiée à partir du fichier texte
Comment extraire la chaîne de caractères souhaitée à partir d'une ligne 4 commandes
Je souhaite extraire une URL arbitraire de la chaîne de caractères de la source html avec python
[Mémo] Comment utiliser BeautifulSoup4 (1) Afficher html
# 5 [python3] Extraire des caractères d'une chaîne de caractères
Comment créer un objet fonction à partir d'une chaîne
[Python] Combiner des listes contenant des nombres en chaînes et les écrire dans un fichier de sortie
Comment extraire le coefficient de la formule minute
J'ai essayé d'extraire le dessin au trait de l'image avec Deep Learning
Extraire des lignes contenant une "chaîne" spécifique avec Pandas
J'ai créé un package pour créer un fichier exécutable à partir du code source Hy
Convertir une chaîne de chemin qui utilise un lien symbolique au milieu en un chemin absolu
Analyser une chaîne JSON écrite dans un fichier en Python
Étapes de l'installation de Django à l'affichage de la page html
Backtrader Comment importer un indicateur depuis un autre fichier
Comment transformer un fichier .py en fichier .exe
Script Python qui crée un fichier JSON à partir d'un fichier CSV
Introduction à l'apprentissage automatique à partir de Simple Perceptron
Utilisez Boto3 pour récupérer plus de 1000 préfixes de la liste de fichiers de S3
Comment générer une clé publique à partir d'une clé privée SSH
Problèmes de caractères déformés lors de l'impression d'un tableau contenant une chaîne contenant utf-8
Python> Lire à partir d'une chaîne multiligne au lieu d'un fichier> io.StringIO ()
Comment utiliser un fichier autre que .fabricrc comme fichier de configuration
[Python] Comment générer une table pandas dans un fichier Excel
Extraire la valeur la plus proche d'une valeur à partir d'un élément de liste en Python
Convertir le HTML en fichier texte
[Python] Utiliser une séquence de chaînes
Télécharger un fichier sur Dropbox
Comment coller un fichier CSV dans un fichier Excel à l'aide de Pandas
Créer une instance d'une classe prédéfinie à partir d'une chaîne en Python
Comment transformer une chaîne en tableau ou un tableau en chaîne en Python
Comment obtenir une chaîne à partir d'un argument de ligne de commande en python
Comment utiliser la reconnaissance visuelle pour obtenir l'ID de ligne d'une fille
J'ai écrit un script pour extraire les liens de pages Web en Python
Comment créer un fichier factice CSV contenant du japonais à l'aide de Faker
Comment obtenir un ingénieur de la trentaine
Trouvez tous les modèles pour extraire un nombre spécifique de l'ensemble