Convertir le PDF des magasins membres Go To EAT de la préfecture d'Ishikawa en CSV

Convertir le PDF des magasins membres de la Ishikawa Go To Eat Campaign en CSV

pip install tabula-py
pip install pandas
pip install beautifulsoup4
pip install requests
from urllib.parse import urljoin

import requests
from bs4 import BeautifulSoup

import pandas as pd
from tabula import read_pdf

url = "https://ishikawa-gotoeat-cpn.com/member_store/"

r = requests.get(url)
r.raise_for_status()

soup = BeautifulSoup(r.content, "html.parser")

dfs = [
    tbl
    for tag in soup.select("p.btn.btn_red.btn_pdf > a")
    for tbl in read_pdf(urljoin(url, tag.get("href")), pages="all", lattice=True)
]

df = pd.concat(dfs).set_axis(["Nom municipal", "Nom du magasin"], axis=1).reset_index(drop=True)

df.to_csv("ishikawa.csv", encoding="utf_8_sig")

Recommended Posts

Convertir le PDF des magasins membres Go To EAT de la préfecture d'Ishikawa en CSV
Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Niigata en CSV
Convertir le PDF des magasins disponibles de Go To EAT dans la préfecture de Kagoshima en CSV
Convertir le PDF de la liste des magasins membres Go To EAT dans la préfecture de Kumamoto en CSV
Convertir le PDF de la préfecture de Chiba Aller à la liste des magasins des membres EAT en CSV (commande)
Scraping Go To EAT membres magasins dans la préfecture d'Osaka et conversion au format CSV
Gratter la liste des magasins membres Go To EAT dans la préfecture de Niigata et la convertir en CSV
Convertir le PDF de la liste des concessionnaires de la campagne Go To Eat Hokkaido en CSV
Convertir le PDF d'un nouveau cas d'épidémie corona dans la préfecture d'Aichi en CSV
Convertir Markdown en PDF en Python
Convertir de PDF en CSV avec pdfplumber
Je souhaite convertir une table convertie en PDF en Python en CSV
L'histoire de la recherche d'un magasin BOT (AI LINE BOT) pour Go To EAT dans la préfecture de Chiba (1)
Convertir le PDF de la liste de produits contenant des surfactants efficaces pour le nouveau virus corona en CSV
Histoire de faire une recherche de magasin BOT (AI LINE BOT) pour Go To EAT dans la préfecture de Chiba (2) [Présentation]
Conversion par lots de fichiers PSD du répertoire en PDF
[Python] Convertir le texte PDF en CSV pour chaque page (2/24 postscript)
Convertissez l'image au format .zip en PDF avec Python
Conversion par lots de tous les fichiers xlsx du dossier en fichiers CSV
Django a changé pour enregistrer beaucoup de données à la fois
Convertissez rapidement SDF en CSV
Extension Sphinx pour convertir arbitrairement du texte en pré-traitement de la génération de documents
Convertir des fichiers écrits en python, etc. en pdf avec la coloration syntaxique
Convertissez un grand nombre de fichiers PDF en fichiers texte à l'aide de pdfminer
Créez une fonction pour obtenir le contenu de la base de données dans Go
Mémorandum ((1) Copier et coller à partir d'un autre livre (2) Reportez-vous au tableau de comparaison avec openpyxl)
Procédure pour changer le nom de la table et le nom de la colonne du modèle Django en même temps
Scraping Go To EAT membres magasins dans la préfecture d'Osaka et conversion au format CSV