Grattage des données du bulletin IDWR par nombre de rapports par point fixe de grippe et par préfecture

Données Langling PDF sur l'épidémie de grippe par le ministère de la Santé, du Travail et du Bien-être
Data Langling (pdfplumber) PDF sur l'épidémie de grippe par le ministère de la Santé, du Travail et des Affaires sociales

Institut national des maladies infectieuses a CSV des mêmes données, donc grattage

from urllib.parse import urljoin

import requests
from bs4 import BeautifulSoup

url = "https://www.niid.go.jp/niid/ja/data.html"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"
}

r = requests.get(url, headers=headers)
r.raise_for_status()

soup = BeautifulSoup(r.content, "html.parser")

tag = soup.select_one(
    'div.leading-0 > table > tbody > tr > td > p.body1 > a[href$="-teiten.csv"]'
)

link = urljoin(url, tag.get("href"))

import pandas as pd

df = pd.read_csv(
    link,
    encoding="cp932",
    skiprows=3,
    index_col=0,
    header=0,
    usecols=[0, 1, 2],
    na_values="-",
)

df1 = df[df.index.notna()]

Recommended Posts

Grattage des données du bulletin IDWR par nombre de rapports par point fixe de grippe et par préfecture

Data Langling PDF sur l'épidémie de grippe par le ministère de la Santé, du Travail et du Bien-être social

Visualisation des données par préfecture

J'ai vérifié le nombre de magasins fermés et ouverts dans tout le pays par Corona

Calculons la transition du nombre de reproduction de base du nouveau virus corona par préfecture

[Python] Précautions lors de l'acquisition de données en grattant et en les mettant dans la liste

Divise la chaîne de caractères par le nombre de caractères spécifié. En Ruby et Python.

Gratter les données pluviométriques de l'Agence météorologique et les afficher sur M5Stack

Lien vers les points de données du graphe créé par jupyterlab & matplotlib

[Python] Tracer les données par préfecture sur une carte (nombre de voitures possédées dans tout le pays)

Minimisez le nombre de polissages en optimisant la combinaison

Gratter les données gagnantes de Numbers à l'aide de Docker

Établissons un classement du nombre de reproductions efficaces du nouveau virus corona par préfecture