Grattage des données du bulletin IDWR par nombre de rapports par point fixe de grippe et par préfecture

Institut national des maladies infectieuses a CSV des mêmes données, donc grattage

from urllib.parse import urljoin

import requests
from bs4 import BeautifulSoup

url = "https://www.niid.go.jp/niid/ja/data.html"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"
}

r = requests.get(url, headers=headers)
r.raise_for_status()

soup = BeautifulSoup(r.content, "html.parser")

tag = soup.select_one(
    'div.leading-0 > table > tbody > tr > td > p.body1 > a[href$="-teiten.csv"]'
)

link = urljoin(url, tag.get("href"))

import pandas as pd

df = pd.read_csv(
    link,
    encoding="cp932",
    skiprows=3,
    index_col=0,
    header=0,
    usecols=[0, 1, 2],
    na_values="-",
)

df1 = df[df.index.notna()]

Recommended Posts

Grattage des données du bulletin IDWR par nombre de rapports par point fixe de grippe et par préfecture
Data Langling PDF sur l'épidémie de grippe par le ministère de la Santé, du Travail et du Bien-être social
Visualisation des données par préfecture
J'ai vérifié le nombre de magasins fermés et ouverts dans tout le pays par Corona
Calculons la transition du nombre de reproduction de base du nouveau virus corona par préfecture
[Python] Précautions lors de l'acquisition de données en grattant et en les mettant dans la liste
Divise la chaîne de caractères par le nombre de caractères spécifié. En Ruby et Python.
Gratter les données pluviométriques de l'Agence météorologique et les afficher sur M5Stack
Lien vers les points de données du graphe créé par jupyterlab & matplotlib
[Python] Tracer les données par préfecture sur une carte (nombre de voitures possédées dans tout le pays)
Minimisez le nombre de polissages en optimisant la combinaison
Gratter les données gagnantes de Numbers à l'aide de Docker
Établissons un classement du nombre de reproductions efficaces du nouveau virus corona par préfecture