Ministère de la santé, du travail et du bien-être social, situation de l'épidémie au pays, etc. Données ouvertes
Nettoyage des données car csv contient \ n caractères de saut de ligne et la comparaison de la veille se trouve dans la même cellule
import re
import pandas as pd
df = pd.read_csv("https://www.mhlw.go.jp/content/current_situation.csv", index_col=0)
df.index = df.index.str.replace(r"※\d", "").str.replace(",", "").str.replace(r"\\n", "")
df.columns = df.columns.str.replace(r"※\d", "").str.replace(r"\\n", "").str.strip()
df = df.applymap(lambda s: re.sub(r"※\d", "", s))
dfs = []
for name, col in df.iteritems():
df_tmp = col.str.split(r"\\n", expand=True).rename(columns={0: "Cumulatif", 1: "Le ratio de la veille"})
df_tmp.columns = pd.MultiIndex.from_product([[name], df_tmp.columns])
dfs.append(df_tmp)
df = pd.concat(dfs, axis=1).fillna(0)
df = df.applymap(lambda s: str(s).replace(",", "").strip().strip("()")).astype(int)
df.to_csv("current_situation.csv", encoding="utf_8_sig")
Recommended Posts