S'il y a du contenu lié à Pandas dans l'apprentissage de Python, je le mettrai à jour de temps en temps.
Pandas Une bibliothèque qui fournit des fonctions pour prendre en charge l'analyse des données
python
import pandas as pd
python
csv_test_1 = pd.read_csv('hoge.csv')
python
excel_data = pd.read_excel('hoge.xlsx')
python
csv_test_2 = pd.read_csv('hoge_2.csv')
csv_test = pd.concat([csv_test_1 , csv_test_2], ignore_index=True)
csv_test.head()
-Lorsque les noms d'éléments des deux tables à joindre sont les mêmes. Combinez avec ```on = "id" `` `comme condition.
Table de post-jointure= pd.merge(Tableau 1,Tableau 2, on="Joindre l'élément", how="Méthode")
#### **`python`**
```python
join_data = pd.merge(a_data, b_data[["id", "date", "customer"]], on="id", how="left")
join_data.head()
-Lorsque les noms d'éléments des deux tables à joindre sont différents. Combiné avec `left_on =" customer_name ", right_on =" customer name ""
`.
python
pd.merge(a_data, b_data, left_on="customer_name", right_on="Nom du client", how="left")
python
pd.unique(test_data.item_name))
len(pd.unique(test_data.item_name))) #Nombre de données uniques
python
test_data["a"] = pd.to_datetime(test_data["a"])
python
time_data["payment_month"] = time_data["payment_date"].dt.strftime("%Y%m")
python
pd.pivot_table(test_data, index='item_name', columns='payment_month', values=['price', 'quantity'], aggfunc='sum')
** ・ Présentation du tableau croisé dynamique ** index: spécifiez une ligne colonnes: spécifiez les colonnes valeurs: spécifiez les valeurs à agréger aggfunc: spécifiez la méthode d'agrégation
python
print(len(test_data)) #Afficher le nombre de données
python
csv_test_1.head()
python
csv_test_1["Nom de colonne"].head()
python
res = test_data.loc[flg_is_null, "item_name"]
python
test_data["new"] = test_data["a"] * test_data["b"]
python
test_data["a"].sum()
python
test_data.groupby("create_date").sum()["price"]
python
test_data.groupby(["create_date", "item_name"]).sum()[["price", "quantity"]]
python
test_data["a"].sum() == test_data["b"].sum()
python
test_data.isnull().sum()
python
test_data.isnull().any(axis=0)
python
test_data.describe()
python
test_data["create_date"].min()
test_data["create_date"].max()
python
test_data.dtypes
-Les différentes statistiques suivantes peuvent être affichées avec describe (). Nombre de données (décompte), moyenne (moyenne), écart type (std), minimum (min), quadrant (25%, 75%), médiane (50%), maximum (max)
Mémo de travail · Nettoyage des données
Traitement des données: Pandas Visualisation: Matplotlib Apprentissage automatique: scikit-learn
Recommended Posts