Je vais rassembler des choses que je vais utiliser à nouveau (Remarque: veuillez noter qu'il n'y a rien de nouveau sur le contenu de l'article de mémo personnel)
Préparation du jeu de données
import pandas as pd
from sklearn import datasets
iris = datasets.load_iris()
columns = list(map(lambda x: ' '.join(x.split(' ')[:2]), iris.feature_names))
df = pd.DataFrame(iris.data, columns=columns)
df['target'] = iris.target_names[iris.target]
df.head()
df.groupby('target').size().to_frame.plot.barh()
Résultat de l'exécution:
to_frame
pour utiliser pandas.DataFrame.plot.barh
size ()
pour chaque valeur dans la colonne spécifiéebar
et barh
sont possibles, mais j'aime personnellement barh
, qui a des étiquettes faciles à lire.for key, indices in df.groupby('target').groups.items():
x = df.loc[indices]['sepal length']
y = df.loc[indices]['petal length']
plt.scatter(x, y, label=key, alpha=0.4)
plt.legend()
plt.show()
Résultat de l'exécution:
df.groupby ('target'). Groups
vous donne un dictionnaire de la forme {Valeur de colonne spécifiée: index}
contenant la valeur de colonne spécifiée.
.items ()
attaché au type de dictionnaire dans le standard Python.Recommended Posts