Laissez une note pour vous souvenir de ce que vous avez appris dans pyq
pandas
・ Lors du dessin d'un histogramme, `` plt.hist ''
plt.hist(df[df["y"] == 1]["x"], label="men 16years old", bins=100, range = (140, 187), alpha = 0.3, color = "green")
(df est des données csv)
plt.xlabel (" height [cm] ")
: titre de l'axe des x
plt.legend ();
: Afficher la description des données
・ Lors du dessin d'un diagramme de dispersion, plt.scatter
plt.scatter(men["height"], men["weight"], color="green")
Le premier argument est la valeur sur l'axe horizontal dans les données. Le second argument est la valeur sur l'axe vertical dans les données.
・ Lors du dessin d'une matrice de diagramme de dispersion
pd.plotting.scatter_matrix(df)
DataFrame
· Extraire les valeurs de colonne
Spécifiez le nom de la colonne comme df [[" teneur en alcool "," densité "]]
df.iloc (ligne à récupérer, colonne à récupérer)
Utilisez df.iloc
・ Divisez les données pour la formation et l'évaluation (test)
Utilisez train_test_split
from sklearn.model_selection import train_test_split (X_train, X_test, y_train, y_test) = train_test_split( X, y, test_size=0.3, random_state=0 )
test_size = 0.3 est le pourcentage des données utilisé pour les tests
random_state = 0 Valeur de départ aléatoire lors de la division des données (généralement non utilisée)
L'arbre de décision est "une série d'instructions if qui apprennent automatiquement les conditions"
Numpy
** Comment créer un tableau multidimensionnel avec les mêmes éléments ** zéros (taille): tableau multidimensionnel avec tous les éléments 0 ones (taille): tableau multidimensionnel avec tous les éléments 1 full (size, value): un tableau multidimensionnel de valeurs pour tous les éléments zeros_like (tableau multidimensionnel): tableau multidimensionnel avec tous les 0 éléments ones_like (tableau multidimensionnel): tableau multidimensionnel avec les 1 éléments full_like (tableau multidimensionnel, valeur): Un tableau multidimensionnel dans lequel tous les éléments sont des valeurs
** Données continues ** arange ([start,] stop [, step,], dtype = None): création de données continue comme plage linspace (start, stop, num = 50, endpoint = True, retstep = False, dtype = None): Création de données continue lorsque la plage à créer et le nombre de nombres sont déterminés
** Matrice unitaire et matrice diagonale ** numpy.eye: matrice d'unité avec les 1 diagonales numpy.diag: toute matrice diagonale
La norme d'évaluation est le type de mesure La norme d'évaluation est l'échelle de la mesure
Recommended Posts