traduction google de http://scikit-learn.org/0.18/tutorial/statistical_inference/settings.html Table des matières du didacticiel scikit-learn 0.18 Tableau du didacticiel d'apprentissage statistique pour le traitement des données scientifiques
scikit-learn traite de l'apprentissage des informations d'un ou plusieurs jeux de données représentés sous forme de tableau à deux dimensions. Ils peuvent être compris comme une liste d'observations multidimensionnelles. Le premier axe de ces séquences est l'axe d'échantillonnage et le second axe est l'axe élémentaire.
** scikit: un exemple simple livré avec l'ensemble de données iris **
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> data = iris.data
>>> data.shape
(150, 4)
Il consiste en des observations de 150 iris. Chaque caractéristique est la longueur et la largeur de ses feuilles et pétales, comme détaillé dans ʻiris.DESCR`.
Si les données ne sont pas sous la forme (n_samples, n_features)
, elles doivent être prétraitées pour être utilisées avec scicit-learn.
** Un exemple de reformage de données est le jeu de données chiffres **
L'ensemble de données de chiffres se compose de 1797 images 8x8 de nombres manuscrits.
>>> digits = datasets.load_digits()
>>> digits.images.shape
(1797, 8, 8)
>>> import matplotlib.pyplot as plt
>>> plt.imshow(digits.images[-1], cmap=plt.cm.gray_r)
<matplotlib.image.AxesImage object at ...>
Convertissez chaque image 8x8 en un vecteur d'entités de longueur 64 à utiliser avec cet ensemble de données dans scikit
>>> data = digits.images.reshape((digits.images.shape[0], -1))
** Fitting data: ** La principale API implémentée par scikit-learn est l'API Estimator. Un estimateur est un objet qui apprend des données. Il peut s'agir d'un classificateur, d'un algorithme de régression ou de clustering, ou d'un convertisseur qui extrait / filtre des fonctionnalités utiles à partir des données brutes.
Tous les objets estimateurs exposent une méthode fit
qui prend un ensemble de données (généralement un tableau à deux dimensions) comme argument.
>>> estimator.fit(data)
** Paramètres de l'estimateur: ** Tous les paramètres de l'estimateur peuvent être définis lorsqu'ils sont instanciés ou en modifiant les attributs correspondants.
>>> estimator = Estimator(param1=1, param2=2)
>>> estimator.param1
1
** Paramètres estimés: ** Lorsque l'estimateur est fait pour "ajuster" les données, les paramètres sont estimés à partir des données disponibles. Tous les paramètres d'estimation sont des attributs de l'objet estimateur qui se terminent par un trait de soulignement.
>>> estimator.estimated_param_
Tableau du didacticiel d'apprentissage statistique pour le traitement des données scientifiques
© 2010 --2016, développeurs scikit-learn (licence BSD).
Recommended Posts