google traduit http://scikit-learn.org/0.18/modules/unsupervised_reduction.html [scikit-learn 0.18 User Guide 4. Dataset Conversion](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF % E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B)

4.4. Réduction de dimension non supervisée

Si la quantité de caractéristiques a un grand nombre de dimensions, il est utile de la réduire dans l'étape non supervisée avant l'étape supervisée. [Méthode d'apprentissage sans enseignant](http://qiita.com/nazoking@github/items/267f2371757516f8c168#2-%E6%95%99%E5%B8%AB%E3%81%AA%E3%81%97% Beaucoup de E5% AD% A6% E7% BF% 92) implémentent des méthodes de «transformation» qui peuvent être utilisées pour réduire les dimensions. Ce qui suit décrit deux exemples spécifiques de ce modèle fréquemment utilisé.

Traitement du pipeline
Les réductions de données non gérées et les estimations gérées peuvent être chaînées en une seule étape. Voir Pipeline: Chain Estimates (http://qiita.com/nazoking@github/items/fdfd207b3127d6d026e0).

4.4.1. ACP: analyse en composantes principales

decomposition.PCA est une quantité de caractéristiques qui capture bien la dispersion de la quantité de caractéristiques d'origine. Recherchez une combinaison de. Voir Décomposition des signaux des composants (problème de décomposition de la matrice) (http://scikit-learn.org/0.18/modules/decomposition.html#decompositions).

4.4.2. Projection aléatoire

Module: random_projection fournit plusieurs outils de réduction des données avec projection aléatoire. Voir la section appropriée de la documentation: Projection aléatoire (http://qiita.com/nazoking@github/items/16f65bbcfda517a74df2).

Exemple
[Johnson-Lindenstrauss est lié à l'incorporation de projection aléatoire](http://scikit-learn.org/0.18/auto_examples/plot_johnson_lindenstrauss_bound.html#sphx-glr-auto-examples-plot-johnson-lindenstrauss-bound -py)

4.4.3. Accumulation de fonctionnalités

cluster.FeatureAgglomeration est [Hierarchical Clustering](http: // scikit- Appliquez learn.org/0.18/modules/clustering.html#hierarchical-clustering) pour regrouper les fonctionnalités qui se comportent de manière similaire.

Exemple
[Accumulation de caractéristiques vs sélection univariée](http://scikit-learn.org/0.18/auto_examples/cluster/plot_feature_agglomeration_vs_univariate_selection.html#sphx-glr-auto-examples-cluster-plot-feature-ageration-vs-univariate selection-py)
Accumulation de fonctionnalités

** Mise à l'échelle des fonctionnalités **

Si la mise à l'échelle des fonctionnalités ou les propriétés statistiques sont très différentes, alors cluster.FeatureAgglomeration (http://scikit-learn.org/0.18/modules/generated/sklearn.cluster.FeatureAgglomeration.html#sklearn.cluster.FeatureAgglomeration) Notez que vous ne pourrez peut-être pas obtenir de liens entre les quantités d'entités associées. Dans ces environnements, vous pouvez utiliser preprocessing.StandardScaler.

[scikit-learn 0.18 User Guide 4. Dataset Conversion](http://qiita.com/nazoking@github/items/267f2371757516f8c168#4-%E3%83%87%E3%83%BC%E3%82%BF % E3% 82% BB% E3% 83% 83% E3% 83% 88% E5% A4% 89% E6% 8F% 9B) © 2010 --2016, développeurs scikit-learn (licence BSD).

[Français] scikit-learn 0.18 Guide de l'utilisateur 4.4. Réduction de dimension non supervisée

4.4. Réduction de dimension non supervisée

4.4.1. ACP: analyse en composantes principales

4.4.2. Projection aléatoire

4.4.3. Accumulation de fonctionnalités