scikit-learn Comment utiliser le résumé (apprentissage automatique)

Analyse de clustering (méthode des k-moyennes)

・ Entrez la trame de données en df et le nombre de clusters en num. -Spécifier un entier de départ aléatoire avec random_state

def clustering_analytics(df, num):
    df_temp = df.copy()
    from sklearn.preprocessing import StandardScaler
    from sklearn.cluster import KMeans
    sc = StandardScaler()
    #Standardisation
    df_std = sc.fit_transform(df_temp)
    
    kmeans = KMeans(n_clusters=num, random_state=0)
    clusters = kmeans.fit(df_std)
    df_temp["cluster"] = clusters.labels_
    return df_temp

Analyse en composantes principales (ACP)

・ Entrez le bloc de données en df et le nombre de composants principaux en num.

def PCA_analytics(df, num):
    from sklearn.preprocessing import StandardScaler
    from sklearn.decomposition import PCA
    import numpy as np
    sc = StandardScaler()
    df_temp = df.copy()
    #Standardisation
    df_std = sc.fit_transform(df_temp)
    pca = PCA(n_components = num)
    pca.fit(df_std)
    df_temp__pca = pca.transform(df_std)
    pca_df = pd.DataFrame(df_temp__pca)
    
    print('composants, principaux composants')
    print(pca.components_)
    print('moyen, moyen')
    print(pca.mean_)
    print('covariance, matrice de covariance')
    print(pca.get_covariance())
    W, v = np.linalg.eig(pca.get_covariance())
    print('vecteur propre, vecteur propre')
    print(v)
    print('valeur propre, valeur unique')
    print(W)
    return pca_df

Recommended Posts

scikit-learn Comment utiliser le résumé (apprentissage automatique)
Résumé de l'utilisation de pandas.DataFrame.loc
Résumé de l'utilisation de pyenv-virtualenv
Résumé de l'utilisation de csvkit
Comment collecter des données d'apprentissage automatique
Comment utiliser l'apprentissage automatique pour le travail? 03_Procédure de codage Python
[Python] Résumé de l'utilisation des pandas
Introduction à l'apprentissage automatique: fonctionnement du modèle
[Python2.7] Résumé de l'utilisation d'unittest
Comment profiter de Coursera / Machine Learning (semaine 10)
Résumé de l'utilisation de la liste Python
[Python2.7] Résumé de l'utilisation du sous-processus
Comment utiliser l'apprentissage automatique pour le travail? 01_ Comprendre l'objectif de l'apprentissage automatique
Comment utiliser xml.etree.ElementTree
Résumé du didacticiel d'apprentissage automatique
Comment utiliser Python-shell
Remarques sur l'utilisation de tf.data
Comment utiliser virtualenv
Comment utiliser Seaboan
Comment utiliser la correspondance d'image
Comment utiliser le shogun
Comment utiliser Pandas 2
Apprentissage automatique ⑤ Résumé AdaBoost
Comment utiliser Virtualenv
Comment utiliser numpy.vectorize
Comment utiliser pytest_report_header
Comment utiliser partiel
Comment utiliser Bio.Phylo
Comment utiliser SymPy
Comment utiliser x-means
Comment utiliser WikiExtractor.py
Comment utiliser IPython
Comment utiliser virtualenv
Comment utiliser Matplotlib
Comment utiliser iptables
Comment utiliser numpy
Comment utiliser TokyoTechFes2015
Comment utiliser venv
Comment utiliser le dictionnaire {}
Comment utiliser Pyenv
Comment utiliser la liste []
Comment utiliser python-kabusapi
Comment utiliser OptParse
Comment utiliser le retour
Comment utiliser pyenv-virtualenv
Introduction à l'apprentissage automatique
Comment utiliser imutils
Résumé de l'utilisation de MNIST avec Python
Comment utiliser l'apprentissage automatique pour le travail? 02_Aperçu du projet de développement AI
Comment utiliser Qt Designer
Comment utiliser la recherche triée
[gensim] Comment utiliser Doc2Vec
python3: Comment utiliser la bouteille (2)
Comprendre comment utiliser django-filter
Une introduction à l'apprentissage automatique
Comment utiliser le générateur
[Python] Comment utiliser la liste 1