[En gros] Clustering par K Means

Aperçu

approche

  1. Stocker les données dans dataframe
  2. Détermination du nombre de clusters
  3. Clustering avec KMeans
  4. Sortez le résultat du clustering

code

import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
from collections import Counter

##Préparer le dataframe df###

num_clus = 4 #Définir le nombre de clusters
kmeans = KMeans(n_clusters=num_clus, random_state=0).fit(df)

print(Counter(kmeans.labels_)) #Sortie du nombre de personnes dans chaque cluster

df['cluster_id']=kmeans.labels_ #Ajouter le numéro de cluster à la trame de données d'origine

for i in range(0,num_clus): #Sortie de la valeur moyenne de chaque cluster
    print(df[df['cluster_id']==i].mean())

Recommended Posts

[En gros] Clustering par K Means
Expérience de clustering par échantillonnage
Extraire la couleur dominante de l'image par clustering k-means
Clustering et analyse en composantes principales par méthode K-means (débutant)
Essayez d'utiliser scikit-learn (1) - Clustering K par méthode moyenne
Classer les données par la méthode k-means
AI explicable ~ Clustering k-moyennes et k-médianes explicables ~
100 traitement du langage knock-97 (en utilisant scicit-learn): clustering k-means
Essayez de classer les livres d'O'Reilly en les regroupant