Cet article est l'article du 9ème jour de Furukawa Lab Advent_calendar. Cet article a été rédigé par un étudiant du Furukawa Lab dans le cadre de leur apprentissage. Le contenu peut être ambigu ou l'expression peut être légèrement différente.
Je voulais dessiner un article pour présenter Ensemble de données de préférence de boisson, mais le programme n'est pas encore en cours d'exécution. , Je vais le modifier de temps en temps.
Beverage Preference Data Set
L'ensemble de données sur les préférences en matière de boissons est constitué des données réelles des données connexes publiées par le laboratoire Furukawa. Veuillez consulter le lien pour les règles détaillées.
Données d'une enquête menée auprès de 604 utilisateurs sur la façon d'évaluer 14 types d'eau potable dans chacune des 11 situations.
En d'autres termes, ce sont les données relationnelles observées par la combinaison des éléments des trois populations (personne) x (eau potable) x (situation).
import La procédure d'importation de l'ensemble de données de préférence de boisson est la suivante. Les méthodes download_file et zip_extract Astuces Python: je souhaite télécharger un fichier zip sur Internet et l'utiliser J'ai emprunté à.
import pandas as pd
import numpy as np
filename = download_file('http://www.brain.kyutech.ac.jp/~furukawa/beverage-e/BeveragePreferenceDataset.zip')
zip_extract(filename)
df = pd.read_table('./BeveragePreferenceDataset/Beverage604.txt', header=None, delim_whitespace=True)
df.shape
# (8456, 11)
Convertissez ce Dataframe en données de tenseur cubique.
X = np.zeros((604, 14, 11))
for i in range(X.shape[0]):
Before = i * 14
X[i] = df.iloc[Before:(14*(i+1))].values
X.shape
# (604, 14, 11)
À propos de la décomposition CP Pioneer (décomposition tenseur avec pytorch (décomposition CP)) est ici, donc je vais l'expliquer légèrement.
La décomposition CP est une généralisation simple de la décomposition matricielle, qui décompose le tenseur cubique $ X $ en utilisant trois vecteurs comme suit:
U (utilisateur) est pulvérisé sous une forme ovale, et V (eau potable) est susceptible d'être différent des autres par seulement deux types.
J'aimerais essayer HOSVD et Tucker. Je réessayerai quand j'aurai le temps. Cette fois, j'ai essayé une méthode de décomposition tenseur linéaire, mais il existe aussi un * Tensor SOM * qui correspond à une décomposition tenseur non linéaire. Si vous êtes intéressé, essayez de jouer avec le lien ci-dessous.
TensorSOM3 Viewer (données sur l'eau potable) ver japonais
Recommended Posts