Il y a quelques jours, une recherche sur Facebook appelée HiPlot Une nouvelle bibliothèque de dessins de données a été annoncée.
https://github.com/facebookresearch/hiplot
Que diriez-vous du ReadMe de git parce que c'était simple? J'ai pensé, Quand je l'ai utilisé, j'ai senti l'avenir, alors je vais le partager.
HiPlot est un outil de dessin spécialisé dans la découverte de corrélations et de modèles de données. Je ne suis pas sûr, alors regardez la vidéo suivante.
De cette façon, non seulement dessiner les données Vous pouvez sélectionner, filtrer et exclure des données de manière interactive.
Il y a un échantillon qui peut être déplacé dans le document officiel, veuillez donc le toucher.
Vous pouvez l'installer à partir de pip.
pip install hiplot
Pour l'utiliser, il suffit de transmettre les données de type dictionnaire ou le chemin du fichier CSV à HiPlot.
import pandas as pd
import hiplot as hip
#pandas → dictionnaire → HiPlot
train = pd.read_csv('../input/titanic/train.csv')
# orient='records'Doit être transmis.
import_dict = train.to_dict(orient='records')
dict_hip = hip.Experiment.from_iterable(import_dict)
dict_hip.display()
#Directement depuis csv
csv_hip = hip.Experiment.from_csv('../input/titanic/train.csv')
csv_hip.display()
En outre, le graphique créé peut être enregistré au format html.
dict_hip.to_html()
Intuitif et facile à utiliser, pas seulement pour l'analyse initiale des données Je pense qu'il peut être utilisé dans divers aspects tels que le réglage des hyper paramètres pendant l'apprentissage.
De plus, comme il est extrêmement léger, il peut être utilisé sans stress.
J'ai l'impression que les fonctions ne sont pas encore complètes, probablement parce qu'il vient de sortir. C'est un peu gênant car il n'y a pas de fonction pour revenir à l'opération précédente.
C'est encore un nouvel outil, j'ai donc l'impression qu'il manque fonctionnellement. Je pense que c'est un outil utile.
Lorsque vous faites de l'EDA avec kaggle, pourquoi ne pas plonger d'abord dans cette bibliothèque?
Recommended Posts