L'histoire selon laquelle la nouvelle bibliothèque de dessins "HiPlot" était plutôt bonne

introduction

Il y a quelques jours, une recherche sur Facebook appelée HiPlot Une nouvelle bibliothèque de dessins de données a été annoncée.

https://github.com/facebookresearch/hiplot

Que diriez-vous du ReadMe de git parce que c'était simple? J'ai pensé, Quand je l'ai utilisé, j'ai senti l'avenir, alors je vais le partager.

Fonctionnalité

HiPlot est un outil de dessin spécialisé dans la découverte de corrélations et de modèles de données. Je ne suis pas sûr, alors regardez la vidéo suivante.

titanic_hiplot2.gif

De cette façon, non seulement dessiner les données Vous pouvez sélectionner, filtrer et exclure des données de manière interactive.

Il y a un échantillon qui peut être déplacé dans le document officiel, veuillez donc le toucher.

Document officiel

Comment utiliser

Vous pouvez l'installer à partir de pip.

pip install hiplot

Pour l'utiliser, il suffit de transmettre les données de type dictionnaire ou le chemin du fichier CSV à HiPlot.

import pandas as pd
import hiplot as hip

#pandas → dictionnaire → HiPlot
train = pd.read_csv('../input/titanic/train.csv')

# orient='records'Doit être transmis.
import_dict = train.to_dict(orient='records')
dict_hip = hip.Experiment.from_iterable(import_dict)
dict_hip.display()

#Directement depuis csv
csv_hip = hip.Experiment.from_csv('../input/titanic/train.csv')
csv_hip.display()

En outre, le graphique créé peut être enregistré au format html.

dict_hip.to_html()

bon point

Intuitif et facile à utiliser, pas seulement pour l'analyse initiale des données Je pense qu'il peut être utilisé dans divers aspects tels que le réglage des hyper paramètres pendant l'apprentissage.

De plus, comme il est extrêmement léger, il peut être utilisé sans stress.

Points subtils

J'ai l'impression que les fonctions ne sont pas encore complètes, probablement parce qu'il vient de sortir. C'est un peu gênant car il n'y a pas de fonction pour revenir à l'opération précédente.

À la fin

C'est encore un nouvel outil, j'ai donc l'impression qu'il manque fonctionnellement. Je pense que c'est un outil utile.

Lorsque vous faites de l'EDA avec kaggle, pourquoi ne pas plonger d'abord dans cette bibliothèque?

Recommended Posts

L'histoire selon laquelle la nouvelle bibliothèque de dessins "HiPlot" était plutôt bonne
L'histoire que XGBoost a finalement été installé
L'histoire selon laquelle la valeur de retour de tape.gradient () était None
L'histoire de la confusion entre la production japonaise et Django
L'histoire selon laquelle ma pull request a été intégrée à Scipy
L'histoire selon laquelle la version de python 3.7.7 n'était pas adaptée à Heroku
L'histoire selon laquelle le gardien était confiné lorsque le laboratoire a été converti à l'IoT
L'histoire selon laquelle l'API asynchrone qui combinait API Gateway et Step Functions était la plus forte
L'histoire que j'ai traitée parce qu'Apache était en panne à AH00144
L'histoire que FastAPI peut prendre la suprématie
L'histoire que scipy a soudainement arrêté de se charger
L'histoire de Django créant une bibliothèque qui pourrait être un peu plus utile