Dernier message [J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ①] Identique à (https://qiita.com/khigashimoto/items/80f0858b59379d461d97).
La dernière fois, j'ai essayé l'environnement suivant ①, mais cette fois je vais essayer l'environnement ②. --Environnement ① Analyse des données à l'aide de Python + Numpy + Pandas + α --Environnement (2) Analyse de données à l'aide d'outils BI (outils de Business Intelligence)
PC utilisé: Surface LTE Core i5-7300U, mémoire 8 Go Système d'exploitation PC utilisé: Microsoft Windows10 Pro 64 bits Navigateur utilisé: Microsoft Edge
-Environnement d'utilisation: Microsoft Power BI Desktop Ver 2.84.802.0 64 bits Vous pouvez obtenir PowerBI Desktop sur le Microsoft Store. La plupart des fonctions, y compris ce travail, peuvent être utilisées gratuitement.
Comme la dernière fois, j'emprunterai une partie du cours de science des données d'Udemy ci-dessous. [180 000 personnes dans le monde] Science des données Python pratique
L'analyse suivante liée au fameux «naufrage du Titanic» comme première étape de l'analyse des données sera réalisée cette fois avec l'outil BI.
・ Quel genre de personnes étaient les passagers du Titanic? (Sexe, âge, etc.) ・ Relation causale entre les caractéristiques susmentionnées et leur relation complexe et leur taux de survie
Obtenir des données localement (propre PC) Acquérir des données client au moment du naufrage du Titanic sous forme de données CSV auprès de kaggle. Je vais l'omettre car ce sera le même que l'article précédent, mais lorsque vous ouvrez les données client réelles dans Excel, cela ressemblera à ceci.
Apportez des données locales dans l'environnement et affichez un résumé Démarrez PowerBI Desktop et importez le fichier CSV enregistré.
-Depuis l'écran principal après le démarrage, sélectionnez "Icône Obtenir les données" ⇒ "Texte / CSV"
・ L'écran d'aperçu ressemble à ceci. Appuyez sur le bouton "Charger"
・ Lorsque vous revenez à l'écran principal, rien ne s'affiche, appuyez donc sur "l'icône de l'écran de données".
・ Vous pouvez voir les données lues
Puisque PowerBI Desktop est une application basée sur l'interface graphique (bien sûr ...), contrairement aux environnements basés sur CUI tels que Python, vous pouvez immédiatement obtenir une vue d'ensemble de l'état des données sur l'écran lui-même.
・ "Essayez d'utiliser un graphique à barres défini. Lorsque vous appuyez sur l'icône, le graphique s'affiche sur l'écran supérieur gauche.
-Faites glisser et déposez l'élément appelé Sex sur le côté droit de l'écran sur l'axe central et la valeur.
C'est bien de pouvoir travailler graphiquement avec ce type de convivialité comme Excel. En passant, je me suis senti un peu léger en faisant ce travail, et quand je l'ai vérifié avec le gestionnaire de tâches, c'était comme suit. Puisqu'il s'agira d'une application de bureau, j'ai pensé qu'il serait plus confortable d'avoir environ 16 Go de mémoire pour un PC Win10.
Quatre. Vérifiez le ratio hommes / femmes pour chaque classe de chambre La classe d'item P indique le grade de la salle. Je pourrais facilement faire la même chose avec PowerBI ici.
・ De même, sélectionnez le graphique à barres défini. Glissez et déposez l'item "Sex" vers "Axis" et "Value" et l'item Pclass vers "Legend".
Il est également possible d'inverser facilement l'axe. ・ De même, sélectionnez le graphique à barres défini. Faites glisser et déposez l'item "Sexe" vers "Légende" et "Valeur" et l'item Pclass vers "Axe".
Cinq. Créez des éléments (Personne) tels que "homme", "femme" et "enfant (moins de 16 ans)" en utilisant les éléments d'âge (âge) et de sexe (sexe). Commencez par créer une colonne Personne. J'ai essayé avec enthousiasme, mais pour le moment je n'ai pas réussi à bien générer des colonnes ... Nous pensons qu'il existe deux types d'insertion de colonnes. ・ Éditeur de requêtes Il s'agit d'une fonction dédiée au traitement des données d'origine selon le but de l'analyse sans modifier les données d'origine. Je viens de mentionner que je voudrais ajouter une colonne personnalisée à partir de cette fonction comme indiqué ci-dessous, mais le résultat sera une erreur.
・ Ajout de colonne pure Dans ce cas, la prochaine fois, j'ai essayé d'ajouter une colonne directement sur l'écran de données, mais malheureusement, cela entraîne également une erreur.
Hmm. .. .. Pour le moment, c'est la fin de la vérification. ..
En outre, les résultats d'une série d'essais d'analyse utilisant PowerBI sont joints ci-dessous. Je pense que c'est un bon point de PowerBI de pouvoir lister les résultats et obtenir une vue à vol d'oiseau côte à côte de cette manière.
Voici mes impressions de PowerBI Desktop que j'ai ressenties en faisant le travail ci-dessus.
Avantages
・ La méthode d'affichage est riche (belle)
-Comme il s'agit d'une application basée sur l'interface graphique, même les personnes qui n'écrivent pas de programmes peuvent facilement l'utiliser.
・ Plusieurs résultats peuvent être visualisés côte à côte.
Inconvénients
-Pour le traitement tel que le traitement des valeurs manquantes et la génération de données, cela peut être déroutant lorsque vous essayez d'effectuer un travail compliqué.
-Comme il n'y a pas tellement de références pour PowerBI lui-même, vous ne pouvez pas vous sentir libre de google lorsque vous avez des problèmes.
-Comme c'est une application qui utilise un vrai PC, ressent-elle un peu de lumière selon les spécifications du PC?
CaseA) Python qui peut être utilisé avec de nombreuses références et des flux détaillés pour des analyses complexes telles que le prétraitement et la génération de données supplémentaires. CaseB) PowerBI est un mécanisme d'affichage pour les travailleurs réels utilisant l'analyse de la lumière et les résultats après analyse en Python. Je pense qu'il vaut mieux vivre séparément et l'utiliser. Je pense à ce stade.
Recommended Posts