Bonjour, c'est CE Sabo.
C'est le premier message de Qiita.
Je souhaite analyser les données en utilisant Python.
Dans un tel cas, la première chose à laquelle les débutants sont bloqués est la «lecture des données». (J'ai aussi trébuché au début.)
Que dois-je faire si les données que je souhaite analyser sont des données de tableau (données Excel, données CSV, etc.)?
Cette fois, je vais vous expliquer brièvement comment lire les fichiers Excel (.xlsx) et CSV (.csv) que vous utiliserez le plus souvent.
Le vrai code est juste ** 2 lignes **. Finissons-le rapidement et passons au monde de l'analyse de données.
・ Google Colaboratory
Nous utilisons Google Colaboratory, ce que toute personne disposant d'un compte Google peut faire.
Python dispose de nombreuses bibliothèques que vous pouvez utiliser pour analyser vos données.
Il est relativement facile à mettre en œuvre.
Cette fois, seuls les "pandas" sont OK.
#Importer des pandas
import pandas as pd
Vous pouvez utiliser n'importe quelle chaîne de caractères en définissant "as ~" sur celle importée.
Généralement, pandas est abrégé en pd.
Téléchargez le fichier que vous souhaitez lire dans Google Colaboratory. autre ① Comment écrire du code ② Comment lire un fichier local ③ Il semble qu'il existe une méthode pour monter et charger Google Drive (je le recommande personnellement), mais cette fois, je vais vous présenter la méthode la plus simple.
procédure
① Cliquez sur l'icône du fichier à l'extrême gauche ② Cliquez sur Télécharger (cadre rouge dans l'image) et sélectionnez le fichier que vous souhaitez lire, ou faites-le glisser et déposez-le.
Si vous n'avez pas beaucoup de données, cela se terminera bientôt, vous êtes donc prêt à partir.
Faisons-le maintenant. Le code est une ligne.
Utilisez les fonctions pandas read_excel et read_csv.
Comment utiliser Pour les fichiers Excel pd.read_excel (chemin du fichier) Pour le fichier CSV pd.read_csv (chemin du fichier) est.
Cette fois, nous allons charger Excel / CSV dans DataFrame, appelons-le donc df et df2 et chargez-le.
J'ai téléchargé les fichiers de données de date 2020 date_2020.xlsx et date_2020.csv dans Google Colaboratory cette fois, de sorte que le chemin ne peut être lu que par le nom du fichier.
La méthode de ①②③ mentionnée ci-dessus sera un peu plus longue.
#Charger le fichier Excel / CSV dans DataFrame
df = pd.read_excel("date_2020.xlsx")
df2 = pd.read_csv("date_2020.csv")
e? Êtes-vous inquiet si vous pouviez le lire à cause de cela?
S'il n'y a pas d'erreur, vous pouvez le lire, mais vérifions-le au cas où.
Les 5 premières lignes peuvent être affichées en utilisant le DataFrame.head () défini.
#Afficher la première ligne
df.head()
Résultat de sortie ↓
Il semble qu'il ait été lu fermement.
Vous pouvez également apprendre les détails et l'utilisation appliquée ↓
Recommended Posts