[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)

[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)

Il existe plusieurs façons de créer une seule table à l'aide de Pandas DataFrames.

Résumé de la méthode de base de fabrication.

Le moyen le plus rapide de lire la table de base est de la créer sous forme de fichier csv.


**table des matières**
  1. [Table à créer](# 1 Table à créer)
  2. [Créer à partir d'une liste 2D](# 22 Créer à partir d'une liste 2D)
  3. [Spécifiez le nom de la matrice plus tard](# 1 Spécifiez le nom de la matrice plus tard)
  4. [Spécifier comme option lors de la création d'une table](# 2 Spécifier comme option lors de la création d'une table)
  5. [Spécifiez la colonne qui sera le nom de ligne de la table](# 3 Spécifiez la colonne qui sera le nom de ligne de la table)
  6. [Créer à partir d'une liste à 1 dimension](Créer à partir d'une liste à 31 dimensions)
  7. [Combinez chaque liste](# 1 Combinez chaque liste ensemble)
  8. [Combinez chaque liste une par une](# 2 Rejoignez chaque liste une par une)
  9. [Combiner avec la formule](# 3 Combiner avec la formule)
  10. [Créer et lire avec un fichier csv](# 4 Créer et lire avec un fichier csv)
  11. [Liste des méthodes utilisées](# 5 Liste des méthodes utilisées)

## 1. 1. Table à créer Créez le tableau ci-dessous.
image.png

--Nom de la colonne: row0 ~ row5


## 2. Créé à partir d'une liste à deux dimensions ** ■ Qu'est-ce qu'un tableau à deux dimensions ** `[['A','B',,],['C','D',,],,,]`

Une liste unidimensionnelle ['A', 'B' ,,] dans le même [] en parallèle.

Vérifiez avec les 3 modèles suivants. (1) Spécifiez le nom de la matrice ultérieurement (2) Facultatif lors de la création d'une table (3) Spécifiez la colonne qui sera le nom de ligne de la table


### (1) Spécifiez le nom de la matrice ultérieurement

** ▼ Procédure ** ① Faites de chaque ligne une liste ② Convertir en table ③ Changer le nom de la ligne ④ Changer le nom de la colonne


** ① Disposez chaque ligne en parallèle comme une liste **

Tableau bidimensionnel


list = [
[1, 100, 0.33, 'AAA', 'AAA100'], 
[2, 200, 0.67, 'BBB', 'BBB200'], 
[3, 300, 1, 'CCC', 'CCC300'], 
[4, 400, 1.33, 'DDD', 'DDD400'], 
[5, 500, 1.67, 'EEE', 'EEE500'], 
[6, 600, 2, 'FFF', 'FFF600']]

** ② Convertir en tableau ** `pd.DataFrame(list)` └ Convertissez en une table avec pandas DataFrame.

Convertir en table


df = pd.DataFrame(list)
df
image.png

Les noms de ligne et de colonne recevront automatiquement des numéros.


** ③ Changer le nom de la ligne ** `df.index = ['A','B',,,]`

-Changez le nom de la ligne (index) par le nom spécifié. -Match le nombre d'éléments ** dans [] avec le nombre de lignes **. Sinon, une erreur.

Renommer la ligne


df.index = ['row0','row1','row2','row3','row4','row5']
df
image.png

** ④ Changer le nom de la colonne ** `df.columns = ['a','b',,,]`

-Modifiez le nom de la colonne par le nom spécifié. -Match le nombre d'éléments ** dans [] avec le nombre de lignes **. Sinon, une erreur.

Renommer la colonne


df.columns = ['col0','col1','col2','col3','col4']
df
image.png

Ceci termine.


### (2) Facultatif lors de la création d'une table

** ▼ Procédure ** ① Faites de chaque ligne une liste (2) Convertir en table (spécifier le nom de la matrice en option) Option 2-1 colonnes Option d'index 2-2


** ① Disposez chaque ligne en parallèle comme une liste **

Tableau bidimensionnel


list = [
[1, 100, 0.33, 'AAA', 'AAA100'], 
[2, 200, 0.67, 'BBB', 'BBB200'], 
[3, 300, 1, 'CCC', 'CCC300'], 
[4, 400, 1.33, 'DDD', 'DDD400'], 
[5, 500, 1.67, 'EEE', 'EEE500'], 
[6, 600, 2, 'FFF', 'FFF600']]

** ② Convertir en table (spécifier le nom de la matrice en option) ** `pd.DataFrame(list, index=['A','B',,,], columns=['a','b',,,])` └ "list": tableau à tabuler └ index = ['A', 'B' ,,,]: option d'index └ colonnes = ['a', 'b' ,,,]: option de colonnes └ L'option [] peut être spécifiée comme variable.

Nom de matrice facultatif


ind = ['row0','row1','row2','row3','row4','row5']
col = ['col0','col1','col2','col3','col4']

df = pd.DataFrame(list, index=ind, columns=col)
df
image.png

Ceci termine.


### (3) Spécifiez la colonne qui sera le nom de ligne de la table

** ▼ Procédure ** ① Faites de chaque ligne une liste ② Convertir en table ③ Changer le nom de la colonne ④ Spécifiez la colonne qui sera le nom de la ligne


** ① Faites de chaque ligne une liste ** Incluez les noms de ligne dans un tableau à deux dimensions.

Tableau bidimensionnel


list = [
['row0', 1, 100, 0.33, 'AAA', 'AAA100'], 
['row1', 2, 200, 0.67, 'BBB', 'BBB200'], 
['row2', 3, 300, 1, 'CCC', 'CCC300'], 
['row3', 4, 400, 1.33, 'DDD', 'DDD400'], 
['row4', 5, 500, 1.67, 'EEE', 'EEE500'], 
['row5', 6, 600, 2, 'FFF', 'FFF600'], ]

** ② Convertir en tableau ** `pd.DataFrame(list)` └ "list": variable contenant des données de tableau

Convertir en table


df = pd.DataFrame(list)
df
image.png

Les noms de ligne et de colonne recevront automatiquement des numéros.


** ③ Changer le nom de la colonne ** `df.columns = ['a','b',,,]`

-Modifiez le nom de la colonne par le nom spécifié. -Match le nombre d'éléments ** dans [] avec le nombre de lignes **. Sinon, une erreur.

Renommer la colonne


df.columns =  ['','col0','col1','col2','col3','col4']
df
image.png

** ④ Spécifiez la colonne qui sera le nom de la ligne ** `set_index ('nom de la colonne')`

Spécifiez la colonne qui sera le nom de la ligne


df = df.set_index('')
df
image.png

Le nom de colonne "''" a été défini dans l'en-tête.


## 3.1 Créé à partir d'une liste unidimensionnelle

Vérifiez avec les 3 modèles suivants. (1) Combinez chaque liste ensemble (2) Combinez chaque liste une par une (3) Combiner avec la formule


### (1) Combinez chaque liste ensemble

** ▼ Procédure ** ① Créez une liste pour chaque ligne ② Convertir en une table à la fois ③ Changer le nom de la ligne ④ Changer le nom de la colonne


** ① Créez une liste pour chaque ligne **

Créer une liste


listA = [1, 100, 0.33, 'AAA', 'AAA100']
listB = [2, 200, 0.67, 'BBB', 'BBB200']
listC = [3, 300, 1, 'CCC', 'CCC300']
listD = [4, 400, 1.33, 'DDD', 'DDD400']
listE = [5, 500, 1.67, 'EEE', 'EEE500']
listF = [6, 600, 2, 'FFF', 'FFF600']

** ② Convertissez tous ensemble en une table ** `pd.DataFrame([A,B,,,])` └ Liste unidimensionnelle "A" "B" └ Le nombre d'éléments est égal

Convertir en une table à la fois


pd.DataFrame([listA,listB,listC,listD,listE,listF])
image.png

** ③ Changer le nom de la ligne ** `df.index = ['A','B',,,]`

-Changez le nom de la ligne (index) par le nom spécifié. -Match le nombre d'éléments ** dans [] avec le nombre de lignes **. Sinon, une erreur.

Renommer la ligne


df.index = ['row0','row1','row2','row3','row4','row5']
df
image.png

** ④ Changer le nom de la colonne ** `df.columns = ['a','b',,,]`

-Changez les noms de colonne en nom spécifié -Match le nombre d'éléments ** dans [] avec le nombre de lignes **. Sinon, une erreur.

Renommer la colonne


df.columns = ['col0','col1','col2','col3','col4']
df
image.png

Ceci termine.


### (2) Combinez chaque liste une par une

** ▼ Procédure ** ① Créez une liste pour chaque ligne ② Créer un tableau ③ Ajouter une colonne au tableau ④ Changer le nom de la ligne ⑤ Transfert


** ① Créez une liste pour chaque ligne **

Créer une liste


listA = [1, 100, 0.33, 'AAA', 'AAA100']
listB = [2, 200, 0.67, 'BBB', 'BBB200']
listC = [3, 300, 1, 'CCC', 'CCC300']
listD = [4, 400, 1.33, 'DDD', 'DDD400']
listE = [5, 500, 1.67, 'EEE', 'EEE500']
listF = [6, 600, 2, 'FFF', 'FFF600']

** ② Créer un tableau ** Générez une table à partir d'une liste. `pd.DataFrame(list, columns=['A'])` └ "listA": données de séquence └ "columns = ['A']": définissez le nom de la colonne sur A

Créer une table


df= pd.DataFrame(listA, columns=['row0'])
df

image.png

└ Décrivez `` nom de la colonne ': [tableau] `dans ({})

Créer avec le nom de la colonne ①


pd.DataFrame({'row0':[1, 100, 0.33, 'AAA', 'AAA100']})
image.png

Créer avec le nom de la colonne (plusieurs colonnes)


pd.DataFrame({'row0':[1, 100, 0.33, 'AAA', 'AAA100'], 'row1':[2, 200, 0.67, 'BBB', 'BBB200']})
image.png

** ③ Ajouter une colonne au tableau ** `df['B'] = pd.DataFrame(list)` └ "B": nom de colonne à ajouter └ "liste": données de table à ajouter

Ajouter une colonne à la table


df['row1'] = pd.DataFrame(listB)
df['row2'] = pd.DataFrame(listC)
df['row3'] = pd.DataFrame(listD)
df['row4'] = pd.DataFrame(listE)
df['row5'] = pd.DataFrame(listF)
df

image.png


** ④ Changer le nom de la ligne ** `df.index = ['A','B',,,]`

Renommer la ligne


df.index = ['col0','col1','col2','col3','col4']
df

image.png


** ⑤ Déménagement ** `df.T` └ Permutez la matrice.

Translocation


df = df.T
df
image.png

Ceci termine.


### (3) Combiner avec la formule Si chaque colonne a une régularité, vous pouvez utiliser des formules pour joindre les colonnes.
image.png

** ▼ Régularité **

** ▼ Procédure ** ① Créer une liste ② Créer un tableau ③ Ajoutez une colonne au tableau à l'aide d'une formule ④ Changer le nom de la ligne


** ① Créer une liste ** Créez une colonne de base.

Deux pour col0 et col3.

Créer une liste


listA = [1,2,3,4,5,6]
listD = ['AAA', 'BBB', 'CCC', 'DDD', 'EEE', 'FFF']

** ② Créer un tableau ** `pd.DataFrame(list, columns=['A'])` └ "listA": données de séquence └ "columns = ['A']": définissez le nom de la colonne sur A

Créer une table


df = pd.DataFrame(listA, columns=['col0'])
df
image.png

** ③ Ajoutez une colonne au tableau en utilisant une formule ** ・ `Df ['B'] = df ['A'] / 2` └ "B": nom de colonne à ajouter └ "df ['A']" / 2: remplacez la valeur du nom de colonne existant A par 2.

Df ['C'] = df ['A'] + df ['B'] └ Combinez les valeurs des colonnes "A" et "B" └ * str + int est une erreur (correspond au type)

Df ['A']. Astype (str) └ Changer la colonne «A» en type «str»

Ajouter des colonnes au tableau à l'aide de formules


df['col1'] = df['col0'] * 100
df['col2'] = df['col0'] / 3
df['col3'] = pd.DataFrame(listD)
df['col4'] = df['col3'] + df['col1'].astype(str)
df
image.png

** ④ Changer le nom de la ligne ** `df.index = ['A','B',,,]`

Renommer la ligne


df.index=['row0','row1','row2','row3','row4','row5']
df
image.png

Ceci termine.


## 4. Créer et lire avec un fichier csv

** ▼ Procédure ** ① Créer une table avec un fichier csv ② Importer avec la méthode read_csv └ Spécifiez la colonne d'en-tête


** ① Créez une table avec un fichier csv ** Créez un tableau comme celui ci-dessous.

image.png


** ② Importer avec la méthode read_csv ** `read_csv ('Falpath', index_col = n)` └ "'File path'": le chemin absolu ou le chemin relatif est OK └ "index_col = n": spécifiez le numéro de colonne (n: entier) qui sera l'en-tête
** ▼ Lors de la lecture du fichier test.csv du bureau **

Lire le fichier csv


import pandas as pd
pd.read_csv('~/desktop/test.csv', index_col=0)
image.png

Ceci termine.

Cliquez ici pour une liste d'options de lecture des fichiers csv (https://qiita.com/yuta-38/items/e1e890a647e77c7ccaad)


## 5. Liste des méthodes utilisées ・ `Pd.DataFrame (liste)` └ Convertir la liste en tableau

Pd.DataFrame ([A, B ,,,]) └ Convertissez une liste à une dimension en un tableau à la fois

Df.index = ['A', 'B' ,,,] └ Changer le nom de la ligne

Df.colonnes = ['a', 'b' ,,,] └ Changer le nom de la colonne

Pd.DataFrame (liste, index = ['A', 'B' ,,,]) └ Spécifiez le nom de la ligne lors de la création du tableau

Pd.DataFrame (liste, colonnes = ['a', 'b' ,,,]) └ Spécifiez le nom de la colonne lors de la création de la table

Pd.DataFrame ({'A': [1,2 ,,], 'B': [3,4 ,,],}) └ Spécifiez le nom de la colonne lors de la création de la table └ Décrivez `` nom de la colonne ': [tableau] `dans ({})

Set_index ('a') └ Spécifiez la colonne qui sera le nom de la ligne

Df ['b'] = pd.DataFrame (liste) └ Ajouter une colonne (nom de colonne b) à la table (df)

Df.T └ Translocation

Df ['B'] = df ['A'] / 2 └ "B": nom de colonne à ajouter └ "df ['A']" / 2: remplacez la valeur du nom de colonne existant A par 2.

Df ['C'] = df ['A'] + df ['B'] └ Combinez les valeurs des colonnes "A" et "B" └ * str + int est une erreur (correspond au type)

Df ['A']. Astype (str) └ Changer la colonne «A» en type «str»

[['A', 'B' ,,], ['C', 'D' ,,] ,,,] └ Tableau bidimensionnel


[Retourner en haut](#)

Recommended Posts

[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)
[Python] Mémo d'opération de pandas DataFrame
[Pandas_flavor] Ajouter une méthode de Pandas DataFrame
Pandas Python: recherchez DataFrame à l'aide d'expressions régulières
[python] Créer une table de pandas DataFrame vers postgres
[Python] Trier la table par sort_values (pandas DataFrame)
Résumé des opérations Excel utilisant OpenPyXL en Python
Fonctionnement de base de Python Pandas Series et Dataframe (1)
Résumé des arguments Python
Application Python: Pandas # 3: Dataframe
Résumé de la méthode d'essai
Comparaison de Python (+ Pandas), R, Julia (+ DataFrames) (résumé du contenu de la table, accès par colonne)
Résumé du tri Python (liste, type de dictionnaire, série, DataFrame)
Récapitulatif des méthodes Pandas utilisées lors de l'extraction de données [Python]
[Python] Utilisation de l'API Line [1ère création de Beauty Bot]
Résumé des choses qui étaient pratiques lors de l'utilisation de pandas
Résumé des opérations de liste Python3
python: principes de base de l'utilisation de scikit-learn ①
Résumé récent de l'étude des pandas python
Résumé de l'utilisation de base de Pandas
Comportement de la méthode pandas rolling ()
Analyse de données à l'aide de pandas python
Le pouvoir des pandas: Python
Conversion de Pandas DataFrame en System.Data.DataTable à l'aide de Python pour .NET
[Python] Extraction / combinaison de données aléatoires à partir de DataFrame en utilisant random et pandas
Résumé de base de la manipulation de données avec Python Pandas - Première moitié: création et manipulation de données
Jeu à la main Python (Pandas / DataFrame début)
[Python] Chargement de fichiers csv à l'aide de pandas
Capture d'image de Firefox en utilisant Python
Récapitulatif si vous utilisez AWS Lambda (Python)
Méthode de visualisation de données utilisant matplotlib (+ pandas) (5)
[Python] [Table des matières Liens] Programmation Python
Un bref résumé de la collection Python
Suppression de la brume à l'aide de Python detailEnhanceFilter
[Python] Comment ajouter des lignes et des colonnes à une table (pandas DataFrame)
Implémentation des notifications de bureau à l'aide de Python
Création de graphique Excel à l'aide de python xlwings
Résumé des différences entre Python et PHP (tableau de comparaison des principaux éléments)
Premiers pas avec python3
[Python] Quatre-vingt-dix-neuf tables utilisant des instructions for
[python] -1 signification de la méthode de remodelage de numpy
Méthode de visualisation de données utilisant matplotlib (+ pandas) (4)
Résumé des index et des tranches Python
[OpenCV; Python] Résumé de la fonction findcontours
Création d'interface graphique en python avec tkinter 2
[Python] Comment lire le fichier csv (méthode read_csv du module pandas)
Obtenez des images d'excellentes trouvailles / 47 sites en utilisant Python (1/2: Jusqu'à la création de la liste cible)
Python: principes de base de la reconnaissance d'image à l'aide de CNN
[Python] Qu'est-ce que la série pandas et DataFrame?
À propos de la création de l'interface graphique à l'aide de TKinter de Python
Création d'interface graphique en python à l'aide de tkinter partie 1
Résumé des méthodes fréquemment utilisées chez les pandas
Pratique d'utilisation de ceci en Python (mauvais)
Résumé de la méthode de spécification des paramètres de distribution gamma
Python + Selenium Résumé des méthodes d'opération fréquemment utilisées
Création d'animation flexible à l'aide de l'animation.FuncAnimation de matplotlib
Python: Application de la reconnaissance d'image à l'aide de CNN