Scribble ce que j'ai utilisé lors de l'utilisation d'ipython dans le formatage des données de position

introduction

J'ai dû formater les données désordonnées avec des octets, c'est donc un mémo à ce moment-là Le gribouillage de ce que j'ai fait dans R à propos de janvier est ici. import スクリーンショット 2016-06-01 21.02.42.png Importation d'un outil d'analyse de données familier

スクリーンショット 2016-06-01 21.04.00.png Cependant, comme nous traitons souvent des données qui couvrent de nombreux fichiers, glob est également importé !! pandas

Lire le fichier

data = pd.read_csv("nom de fichier.csv")

--pd.read_ file format () prend en charge divers formats de fichiers

datas = glob.glob('*')

Si vous avez un grand nombre de fichiers, cela vous donnera tous les fichiers du répertoire.

Dans le cas des pandas, le fichier appelé n'est pas un tableau numpy, mais un type DataFrame.

スクリーンショット 2016-06-01 21.25.35.png

Effacer les colonnes et les lignes

C'est un dépouillement de la partie inquiétante.

data.drop([1,2])
#Ligne claire
data.drop([1,2],axis=1)
#Effacer les colonnes

En faisant cela, vous pouvez effacer la ligne et la colonne.

スクリーンショット 2016-06-01 21.31.15.png

Joindre des colonnes et des lignes

pd.concat([data[1],data[0]])
#Joindre des lignes
pd.concat([data[1],data[0]],axis=1)
#Rejoindre les colonnes

Ceci est utile lorsque vous avez beaucoup de fichiers et de données!

スクリーンショット 2016-06-01 21.40.16.png

Seules les lignes contenant les données souhaitées

Seules les données que vous voulez!

data.query("1==2")

Désormais, vous ne pouvez avoir qu'une colonne nommée 1 avec une valeur de 2.

スクリーンショット 2016-06-01 21.47.03.png

Tenez-vous en aux mêmes données

Indispensable lors du moulage de fichiers pour dériver des relations de données!

pd.merge(data1, data, on='Nom de colonne')

Cela collera les données avec les mêmes valeurs de colonne.

スクリーンショット 2016-06-01 21.56.45.png

finalement

La patience est importante pour la mise en forme directe des données! Après cela, vous pouvez le faire immédiatement en utilisant pour etc. Il est facile de bien permuter les colonnes et les lignes en créant un tableau de numpy et un fichier au milieu. Pensez aux données que vous voulez et travaillez dur pour y parvenir. Merci d'avoir lu ma pauvre note.

Recommended Posts

Scribble ce que j'ai utilisé lors de l'utilisation d'ipython dans le formatage des données de position
Qu'est-ce qui a été demandé lors de l'utilisation de Random Forest dans la pratique
Ce que je suis entré lors de l'utilisation de Tensorflow-gpu
[Question] Que se passe-t-il si vous utilisez% en python?
Que faire lorsque l'imitation est intégrée à Python
Ce à quoi j'étais accro lors de l'utilisation de Python tornado
Scripts pouvant être utilisés lors de l'utilisation de Bottle en Python
Problèmes lors de l'utilisation d'Elasticsearch comme source de données dans Redash
Lors de l'utilisation d'optparse avec iPython
Ce que j'ai appris en Python
J'obtiens un attribut impossible à définir lors de l'utilisation de @property en python
Ce sur quoi je suis tombé lors de l'utilisation de CodeIgniter sur un serveur Linux
Précautions lors de l'utilisation de Pit avec Python
Ce que je suis tombé sur l'utilisation d'Airflow
Lors de l'utilisation d'expressions régulières en Python
J'ai comparé l'utilisation de Dash et Streamlit dans l'environnement Docker en utilisant les données de la ligue B