Comment gérer les trames de données

import pandas as pd
import numpy as np

Lire le fichier csv

df=pd.read_csv('〜〜〜.csv',header=None,names=('name', 'id'))

Spécifiez le nom de la colonne avec des noms = ~ ~. header = None empêche la première ligne d'être reconnue comme en-tête.

Remplacer une partie des données

df=df.replace('A B', 'UN B')
df=df.replace('B A', 'BA')

Divisez le texte dans une colonne de df en deux nouvelles colonnes

df2 = pd.concat([df, df['name'].str.split(' ', expand=True)], axis=1).drop('name', axis=1)

Extraire plusieurs colonnes de df

df=df.loc[:,["Nom de colonne","Nom de colonne","Nom de colonne"]]

Combinez DFS verticalement

df3=pd.concat([df1, df2])

Supprimer les lignes en double

df=df[~df.duplicated()]

Extraire les lignes qui remplissent les conditions

df[df["Nom de colonne"]=="~~"]

Liste de données

df_list=df.values.tolist()

Faire le tableau de la liste des colonnes

df_list=np.array(df['Nom de colonne'])

Recommended Posts

Comment gérer les trames de données
Comment gérer les données de séries chronologiques (mise en œuvre)
[Introduction à Python] Comment gérer les données au format JSON
Nettoyage des données Comment gérer les valeurs manquantes et aberrantes
Comment gérer une session dans SQLAlchemy
Comment lire les données de la sous-région e-Stat
Comment gérer les données déséquilibrées
Comment augmenter les données avec PyTorch
Comment gérer le japonais avec Python
Comment collecter des données d'apprentissage automatique
Comment collecter des données Twitter sans programmation
Comment gérer des valeurs consécutives dans MySQL
Comment utiliser "deque" pour les données Python
Comment lire les données de problème avec Paiza
Comment créer des exemples de données CSV avec hypothèse
[Django] Comment obtenir des données en spécifiant SQL.
[Python] Comment lire les données de CIFAR-10 et CIFAR-100
Comment récupérer des données de courses de chevaux avec Beautiful Soup
Comment utiliser les outils d'analyse de données pour les débutants
Comment obtenir des données d'article à l'aide de l'API Qiita
Comment lire les données de séries chronologiques dans PyTorch
Comment rechercher des données HTML à l'aide de Beautiful Soup
[Python] Comment gérer les caractères japonais avec openCV
Comment gérer le type datetime dans sqlite3 de python
Comment utiliser xml.etree.ElementTree
Comment utiliser Python-shell
Remarques sur l'utilisation de tf.data
Comment utiliser virtualenv
Grattage 2 Comment gratter
Comment utiliser Seaboan
Comment utiliser la correspondance d'image
Comment utiliser le shogun
Comment installer Python
Comment lire PyPI
Comment installer pip
Comment utiliser Virtualenv
Comment utiliser numpy.vectorize
Comment mettre à jour easy_install
Comment installer Archlinux
Comment utiliser pytest_report_header
Comment redémarrer gunicorn
Comment héberger virtuel
Comment déboguer le sélénium
Comment utiliser partiel
Comment utiliser Bio.Phylo
Comment lire JSON
Comment utiliser SymPy
Comment utiliser x-means
Comment utiliser WikiExtractor.py
Comment mettre à jour Spyder
Comment installer BayesOpt
Comment utiliser virtualenv
Comment utiliser Matplotlib
Comment utiliser iptables
Comment utiliser numpy
Comment utiliser TokyoTechFes2015
Comment utiliser venv
Comment utiliser Pyenv
Comment utiliser la liste []
Comment utiliser python-kabusapi
Comment installer Nbextensions