J'ai dû formater les données désordonnées avec des octets, c'est donc un mémo à ce moment-là Le gribouillage de ce que j'ai fait dans R à propos de janvier est ici. import Importation d'un outil d'analyse de données familier
Cependant, comme nous traitons souvent des données qui couvrent de nombreux fichiers, glob est également importé !! pandas
data = pd.read_csv("nom de fichier.csv")
--pd.read_ file format () prend en charge divers formats de fichiers
datas = glob.glob('*')
Si vous avez un grand nombre de fichiers, cela vous donnera tous les fichiers du répertoire.
Dans le cas des pandas, le fichier appelé n'est pas un tableau numpy, mais un type DataFrame.
C'est un dépouillement de la partie inquiétante.
data.drop([1,2])
#Ligne claire
data.drop([1,2],axis=1)
#Effacer les colonnes
En faisant cela, vous pouvez effacer la ligne et la colonne.
pd.concat([data[1],data[0]])
#Joindre des lignes
pd.concat([data[1],data[0]],axis=1)
#Rejoindre les colonnes
Ceci est utile lorsque vous avez beaucoup de fichiers et de données!
Seules les données que vous voulez!
data.query("1==2")
Désormais, vous ne pouvez avoir qu'une colonne nommée 1 avec une valeur de 2.
Indispensable lors du moulage de fichiers pour dériver des relations de données!
pd.merge(data1, data, on='Nom de colonne')
Cela collera les données avec les mêmes valeurs de colonne.
La patience est importante pour la mise en forme directe des données! Après cela, vous pouvez le faire immédiatement en utilisant pour etc. Il est facile de bien permuter les colonnes et les lignes en créant un tableau de numpy et un fichier au milieu. Pensez aux données que vous voulez et travaillez dur pour y parvenir. Merci d'avoir lu ma pauvre note.
Recommended Posts