Notez les opérations que j'oublie souvent lors de l'écriture de python en tant qu'utilisateur R. Même si je cherchais à chaque fois "R% in% in python", je ne pouvais pas trouver les informations que je voulais immédiatement.
Trame de données: iris Nom de colonne spécifique: Espèce Éléments multiples: cond (extrait uniquement "setosa" ou "virginica")
Les opérations qui peuvent être écrites à l'aide de l'opérateur% in% dans R sont
### R ###
library(dplyr)
cond <- c("setosa", "virginica")
df <- iris %>% dplyr::filter(., Species %in% cond)
Avec Pandas, vous pouvez écrire avec .isin ().
### python ###
import pandas as pd
from sklearn import datasets
###préparation du jeu de données iris
iris_sk = datasets.load_iris()
iris = pd.DataFrame(iris_sk.data, columns=iris_sk.feature_names)
iris['Species'] = iris_sk.target_names[iris_sk.target]
cond = ["setosa", "virginica"]
df = iris[iris["Species"].isin(cond)]
Si vous souhaitez exclure les lignes correspondantes, utilisez respectivement !
Et ~
.
### R ###
df2 <- iris %>% dplyr::filter(., !Species %in% cond)
### Python ###
df2 = iris[~iris["Species"].isin(cond)]
Recommended Posts