TL;DR
En utilisant l'accesseur str, vous pouvez facilement créer un masque avec des spécifications de colonne par correspondance partielle. (Exemple: df.columns.str.contains ('nom de colonne arbitraire')
)
Le point est
Donc si vous voulez l'utiliser
#Dans ce cas, retirez plusieurs colonnes
include_list = df.columns[df.columns.str.contains('hoge_') * df.columns.str.contains('fuga_')]
df_prep = df[include_list]
#Dans ce cas, extraire autre chose que plusieurs colonnes
# Point:tilde(~)Inverse le masque en utilisant
exclude_list = df.columns[~df.columns.str.contains('hoge_') * ~df.columns.str.contains('fuga_')]
df_prep = df[exclude_list]
De plus, il existe des options case
(sensible à la casse) et regex
(utilisation d'un modèle d'expression régulière), vous pouvez donc l'utiliser de manière flexible.
Cette fois, je l'ai fait pour la colonne, mais vous pouvez faire de même lorsque vous souhaitez extraire une chaîne de caractères arbitraires d'une colonne spécifique, par exemple.
df['user'].str.contains('Ruri')
Recommended Posts