[Python] Débarrassez-vous de la datation avec des expressions régulières

Le début de ça

Je collectais des données sur Twitter, mais après cela, je les ai laissées seules. Donc, quand je regarde les données pendant une longue période, le tweet mystérieux de la ville, de la ville et du village de rencontres fav0 est Wansaka Wansaka ……. Je l'ai trouvé en cherchant sur Twitter.

image.png

Le nom d'utilisateur était si obscène que je l'ai caché ... Quel est ce mot mystérieux ... C'était un peu plus de phrase avant ...? Et avant, je spécifiais un mot spécifique, et quand il frappait, je disais au revoir, mais il n'y a pas de mot commun qui puisse être spécifié avec ce nombre de caractères.

Je vais donc le supprimer avec une expression régulière.

La source

Dokan avec chaque échantillon de contrôle de fonctionnement. Tuyau en terre.

À première vue, comme un motif de murmure ① "Un caractère de Hira Kana" "Hira Kana ou ponctuation" "Nom municipal" ② "Pseudonyme simple 3 caractères" "Symbole" "Nom municipal" Puisque ce sont les deux, remplacez le correspondant par un blanc, puis supprimez la ligne vide.

Les données sont dans un bloc de données, donc je vais réussir à le faire là-bas. Cela fait un moment que je n'ai pas eu de temps avec Python. C'est bientôt fini.

import pandas as pd
import re
DF_samp=pd.DataFrame({'col_0': {'row_0': "Oh Osaka City", 'row_1': "Oups, la ville d'Osaka aaa", 'row_2': "Oups, Osaka City"},'col_1': {'row_0': 3, 'row_2': 4, 'row_3': 5},})
cols=DF_samp.col_0
cols0=cols.str.replace("[Ah-De][Ah-De][!-/:-@?[-`{-~.. , ... \].+[ville|village|ville]$|[Ah-De][Ah-De!-/:-@?[-`{-~.. , ... \].+[ville|village|ville]$", '')
DF_samp.col_0=cols0
DF_samp.dropna(subset=['col_0'])

Avec cela, seules les phrases mystérieuses correspondantes ont été éliminées. Yattane. J'ai l'impression d'entendre la voix me demander si je me substitue là-bas, mais je n'aime pas ça depuis longtemps ...

Et maintenant

J'ai réalisé qu'un nouveau modèle pourrait survenir si cela était vu par le personnel du BOT ... À ce moment-là, cependant.

Quoi qu'il en soit, je veux être dans un monde où je peux bloquer efficacement! Eh bien, c'est l'API qui collecte les tweets, donc cette fois ce n'est pas lié aux blocages.

Recommended Posts

[Python] Débarrassez-vous de la datation avec des expressions régulières
Débarrassez-vous des données sales avec Python et les expressions régulières
Gestion des expressions régulières par PHP / Python
[Python] Expressions régulières Expressions régulières
Remplacer non-ASCII par des expressions régulières en Python
Python: analyse morphologique simplifiée avec des expressions régulières
Débarrassez-vous des images DICOM en Python
Obtenez des informations sur le processeur de Raspberry Pi avec Python
Obtenez date avec python
Obtenez l'état de fonctionnement de JR West avec Python
Obtenez le code du pays avec python
Obtenez la chronologie Twitter avec Python
Obtenez des données Youtube avec python
Débarrassez-vous de KeyError de python
Extraire des nombres avec des expressions régulières
Obtenir l'ID de thread avec python
Manipulation d'expressions régulières par Python
À propos de Python et des expressions régulières
Commencez avec Python! ~ ② Grammaire ~
Obtenez des stocks avec Python
Obtenir le répertoire personnel avec python
Obtenir un événement de clavier avec python
Obtenez des informations sur l'alambic avec Python
Obtenez une liste des livres électroniques DMM achetés avec Python + Selenium
Exemple d'analyse HTTP GET et JSON avec Pepper Python
Récupérez la source de la page à charger indéfiniment avec python.
Débarrassez-vous de slow scp -pr
Commencez avec Python! ~ ① Construction de l'environnement ~
Lien pour commencer avec python
Obtenez des avis avec l'API googlemap de python
Je ne me souviens pas des expressions régulières Python
Obtenez une capture d'écran Web avec python
Obtenez la météo avec les requêtes Python 2
[Python] Obtenez des données économiques avec DataReader
Premiers pas avec Python Bases de Python
Comment démarrer avec Python
Remplacement de chaîne par une expression régulière Python
Jeu de vie avec Python! (Le jeu de la vie de Conway)
[Petite histoire] Obtenez l'horodatage avec Python
10 fonctions du "langage avec batterie" python
Obtenez les tendances Qiita avec le scraping Python
Implémentation de la méthode Dyxtra par python
Coexistence de Python2 et 3 avec CircleCI (1.0)
Démarrez avec Python avec Blender
Obtenez des informations météorologiques avec Python et le grattage
Lors de l'utilisation d'expressions régulières en Python
Etude de base d'OpenCV avec Python
Technique Python pour ceux qui veulent se débarrasser des débutants
Obtenez une liste de fichiers dans un dossier avec python sans chemin
PhytoMine-I a essayé d'obtenir les informations génétiques de la plante avec Python
Obtenez la largeur du div côté serveur avec Selenium + PhantomJS + Python
Chevauchement d'expressions régulières en Python et Java
Obtenez des données supplémentaires vers LDAP avec python
Bases du traitement d'images binarisées par Python
Obtenez des informations sur la propriété en grattant avec python
[Exemple d'amélioration de Python] Apprentissage de Python avec Codecademy
Obtenir le code HTML de l'élément avec du sélénium Python
[Note] Obtenir des données de PostgreSQL avec Python
Comment se débarrasser des longues inclusions