Je collectais des données sur Twitter, mais après cela, je les ai laissées seules. Donc, quand je regarde les données pendant une longue période, le tweet mystérieux de la ville, de la ville et du village de rencontres fav0 est Wansaka Wansaka ……. Je l'ai trouvé en cherchant sur Twitter.
Le nom d'utilisateur était si obscène que je l'ai caché ... Quel est ce mot mystérieux ... C'était un peu plus de phrase avant ...? Et avant, je spécifiais un mot spécifique, et quand il frappait, je disais au revoir, mais il n'y a pas de mot commun qui puisse être spécifié avec ce nombre de caractères.
Je vais donc le supprimer avec une expression régulière.
Dokan avec chaque échantillon de contrôle de fonctionnement. Tuyau en terre.
À première vue, comme un motif de murmure ① "Un caractère de Hira Kana" "Hira Kana ou ponctuation" "Nom municipal" ② "Pseudonyme simple 3 caractères" "Symbole" "Nom municipal" Puisque ce sont les deux, remplacez le correspondant par un blanc, puis supprimez la ligne vide.
Les données sont dans un bloc de données, donc je vais réussir à le faire là-bas. Cela fait un moment que je n'ai pas eu de temps avec Python. C'est bientôt fini.
import pandas as pd
import re
DF_samp=pd.DataFrame({'col_0': {'row_0': "Oh Osaka City", 'row_1': "Oups, la ville d'Osaka aaa", 'row_2': "Oups, Osaka City"},'col_1': {'row_0': 3, 'row_2': 4, 'row_3': 5},})
cols=DF_samp.col_0
cols0=cols.str.replace("[Ah-De][Ah-De][!-/:-@?[-`{-~.. , ... \].+[ville|village|ville]$|[Ah-De][Ah-De!-/:-@?[-`{-~.. , ... \].+[ville|village|ville]$", '')
DF_samp.col_0=cols0
DF_samp.dropna(subset=['col_0'])
Avec cela, seules les phrases mystérieuses correspondantes ont été éliminées. Yattane. J'ai l'impression d'entendre la voix me demander si je me substitue là-bas, mais je n'aime pas ça depuis longtemps ...
J'ai réalisé qu'un nouveau modèle pourrait survenir si cela était vu par le personnel du BOT ... À ce moment-là, cependant.
Quoi qu'il en soit, je veux être dans un monde où je peux bloquer efficacement! Eh bien, c'est l'API qui collecte les tweets, donc cette fois ce n'est pas lié aux blocages.
Recommended Posts