Obtenez l'historique des tweets de célébrités sur Twitter

Le mur que j'ai immédiatement rencontré lorsque j'ai voulu utiliser la perspicacité de la personnalité d'IBM cloud. Un mémorandum à l'époque.

difficulté

Une phrase de 3000 mots ou plus est requise (ou plutôt souhaitable). Alors j'emprunte un tweet de célébrité à Twitter. On considère qu'il y a environ 15 mots par tweet, et 200 tweets sont acquis par personne.

Cependant, en tant que prémisse majeure, il est nécessaire d'enregistrer l'API Twitter. J'ai déjà fait une demande d'inscription, je vais donc omettre cette procédure ici.

Méthode de mise en œuvre

 -*- coding:utf-8 -*-

import tweepy
import re
import subprocess

# Liste d'utilisateur
import user_list
# Clé d'authentification API Twitter
# Access_token, Access_secret, Consumer_key, Consumer_secret
from auth import twitter_credentials as tc


def get_twitterdata(username, rfile):

 #Lire la clé d'authentification, les paramètres de l'API
  auth = tweepy.OAuthHandler(tc.Consumer_key, tc.Consumer_secret)
  auth.set_access_token(tc.Access_token, tc.Access_secret)
  api = tweepy.API(auth, wait_on_rate_limit = True)

 #List pour stocker les tweets
  tweets_data =[]
 Obtenez des données jusqu'à # 200 tweet
  for tweet in api.user_timeline(screen_name=username, count=200):
 # Obtenir le texte du tweet
    tmp_text=tweet.text
 # Les sauts de ligne continus sont combinés en un
    tmp_text=re.sub('\n+','\n',tmp_text)
 #Ajouter un tweet à la liste
    tweets_data.append(tmp_text + '\n')

 # Sortie de fichier
  with open(rfile, "w",encoding="utf-8") as wf:
    wf.writelines(tweets_data)


if __name__ == '__main__':

 Obtenez votre nom d'utilisateur #twitter
  userlist=user_list.username

  for i in range(0,len(userlist)):
    username = userlist[i]
    rfile = "./data/tweet_"+str(i).zfill(3)+".csv"

    try:
      get_twitterdata(username, rfile)
 # Génère un fichier vide s'il ne peut pas être obtenu, par exemple lorsqu'il est défini sur privé
    except:
      subprocess.run(["touch",rfile])

Exemple de liste d'utilisateurs

C'est fou, mais le nom de la personne est caché. username=[ "ariyoshihiroiki", "matsu_bouzu", "takapon_jp" ]

résultat

La description est omise car elle peut être protégée par des droits d'auteur. tweet_000.csv tweet_001.csv tweet_002.csv Peut être fait.

Épilogue

La quantité de données pouvant être acquises toutes les 15 minutes (?) Étant limitée, si vous êtes gourmand, vous devrez attendre longtemps. Vous pouvez également exclure les retweets et autres non-textes de la personne en question.