Je touche depuis longtemps à l'API Twitter, alors j'ai finalement décidé d'essayer l'analyse morphologique. Ce qui suit est la source où j'ai le sentiment que je peux développer diverses choses à partir d'ici et jouer.
meca.py
#!/user/bin/env python
# -*- coding: utf-8 -*-
from requests_oauthlib import OAuth1Session
import json
import sys
import MeCab
C_KEY = "********************************"
C_SECRET = "********************************"
A_KEY = "********************************"
A_SECRET = "********************************"
def Home_timeline():
url = "https://api.twitter.com/1.1/statuses/home_timeline.json"
params = {
"lang": "ja",
"count": "100"
}
tw = OAuth1Session(C_KEY,C_SECRET,A_KEY,A_SECRET)
req = tw.get(url, params = params)
tweets = json.loads(req.text)
for tweet in tweets:
f = open("test.txt" , "aw")
lists = (tweet["text"].encode("utf-8"))
f.write(lists)
f.flush()
f.close()
def Mecab_file():
f = open("test.txt","rb")
data = f.read()
f.close()
mt = MeCab.Tagger("-Ochasen")
print mt.parse(data)
Home_timeline()
Mecab_file()
Ce n'est toujours pas beau, mais je pense que le processus qu'il effectue est facile à comprendre. Je ne sais pas si f.flush () est nécessaire, mais juste au cas où. Après cela, il est remis à Mecab pour une analyse morphologique. Le résultat de l'analyse morphologique est affiché par analyse, mais je souhaite le modifier pour qu'il soit facile à voir.
Lors de l'importation du module MeCab, le codec a interféré, donc j'importe uniquement sys.
Recommended Posts