J'ai frappé l'API pour obtenir le message, mais je veux au moins
--Identifiant d'utilisateur
Parmi ceux-ci, j'ai essayé des essais et des erreurs parce que je ne pouvais pas obtenir l'ID utilisateur. L'histoire décrite ici se trouve à l'origine sur GitHub.
Même si vous faites une sorte de matériel d'analyse, il semble que vous ne pouvez pas parler sans au moins les trois informations suivantes.
Le besoin cette fois est d'extraire ces trois informations de toutes les publications (d'un canal spécifique).
À la suite d'essais et d'erreurs, j'ai conclu que le sentiment suivant serait bon.
Pour le temps et le texte,
data = json.load(open("posts.json"))
for msg in data:
print msg.get("ts", "")
print msg.get("text", "")
C'est OK avec un sentiment comme.
En ce qui concerne l'acquisition d'utilisateurs, celles qui ne peuvent pas être acquises dans les conditions suivantes sont terminées.
def get_user_id(m):
if m.has_key("user"): return m["user"]
if m.has_key("bot_id"): return m["bot_id"]
return None
for msg in data:
uid = get_user_id(msg)
if uid is None:
continue
# do something ...
Dans les conditions de vérification, nous concluons que le poste correspondant représentait 0,2 [%] du total, il peut donc être ignoré.
Les données proviennent du canal _ aléatoire_ de votre entreprise. Je m'abstiendrai de divulguer la période spécifique et le nombre de messages, mais j'ai regardé les messages postés sur une période d'environ un an et demi.
c'est tout.
Recommended Posts