Vue d'ensemble pour les personnes occupées

Inspiré de l'article Ore Program Ugokas Omae Genshijin Naru, j'ai essayé le traitement du langage. J'aime l'histoire ancienne "Série pour les gens occupés" [^ 1], j'ai donc utilisé l'API de résumé de l 'API COTOHA pour la rendre célèbre. J'ai essayé de faire des chansons pour les gens occupés.

Mise en garde Les résultats de sortie de code suivants (fond noir) montrent les paroles résumées, mais ils sont utilisés dans le but de rechercher des traitements linguistiques conformément à l'article 32 de la loi sur le droit d'auteur. (En raison des spécifications de l'API de synthèse, il est séparé par "." Le cas échéant (décrit plus loin)) En outre, conformément à l’article 48 de la loi sur le droit d’auteur, le titre de la chanson et le nom du parolier sont indiqués au bas de l’article.

Exemple: "Neige poudreuse" pour les gens occupés [^ 2]

$ python3 youyaku.py < konayuki.txt
Lalarai. Poudreuse. Si votre cœur est teint en blanc.

Ça n'a pas l'air de "je ne viens pas", mais je suis convaincu (?) Qu'il y a des endroits où ça apparaît fréquemment!

environnement

Python 3.6.9

la mise en oeuvre

Résumez en 3 lignes à l'aide de l'API COTOHA Summary API. La plupart du code est écrit en référence à l'article de Genshijin, mais BASE_URL est réécrit et les paramètres sont modifiés pour la récapitulation. De plus, si je donnais les paroles telles qu'elles étaient, elles ne les résumeraient pas du tout, alors j'ai mis "."

code

<détails>

Cliquez ici pour développer. </ résumé>

`youyaku.py`



import requests
import json
import sys

BASE_URL = "https://api.ce-cotoha.com/api/dev/"
CLIENT_ID = "Saisissez l'ID obtenu avec l'API COTOHA"
CLIENT_SECRET = "Entrez le mot de passe obtenu par l'API COTOHA"


def auth(client_id, client_secret):
    token_url = "https://api.ce-cotoha.com/v1/oauth/accesstokens"
    headers = {
        "Content-Type": "application/json",
        "charset": "UTF-8"
    }

    data = {
        "grantType": "client_credentials",
        "clientId": client_id,
        "clientSecret": client_secret
    }
    r = requests.post(token_url,
                      headers=headers,
                      data=json.dumps(data))
    return r.json()["access_token"]


def summary(document, access_token, sent_len):
    base_url = BASE_URL
    headers = {
        "Content-Type": "application/json",
        "charset": "UTF-8",
        "Authorization": "Bearer {}".format(access_token)
    }
    data = {
        "document": document,
        "sent_len": sent_len
    }
    r = requests.post(base_url + "nlp/beta/summary",
                      headers=headers,
                      data=json.dumps(data))
    return r.json()


if __name__ == "__main__":
    document = "Les paroles sont listées ici"
    args = sys.argv
    if len(args) >= 2:
        document = str(args[1])

    access_token = auth(CLIENT_ID, CLIENT_SECRET)
    summary_document = summary(document, access_token, 3)
    result_list = list()
    for chunks in summary_document['result']:
      result_list.append(chunks)

    print(''.join(result_list))

résultat

"Ondo" Mito Komon "Ah, il y a des larmes dans la vie" [^ 3]

$ python3 youyaku.py < mitokomon.txt
Si vous n'aimez pas pleurer, marchez maintenant. Il y a des larmes et des sourires dans ma vie. Vivons à la recherche de quelque chose.

"Doraemon no Uta" [^ 4]

$ python3 youyaku.py < doraemon.txt
Tout le monde, tout le monde, se réalisera. Ann An Ann. J'aime vraiment Doraemon.

"C'est important" [^ 5]

$ python3 youyaku.py < soregadaiji.txt
Ne perdez pas, ne jetez pas, ne fuyez pas, croyez. Quand il semble être ruiné. C'est le plus important.

"La chanson de Gatchaman" [^ 6]

$ python3 youyaku.py < gachaman.txt
Gatchaman. mouche. aller.

"Aventure mystérieuse" [^ 7]

$ python3 youyaku.py < makafushigi.txt
DRAGONBALL。try。fly。

"Naissance du roi héros!" [^ 8]

$ python3 youyaku.py < yushaou.txt
Gagagatsu. Gaogaigar!.. Gagagaga.

Résumé

J'ai essayé de résumer divers chefs-d'œuvre. Les bonnes chansons sont courtes mais profondes

[^ 1]: [Encyclopédie Nikoniko: Série pour les personnes occupées](https://dic.nicovideo.jp/a/%E5%BF%99%E3%81%97%E3%81%84%E4%BA % BA% E5% 90% 91% E3% 81% 91% E3% 82% B7% E3% 83% AA% E3% 83% BC% E3% 82% BA) [^ 2]: Paroles "Powder Snow": Ryota Fujimaki [^ 3]: "Otodo" Mito Komon "Ah, il y a des larmes dans la vie" Paroles: Michio Yamagami [^ 4]: "Doraemon no Uta" Paroles: Kusube Ko [^ 5]: "C'est important" Paroles: Toshiyuki Tachikawa [^ 6]: "Gatchaman no Uta" Paroles: Ryuko Production Literary Club [^ 7]: "Maya Mysterious Adventure" Paroles: Yuriko Mori [^ 8]: "Naissance du roi héros!" Paroles: Yoshitomo Yone

Traitement du langage naturel pour les personnes occupées