Une personne qui fréquente une université à Tokyo. Cela fait un an que je suis entré à l'université et sept mois se sont écoulés depuis que j'ai commencé à programmer. Je crée généralement des applications avec mes amis et je participe à des concours d'apprentissage automatique. J'ai appris hier un événement appelé [Qiita x COTOHA API present plan]. Je veux un Mac, je vais donc écrire mon premier article dans le but de gagner un prix. : fist: (Aujourd'hui est la date limite ...: angel_tone2 :)
L'université impose de nombreux rapports. C'est un événement très douloureux. : froncer les sourcils2:
Une façon de faciliter les choses est de presser les rapports des gens. Cependant, si vous serrez chaque mot, vous serez déçu. Par conséquent, je me suis demandé si je pouvais changer l'expression tout en conservant le contenu du rapport.
Cette fois, je vais écrire le texte suivant (une partie du rapport que j'ai rédigé le mois dernier).
Ce n'est pas une bonne phrase que je veux serrer ... Il y en a beaucoup de "encore" ...: sueur:
Utilisez un dictionnaire de synonymes ou GCP pour jouer petit à petit avec l'expression originale. Le résultat est le suivant.
L'expression a changé à certains endroits. La troisième règle est suivie, mais l '«Institut national de la sécurité sociale et des questions de population» est devenu l' «Institut national de la population et de la sécurité sociale». Il ne correspond pas au nom de la personne ou au nom de l'organisation.
Avec pleine satisfaction, l'API COTOHA est là. Lien API COTOHA L'API COTOHA est un service qui fournit diverses API de traitement du langage naturel / traitement de la parole telles que l'analyse syntaxique, l'analyse de correspondance, l'extraction de mots-clés, la reconnaissance vocale et la synthèse. Le dictionnaire japonais, qui est le résultat de 40 ans de recherche par le groupe NTT. Vous pouvez facilement utiliser l'analyse avancée avec l'API en utilisant la technologie pour classer la signification de plus de 3000 types de mots et de mots. " Parmi cette excellente API, nous utiliserons cette fois l'API d'extraction d'expression unique pour déterminer le nom de la personne et le nom de l'organisation.
D'ici Vous pouvez facilement vous inscrire. Après vous être enregistré, vérifiez ici l'URL DE BASE de l'API, l'ID CLIENT et le secret CLIENT.
get_token.py
data = {
"grantType": "client_credentials",
"clientId": "Your CLIENT ID",
"clientSecret": "Your CLIENT secret"
}
str_json = json.dumps(data)
url = "https://api.ce-cotoha.com/v1/oauth/accesstokens"
headers={
"Content-Type": "application/json"
}
result=requests.post(url,headers=headers,data=str_json)
print(result.text)
Vous pouvez maintenant voir le jeton d'accès.
get_koyu.py
def get_koyu_(text, token):
data = {
"sentence":text,
"type": "default"
}
headers = {
"Content-Type":"application/json",
"Authorization":"Bearer " + token
}
str_json = json.dumps(data)
url = "https://api.ce-cotoha.com/api/dev/nlp/v1/ne"
rr=requests.post(url,headers=headers,data=str_json)
result = json.loads(rr.text)["result"]
Vous pouvez extraire l'expression unique dans la phrase avec le code ci-dessus.
[{'begin_pos': 3, 'end_pos': 8, 'form': 'Ministry of Health and Labour', 'std_form': 'Ministry of Health and Labour', 'class': 'ORG', 'extended_class': '', 'source ':' basic '}, {' begin_pos ': 42,' end_pos ': 47,' form ':' 2017 ',' std_form ':' 2017 ',' class ':' DAT ',' extended_class ':' ',' source ':' basic '}, {' begin_pos ': 84,' end_pos ': 88,' form ':' 50 ans plus tard ',' std_form ':' 50 ans plus tard ',' class ' : 'DAT', 'extended_class': '', 'source': 'basic'}, {'begin_pos': 156, 'end_pos': 170, 'form': 'Institut national de la sécurité sociale et des problèmes de population', ' std_form ':' Institut national de la sécurité sociale et des problèmes de population ',' class ':' ORG ',' extended_class ':' ',' source ':' basic '}, ...
Il existe des catégories telles que le nom de lieu, le nom de la personne et le nom de l'organisation, de sorte que vous pouvez vous fier à celles-ci pour déterminer le nom de lieu, le nom de la personne et le nom de l'organisation.
Après cela, réécrivez le code pour ne pas modifier ces expressions uniques.
Avant de plisser
Après avoir plissé
Les mots entre "" et le nom de l'organisation restent les mêmes, mais seules les expressions ont changé. Il y a quelques subtilités, mais je vais le faire pour le moment.
L'application réellement terminée est ici.
Recommended Posts