[JAVA] NLP4J [006-032] 100 traitements linguistiques avec NLP4J Knock # 32 Prototype de verbe

Retour à l'index

J'essaierai.

32. Prototype du verbe

Extraire toutes les formes originales du verbe.

Maven

Utilisez la version en cours de développement.

<dependency>
	<groupId>org.nlp4j</groupId>
	<artifactId>nlp4j-core</artifactId>
	<version>1.1.1.0-SNAPSHOT</version>
</dependency>

Text Data

Dans l'analyse morphologique (analyse morphologique japonaise de Yahoo! Japan Developer Network) utilisée par défaut, la limite supérieure de la taille de la requête est de 900 Ko et le nombre de fois est limité, donc un petit fichier texte est utilisé.

un

Je suis un chat.
Il n'y a pas encore de nom.

Je n'ai aucune idée d'où je suis né.
Je me souviens avoir pleuré dans un endroit sombre et humide.
J'ai vu des êtres humains pour la première fois ici.
De plus, j'ai entendu plus tard que c'était la pire race d'êtres humains appelée Shosei.
Cet étudiant est une histoire qui nous surprend parfois, bouillit et mange.
Cependant, je n'ai rien pensé à ce moment-là, donc je ne pensais pas que c'était particulièrement effrayant.
Il était juste duveteux quand il était placé sur sa paume et soulevé.
C'est probablement le début de ce qu'on appelle un être humain qu'il se calme un peu sur sa paume et voit le visage de l'élève.
Le sentiment que je trouvais étrange à cette époque demeure toujours.
Le visage, qui doit être décoré avec les premiers cheveux, est glissant et ressemble à un médicament.
Après cela, j'ai rencontré beaucoup de chats, mais je n'ai jamais rencontré une telle roue.
Non seulement cela, le centre du visage est trop saillant.
Ensuite, je souffle parfois de la fumée du trou.
J'étais si malade et vraiment faible.
J'ai finalement appris que c'était une cigarette que les humains boivent.


Java Code

package nlp4j.nokku.chap4;

import java.util.List;

import nlp4j.Document;
import nlp4j.DocumentAnnotator;
import nlp4j.DocumentAnnotatorPipeline;
import nlp4j.Keyword;
import nlp4j.crawler.Crawler;
import nlp4j.crawler.TextFileLineSeparatedCrawler;
import nlp4j.impl.DefaultDocumentAnnotatorPipeline;
import nlp4j.index.DocumentIndex;
import nlp4j.index.SimpleDocumentIndex;
import nlp4j.yhoo_jp.YJpMaAnnotator;

public class Nokku31 {
	public static void main(String[] args) throws Exception {
		//Utilisez le robot d'exploration de fichiers texte fourni par NLP4J
		Crawler crawler = new TextFileLineSeparatedCrawler();
		crawler.setProperty("file", "src/test/resources/nlp4j.crawler/neko_short_utf8.txt");
		crawler.setProperty("encoding", "UTF-8");
		crawler.setProperty("target", "text");
		//Exploration de documents
		List<Document> docs = crawler.crawlDocuments();
		//Définition du pipeline NLP (processus en connectant plusieurs processus en tant que pipeline)
		DocumentAnnotatorPipeline pipeline = new DefaultDocumentAnnotatorPipeline();
		{
			// Yahoo!Annotateur utilisant l'API d'analyse morphologique du Japon
			DocumentAnnotator annotator = new YJpMaAnnotator();
			pipeline.add(annotator);
		}
		//Exécution du traitement des annotations
		pipeline.annotate(docs);
		//Utilisez DocumentIndex pour compter les mots-clés.
		SimpleDocumentIndex index = new SimpleDocumentIndex();
		//Ajouter de la documentation
		index.addDocuments(docs);
		List<Keyword> kwds = index.getKeywords();
		kwds = kwds.stream() //
				.filter(o -> o.getFacet().equals("verbe")) // 品詞がverbe
				.collect(Collectors.toList());
		for (Keyword kwd : kwds) {
			System.err.println(kwd.getLex()); //← Changer seulement ici
		}
	}
}

résultat

Être né
Tsukuri
Faire
cri
début
Dire
à voir
Ecoutez
Dire
Dire
Capturer
Ébullition
Manger
Dire
pense
Mettre
ascenseur
Faire
y a-t-il
Calmez-vous
à voir
Dire
pense
Rester
Avoir
Faire
Rencontrer
rencontrer
Faire
Coup
Peut la gorge
Kuu
Faible
boire
Dire
connaître

Résumé

Avec NLP4J, vous pouvez facilement effectuer le traitement du langage naturel en Java!

URL du projet

https://www.nlp4j.org/ NLP4J_N_128.png


Retour à l'index

Recommended Posts

NLP4J [006-032] 100 traitements linguistiques avec NLP4J Knock # 32 Prototype de verbe
NLP4J [006-031] Le traitement de 100 langues frappe avec le verbe NLP4J # 31
NLP4J [006-034b] Essayez de faire en sorte que l'annotateur de 100 traitements de langage frappe # 34 "A B" avec NLP4J
NLP4J [006-034] 100 coups de traitement de langage avec NLP4J # 34 "A B"
NLP4J [006-033] 100 coups de traitement de langage avec NLP4J # 33
NLP4J [006-030] 100 coups de traitement du langage avec NLP4J # 30 Lecture des résultats d'analyse morphologique
Présentation de NLP4J- [000] Natural Language Processing Index en Java
NLP4J [006-034c] 100 coups de traitement du langage avec NLP4J # 34 Essayez de résoudre plus intelligemment "A's B" (édition finale)
Noël avec traitement
Contrôlez le flux de traitement Spring Batch avec JavaConfig.