J'essaierai.
Extraire toutes les formes de surface du verbe.
Maven
Utilisez la version en cours de développement.
<dependency>
<groupId>org.nlp4j</groupId>
<artifactId>nlp4j-core</artifactId>
<version>1.1.1.0-SNAPSHOT</version>
</dependency>
Text Data
Dans l'analyse morphologique (analyse morphologique japonaise de Yahoo! Japan Developer Network) utilisée par défaut, la limite supérieure de la taille de la requête est de 900 Ko et le nombre de fois est limité, donc un petit fichier texte est utilisé.
Java Code
package nlp4j.nokku.chap4;
import java.util.List;
import nlp4j.Document;
import nlp4j.DocumentAnnotator;
import nlp4j.DocumentAnnotatorPipeline;
import nlp4j.Keyword;
import nlp4j.crawler.Crawler;
import nlp4j.crawler.TextFileLineSeparatedCrawler;
import nlp4j.impl.DefaultDocumentAnnotatorPipeline;
import nlp4j.index.DocumentIndex;
import nlp4j.index.SimpleDocumentIndex;
import nlp4j.yhoo_jp.YJpMaAnnotator;
public class Nokku31 {
public static void main(String[] args) throws Exception {
//Utilisez le robot d'exploration de fichiers texte fourni par NLP4J
Crawler crawler = new TextFileLineSeparatedCrawler();
crawler.setProperty("file", "src/test/resources/nlp4j.crawler/neko_short_utf8.txt");
crawler.setProperty("encoding", "UTF-8");
crawler.setProperty("target", "text");
//Exploration de documents
List<Document> docs = crawler.crawlDocuments();
//Définition du pipeline NLP (processus en connectant plusieurs processus en tant que pipeline)
DocumentAnnotatorPipeline pipeline = new DefaultDocumentAnnotatorPipeline();
{
// Yahoo!Annotateur utilisant l'API d'analyse morphologique du Japon
DocumentAnnotator annotator = new YJpMaAnnotator();
pipeline.add(annotator);
}
//Exécution du traitement des annotations
pipeline.annotate(docs);
//Utilisez DocumentIndex pour compter les mots-clés.
SimpleDocumentIndex index = new SimpleDocumentIndex();
//Ajouter de la documentation
index.addDocuments(docs);
List<Keyword> kwds = index.getKeywords();
kwds = kwds.stream() //
.filter(o -> o.getFacet().equals("verbe")) // 品詞がverbe
.collect(Collectors.toList());
for (Keyword kwd : kwds) {
System.err.println(kwd.getStr());
}
}
}
Née
Tsuka
Shi
Pleurs
début
Dire
Vous voyez
Ecoutez
Dire
Dire
Capture
Bouilli
Manger
Dire
Pensées
Chargement
Ascenseur
Shi
Ah
Calmez-vous
Vous voyez
Dire
Pensées
Restant
Mot
Shi
Rencontrer
Rencontrer
Shi
Coup
Gorge
Ku
Faible
boire
Dire
Connaître
Avec NLP4J, vous pouvez facilement effectuer le traitement du langage naturel en Java!
https://www.nlp4j.org/
Recommended Posts