J'essaierai.
Extraire toute la nomenclature de la connexion.
Maven
Utilisez la version en cours de développement.
<dependency>
<groupId>org.nlp4j</groupId>
<artifactId>nlp4j-core</artifactId>
<version>1.1.1.0-SNAPSHOT</version>
</dependency>
Text Data
Dans l'analyse morphologique (analyse morphologique japonaise de Yahoo! Japan Developer Network) utilisée par défaut, la limite supérieure de la taille de la requête est de 900 Ko et le nombre de fois est limité, donc un petit fichier texte est utilisé.
un
Je suis un chat.
Il n'y a pas encore de nom.
Je n'ai aucune idée d'où je suis né.
Je me souviens avoir pleuré dans un endroit sombre et humide.
J'ai vu des êtres humains pour la première fois ici.
De plus, j'ai entendu plus tard que c'était la pire race d'êtres humains appelée Shosei.
Cet étudiant est une histoire qui nous surprend parfois, bouillit et mange.
Cependant, je n'ai rien pensé à ce moment-là, donc je ne pensais pas que c'était particulièrement effrayant.
Il était juste duveteux quand il était placé sur sa paume et soulevé.
C'est probablement le début de ce qu'on appelle un être humain qu'il se calme un peu sur sa paume et voit le visage de l'élève.
Le sentiment que je trouvais étrange à cette époque demeure toujours.
Le visage, qui doit être décoré avec les premiers cheveux, est glissant et ressemble à un médicament.
Après cela, j'ai rencontré beaucoup de chats, mais je n'ai jamais rencontré une telle roue.
Non seulement cela, le centre du visage est trop saillant.
Ensuite, je souffle parfois de la fumée du trou.
J'étais si malade et vraiment faible.
J'ai finalement appris que c'était une cigarette que les humains boivent.
Java Code
package nlp4j.nokku.chap4;
import java.util.List;
import nlp4j.Document;
import nlp4j.DocumentAnnotator;
import nlp4j.DocumentAnnotatorPipeline;
import nlp4j.Keyword;
import nlp4j.crawler.Crawler;
import nlp4j.crawler.TextFileLineSeparatedCrawler;
import nlp4j.impl.DefaultDocumentAnnotatorPipeline;
import nlp4j.index.DocumentIndex;
import nlp4j.index.SimpleDocumentIndex;
import nlp4j.yhoo_jp.YJpMaAnnotator;
public class Nokku31 {
public static void main(String[] args) throws Exception {
//Utilisez le robot d'exploration de fichiers texte fourni par NLP4J
Crawler crawler = new TextFileLineSeparatedCrawler();
crawler.setProperty("file", "src/test/resources/nlp4j.crawler/neko_short_utf8.txt");
crawler.setProperty("encoding", "UTF-8");
crawler.setProperty("target", "text");
//Exploration de documents
List<Document> docs = crawler.crawlDocuments();
//Définition du pipeline NLP (processus en connectant plusieurs processus en tant que pipeline)
DocumentAnnotatorPipeline pipeline = new DefaultDocumentAnnotatorPipeline();
{
// Yahoo!Annotateur utilisant l'API d'analyse morphologique du Japon
DocumentAnnotator annotator = new YJpMaAnnotator();
pipeline.add(annotator);
}
//Exécution du traitement des annotations
pipeline.annotate(docs);
//Utilisez DocumentIndex pour compter les mots-clés.
SimpleDocumentIndex index = new SimpleDocumentIndex();
//Ajouter de la documentation
index.addDocuments(docs);
List<Keyword> kwds = index.getKeywordsWithoutCount();
String meishi = null;
//Ce n'est pas un moyen cool, mais cette fois je vais simplement chercher la nomenclature +.
for (Keyword kwd : kwds) {
if (kwd.getFacet().equals("nom")) {
meishi = kwd.getLex();
} //
else if (meishi != null && kwd.getLex().equals("Faire")) {
System.err.println(meishi + kwd.getLex());
meishi = null;
} //
else {
meishi = null;
}
}
}
}
Rappelles toi
décorer
Saillant
Ce n'est pas une variante sa, mais une variante sa.
Avec NLP4J, vous pouvez facilement effectuer le traitement du langage naturel en Java!
https://www.nlp4j.org/
Recommended Posts