Eine in Java entwickelte Open-Source-Engine für die morphologische Analyse in Japan.
kuromoji | Atilika https://www.atilika.com/ja/kuromoji/
Maven
<dependency>
<groupId>org.nlp4j</groupId>
<artifactId>nlp4j-core</artifactId>
<version>1.3.0.0</version>
</dependency>
<dependency>
<groupId>org.nlp4j</groupId>
<artifactId>nlp4j-kuromoji</artifactId>
<version>1.3.0.0</version>
</dependency>
package example;
import nlp4j.Document;
import nlp4j.Keyword;
import nlp4j.impl.DefaultDocument;
import nlp4j.krmj.annotator.KuromojiAnnotator;
public class HelloKuromojiNLP1 {
public static void main(String[] args) throws Exception {
//Natürlicher Text
String text = "Es ist heute ein gutes Wetter.";
Document doc = new DefaultDocument();
//Als Attribut "Text" setzen
doc.putAttribute("text", text);
//Kuromoji Annotator
KuromojiAnnotator annotator = new KuromojiAnnotator();
//Geben Sie das zu verarbeitende Attribut an
annotator.setProperty("target", "text");
//Morphologische Analyseverarbeitung
annotator.annotate(doc); // throws Exception
//Schlüsselwortausgabe
for (Keyword kwd : doc.getKeywords()) {
System.err.println(kwd);
}
}
}
heute[facet=Substantiv, str=heute]
Ist[facet=Partikel, str=Ist]
Gut[facet=Adjektiv, str=Gut]
Wetter[facet=Substantiv, str=Wetter]
ist[facet=Hilfsverb, str=ist]
。 [facet=Symbol, str=。]
Recommended Posts