NEologd-Vorverarbeitung in Java neologdn-java

Chao ... †

Mit Hilfe von @ragion haben wir endlich das Vorverarbeitungsmodul neologd-java von NEologd in Java veröffentlicht!

Was ist das?

https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja

Es gibt eine Grenze, um Wörterbuchdaten redundant zu machen und unterschiedliche Notationen zu absorbieren. Beim Generieren von Wörterbuchdaten wird die gesamte unten beschriebene Normalisierungsverarbeitung angewendet. Wenn also die folgende Normalisierungsverarbeitung auf den zu analysierenden Text angewendet wird, ist es einfacher, die Wörter im Wörterbuch abzugleichen.

Wie Sie auf der obigen Seite sehen können, ist es wichtig, vor dem Parsen mit MeCab eine Normalisierung (Vorverarbeitung) durchzuführen. Deshalb habe ich neologd-java erstellt, ein Vorverarbeitungsmodul für NEologd in Java.

Wie benutzt man es?

Für Maven

Da es in Maven Central registriert ist, fügen Sie Folgendes zu pom.xml hinzu.

    <dependency>
      <groupId>io.github.ikegami-yukino</groupId>
      <artifactId>neologdn</artifactId>
      <version>0.0.1</version>
    </dependency>

Und

package yukinoi.neologdn_example;
import io.github.ikegamiyukino.neologdn.NeologdNormalizer;


/**
 * neologdn-example
 *
 */
public class App
{
    public static void main(String[] args)
    {
        NeologdNormalizer normalizer = new NeologdNormalizer();
        String text = "PRML ergänzendes Lesebuch";
        String normalizedText = normalizer.normalize(text);
        System.out.println(normalizedText);
    }
}

Verwenden Sie wie.

Ich möchte dazu beitragen!

Es wird im folgenden GitHub-Repository entwickelt. https://github.com/ikegami-yukino/neologdn-java

Contributions are welcome!

Recommended Posts

NEologd-Vorverarbeitung in Java neologdn-java

Partisierung in Java

Änderungen in Java 11

Janken in Java

Umfangsrate in Java

FizzBuzz in Java

Interpreter-Implementierung durch Java

Machen Sie einen Blackjack mit Java

Janken App in Java

Einschränkungsprogrammierung in Java

Setzen Sie Java8 in Centos7

NVL-artiger Typ in Java

"Hallo Welt" in Java

Aufrufbare Schnittstelle in Java

Kommentare in der Java-Quelle

Azure funktioniert in Java

Formatieren Sie XML in Java

Einfache HTML-Spezialchars in Java

Boyer-Moore-Implementierung in Java

Hallo Welt in Java

Verwenden Sie OpenCV mit Java

WebApi-Memorandum mit Java

Typbestimmung in Java

Befehle in Java ausführen (Ping)

Verschiedene Threads in Java

Implementierung der Heap-Sortierung (in Java)

Zabbix API in Java

ASCII-Kunst in Java

Listen in Java vergleichen

POST JSON in Java

Fehler in Java ausdrücken

Erstellen Sie JSON in Java

Datumsmanipulation in Java 8

Was ist neu in Java 8?

Verwenden Sie PreparedStatement in Java

Was ist neu in Java 9,10,11

Parallele Ausführung in Java

Versuchen Sie es mit RocksDB mit Java

Lesen Sie Binärdateien in Java 1

Vermeiden Sie den Fehler, den Yuma in Java gemacht hat

Holen Sie sich EXIF-Informationen in Java

[Neta] Sleep Sort in Java

Bearbeiten von ini in Java: ini4j

Java-Geschichte in dieser Welt

Segfo Java in 6 Zeilen

Lassen Sie uns Spresense mit Java entwickeln (1)

Probieren Sie den Funktionstyp in Java aus! ①

Ich habe ein Roulette in Java gemacht.

Implementierung der zweistufigen Authentifizierung in Java

Schreiben Sie Flyway-Rückrufe in Java

Importieren Sie Excel-Daten mit Java 2

Ändern Sie die Java-Codierung in Windows

Java Stream API in 5 Minuten

Problem beim Finden von javax.annotation.Generated in Java 11 nicht

Lesen Sie die Standardeingabe in Java

Implementieren Sie die Standardauthentifizierung in Java

Perls grep-ish Typ in Java

Suchen Sie eine Teilmenge in Java