NEologd-Vorverarbeitung in Java neologdn-java

Chao ... †

Mit Hilfe von @ragion haben wir endlich das Vorverarbeitungsmodul neologd-java von NEologd in Java veröffentlicht!

Was ist das?

https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja

Es gibt eine Grenze, um Wörterbuchdaten redundant zu machen und unterschiedliche Notationen zu absorbieren. Beim Generieren von Wörterbuchdaten wird die gesamte unten beschriebene Normalisierungsverarbeitung angewendet. Wenn also die folgende Normalisierungsverarbeitung auf den zu analysierenden Text angewendet wird, ist es einfacher, die Wörter im Wörterbuch abzugleichen.

Wie Sie auf der obigen Seite sehen können, ist es wichtig, vor dem Parsen mit MeCab eine Normalisierung (Vorverarbeitung) durchzuführen. Deshalb habe ich neologd-java erstellt, ein Vorverarbeitungsmodul für NEologd in Java.

Wie benutzt man es?

Für Maven

Da es in Maven Central registriert ist, fügen Sie Folgendes zu pom.xml hinzu.

    <dependency>
      <groupId>io.github.ikegami-yukino</groupId>
      <artifactId>neologdn</artifactId>
      <version>0.0.1</version>
    </dependency>

Und

package yukinoi.neologdn_example;
import io.github.ikegamiyukino.neologdn.NeologdNormalizer;


/**
 * neologdn-example
 *
 */
public class App
{
    public static void main(String[] args)
    {
        NeologdNormalizer normalizer = new NeologdNormalizer();
        String text = "PRML ergänzendes Lesebuch";
        String normalizedText = normalizer.normalize(text);
        System.out.println(normalizedText);
    }
}

Verwenden Sie wie.

Ich möchte dazu beitragen!

Es wird im folgenden GitHub-Repository entwickelt. https://github.com/ikegami-yukino/neologdn-java

Contributions are welcome!

Recommended Posts

NEologd-Vorverarbeitung in Java neologdn-java
Partisierung in Java
Änderungen in Java 11
Janken in Java
Umfangsrate in Java
FizzBuzz in Java
Interpreter-Implementierung durch Java
Machen Sie einen Blackjack mit Java
Janken App in Java
Einschränkungsprogrammierung in Java
Setzen Sie Java8 in Centos7
NVL-artiger Typ in Java
"Hallo Welt" in Java
Aufrufbare Schnittstelle in Java
Kommentare in der Java-Quelle
Azure funktioniert in Java
Formatieren Sie XML in Java
Einfache HTML-Spezialchars in Java
Boyer-Moore-Implementierung in Java
Hallo Welt in Java
Verwenden Sie OpenCV mit Java
WebApi-Memorandum mit Java
Typbestimmung in Java
Befehle in Java ausführen (Ping)
Verschiedene Threads in Java
Implementierung der Heap-Sortierung (in Java)
Zabbix API in Java
ASCII-Kunst in Java
Listen in Java vergleichen
POST JSON in Java
Fehler in Java ausdrücken
Erstellen Sie JSON in Java
Datumsmanipulation in Java 8
Was ist neu in Java 8?
Verwenden Sie PreparedStatement in Java
Was ist neu in Java 9,10,11
Parallele Ausführung in Java
Versuchen Sie es mit RocksDB mit Java
Lesen Sie Binärdateien in Java 1
Vermeiden Sie den Fehler, den Yuma in Java gemacht hat
Holen Sie sich EXIF-Informationen in Java
[Neta] Sleep Sort in Java
Bearbeiten von ini in Java: ini4j
Java-Geschichte in dieser Welt
Segfo Java in 6 Zeilen
Lassen Sie uns Spresense mit Java entwickeln (1)
Probieren Sie den Funktionstyp in Java aus! ①
Ich habe ein Roulette in Java gemacht.
Implementierung der zweistufigen Authentifizierung in Java
Schreiben Sie Flyway-Rückrufe in Java
Importieren Sie Excel-Daten mit Java 2
Ändern Sie die Java-Codierung in Windows
Java Stream API in 5 Minuten
Problem beim Finden von javax.annotation.Generated in Java 11 nicht
Lesen Sie die Standardeingabe in Java
Implementieren Sie die Standardauthentifizierung in Java
Perls grep-ish Typ in Java
Suchen Sie eine Teilmenge in Java