Prétraitement NEologd en Java neologdn-java

Chao ... †

Avec l'aide de @ragion, nous avons enfin publié le module de pré-traitement de NEologd neologd-java en Java!

Qu'est-ce que c'est?

https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja

Il y a une limite à rendre les données du dictionnaire redondantes et à absorber différentes notations. Lors de la génération des données du dictionnaire, tout le traitement de normalisation décrit ci-dessous est appliqué, donc si le traitement de normalisation suivant est appliqué au texte à analyser, il sera plus facile de faire correspondre les mots du dictionnaire.

Comme vous pouvez le voir sur la page ci-dessus, il est important d'effectuer une normalisation (pré-traitement) avant l'analyse avec MeCab. Par conséquent, j'ai créé neologd-java, un module de pré-traitement pour NEologd en Java.

Comment l'utilisez-vous?

Pour Maven

Puisqu'il est enregistré dans Maven Central, ajoutez ce qui suit à pom.xml.

    <dependency>
      <groupId>io.github.ikegami-yukino</groupId>
      <artifactId>neologdn</artifactId>
      <version>0.0.1</version>
    </dependency>

Et

package yukinoi.neologdn_example;
import io.github.ikegamiyukino.neologdn.NeologdNormalizer;


/**
 * neologdn-example
 *
 */
public class App
{
    public static void main(String[] args)
    {
        NeologdNormalizer normalizer = new NeologdNormalizer();
        String text = "Livre de lecture supplémentaire PRML";
        String normalizedText = normalizer.normalize(text);
        System.out.println(normalizedText);
    }
}

Utilisez comme.

Je veux contribuer!

Il est développé dans le référentiel GitHub suivant. https://github.com/ikegami-yukino/neologdn-java

Contributions are welcome!

Recommended Posts

Prétraitement NEologd en Java neologdn-java
Partition en Java
Changements dans Java 11
Janken à Java
Taux circonférentiel à Java
FizzBuzz en Java
Implémentation de l'interpréteur par Java
Faites un blackjack avec Java
Application Janken en Java
Programmation par contraintes en Java
Mettez java8 dans centos7
NVL-ish guy en Java
"Hello World" en Java
Interface appelable en Java
Commentaires dans la source Java
Fonctions Azure en Java
Formater XML en Java
Simple htmlspecialchars en Java
Implémentation Boyer-Moore en Java
Hello World en Java
Utiliser OpenCV avec Java
Mémorandum WebApi avec Java
Détermination de type en Java
Exécuter des commandes en Java (ping)
Divers threads en java
Implémentation du tri de tas (en java)
API Zabbix en Java
Art ASCII à Java
Comparer des listes en Java
POST JSON en Java
Exprimer l'échec en Java
Créer JSON en Java
Manipulation de la date dans Java 8
Nouveautés de Java 8
Utiliser PreparedStatement en Java
Nouveautés de Java 9,10,11
Exécution parallèle en Java
Essayez d'utiliser RocksDB avec Java
Lire des fichiers binaires en Java 1
Évitez l'erreur que Yuma a donnée en Java
Obtenir des informations EXIF en Java
[Neta] Sleep Sort en Java
Modifier ini en Java: ini4j
L'histoire de Java dans ce monde
Segfo Java en 6 lignes
Essayez de développer Spresense avec Java (1)
Essayez le type fonctionnel en Java! ①
J'ai fait une roulette à Java.
Implémentation de l'authentification en deux étapes en Java
Ecrire des rappels de vol en Java
Importer des données Excel avec Java 2
Changer le codage Java dans Windows
API Java Stream en 5 minutes
Problème de ne pas trouver javax.annotation.Généré en Java 11
Lire l'entrée standard en Java
Implémenter l'authentification de base en Java
Le type grep-ish de Perl en Java
Rechercher un sous-ensemble en Java