Chao ... †
Avec l'aide de @ragion, nous avons enfin publié le module de pré-traitement de NEologd neologd-java en Java!
https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja
Il y a une limite à rendre les données du dictionnaire redondantes et à absorber différentes notations. Lors de la génération des données du dictionnaire, tout le traitement de normalisation décrit ci-dessous est appliqué, donc si le traitement de normalisation suivant est appliqué au texte à analyser, il sera plus facile de faire correspondre les mots du dictionnaire.
Comme vous pouvez le voir sur la page ci-dessus, il est important d'effectuer une normalisation (pré-traitement) avant l'analyse avec MeCab. Par conséquent, j'ai créé neologd-java, un module de pré-traitement pour NEologd en Java.
Puisqu'il est enregistré dans Maven Central, ajoutez ce qui suit à pom.xml
.
<dependency>
<groupId>io.github.ikegami-yukino</groupId>
<artifactId>neologdn</artifactId>
<version>0.0.1</version>
</dependency>
Et
package yukinoi.neologdn_example;
import io.github.ikegamiyukino.neologdn.NeologdNormalizer;
/**
* neologdn-example
*
*/
public class App
{
public static void main(String[] args)
{
NeologdNormalizer normalizer = new NeologdNormalizer();
String text = "Livre de lecture supplémentaire PRML";
String normalizedText = normalizer.normalize(text);
System.out.println(normalizedText);
}
}
Utilisez comme.
Il est développé dans le référentiel GitHub suivant. https://github.com/ikegami-yukino/neologdn-java
Contributions are welcome!
Recommended Posts