[JAVA] Wenn Sie Probleme mit dem Zeichencode-Problem in Myanmar (Burmesisch) haben

Über den Zeichencode in Myanmar

Myanmar ist eine der Regionen, in denen die Entwicklung der Internet-Technologie aufgrund ihres historischen Hintergrunds von der Welt zurückgeblieben ist. In der Vergangenheit war der Zawgyi-Zeichencode der Mainstream, aber als sich der Markt öffnet und die Internationalisierung voranschreitet, Es ändert sich zu UNICODE.

Im Falle Japans ähnelt es der Geschichte des Wechsels zu UTF8 ab dem Zeitpunkt, als es Websites wie EUC und SJIS gab. https://enjoy-yangon.com/ja/enyanblog/351-change-myanmar-font-zawgyi-to-unicode

Grundlegende Richtlinie für den Umgang mit verstümmelten Zeichen aufgrund gemischter Zeichencodes

Wenn Sie keine lokale Person sind, sind die Charaktere selbst verstümmelt, so dass wir Ingenieure und Programmierer nicht wissen, wo das Problem liegt. Wenn Sie jedoch Ingenieur sind, müssen Sie an der Lösung des Problems arbeiten.

Mit anderen Worten, Sie müssen die Anforderungen ermitteln, die zur Lösung des Problems erforderlich sind, und es mit Software lösen.

Anforderung 1 Zawgyi oder UNICODE können in Sätzen beurteilt werden Anforderung 2 Konvertierung des Zeichencodes von Zawgyi nach UNICODE

Diese beiden Punkte sind wesentliche Anforderungen.

In der tatsächlichen Umsetzung

Ich habe nach Github usw. gesucht. Das Google Myanmar Tool war ein Hit. https://github.com/google/myanmar-tools

Wenn Sie diesen Inhalt überprüfen, wird geschrieben, dass er eine Funktion zur Beurteilung von Zawgyi oder UNICODE hat. Benutze das.

Weitere Hinweise sind ausgeblendet. Verwenden Sie Rabit, um den Zeichencode von Zawgyi in UNICODE zu konvertieren

Rabbit-Converter https://github.com/Rabbit-Converter

Es wurden zwei Bibliotheken gefunden.

Mit PHP müssen Sie lediglich die Bibliothek mit Composer installieren, die Klasse laden und weitergeben. Es ist einfach zu bedienen.

    1. Beurteilen Sie den Zeichencode.
  1. Konvertieren

python


$ZawgyiDetector = new ZawgyiDetector();
$Rabbit = new Rabbit();
$text = 'Myanmar Text';
$check = $ZawgyiDetector->getZawgyiProbability($input1);

if($check >= 0.95){
  $newtext = $Rabbit->zg2uni($text);
}

Wenn Sie den Zeichencode wie folgt korrigieren, wird er in UNICODE korrekt angezeigt. Für UNICODE Myanmar-Schriftarten muss die UNICODE-Version der Webschrift auf CSS angewendet werden.

Kümmere dich um den Ein- und Ausgang

Wenn Sie bei Verwendung von CMS usw. diesen Code entweder beim Einfügen in die Datenbank oder beim Löschen eingeben, werden die verstümmelten Zeichen gelöst. Ich denke, es ist besser, eine Überprüfungsfunktion hinzuzufügen, wenn Sie sie in die Datenbank stellen. Wenn Sie diese Logik jedes Mal ausführen, ist das Rendern abhängig von der Anzahl der Zeichen langsam.

Es ist eine seltene Geschichte, aber wenn Sie im Myanmar-bezogenen Web arbeiten, beziehen Sie sich bitte darauf.

Wir sehen uns wieder.

Recommended Posts

Wenn Sie Probleme mit dem Zeichencode-Problem in Myanmar (Burmesisch) haben
Errate den Zeichencode in Java
Die Anwendung absorbiert den Unterschied im Zeichencode
Was tun, wenn Sie aktiviert haben? Verwenden Sie die WSL2-basierte Engine in Docker Desktop mit unzureichender WSL2-Installation
Rubys detaillierte Syntax: Wenn es Variablen und Methoden mit demselben Namen gibt
Wenn Sie Probleme mit JPA oder Hibernate haben, googeln Sie nicht und schauen Sie zuerst hier
In Redmine können Sie das Projekt mit Project.find (<Kennung>) abrufen.
Geben Sie beim Erstellen mit Maven den Zeichencode der Quelle an
Korrigieren Sie den Zeichencode in Java und lesen Sie von der URL
[Ruby] Problem mit der if-Anweisung
Wenn Sie die übergeordnete Klasse in Lomboks @builder aufnehmen möchten
Was tun, wenn Sie Ihr Root-Passwort unter CentOS7 vergessen haben?