Myanmar ist eine der Regionen, in denen die Entwicklung der Internet-Technologie aufgrund ihres historischen Hintergrunds von der Welt zurückgeblieben ist. In der Vergangenheit war der Zawgyi-Zeichencode der Mainstream, aber als sich der Markt öffnet und die Internationalisierung voranschreitet, Es ändert sich zu UNICODE.
Im Falle Japans ähnelt es der Geschichte des Wechsels zu UTF8 ab dem Zeitpunkt, als es Websites wie EUC und SJIS gab. https://enjoy-yangon.com/ja/enyanblog/351-change-myanmar-font-zawgyi-to-unicode
Wenn Sie keine lokale Person sind, sind die Charaktere selbst verstümmelt, so dass wir Ingenieure und Programmierer nicht wissen, wo das Problem liegt. Wenn Sie jedoch Ingenieur sind, müssen Sie an der Lösung des Problems arbeiten.
Mit anderen Worten, Sie müssen die Anforderungen ermitteln, die zur Lösung des Problems erforderlich sind, und es mit Software lösen.
Anforderung 1 Zawgyi oder UNICODE können in Sätzen beurteilt werden Anforderung 2 Konvertierung des Zeichencodes von Zawgyi nach UNICODE
Diese beiden Punkte sind wesentliche Anforderungen.
Ich habe nach Github usw. gesucht. Das Google Myanmar Tool war ein Hit. https://github.com/google/myanmar-tools
Wenn Sie diesen Inhalt überprüfen, wird geschrieben, dass er eine Funktion zur Beurteilung von Zawgyi oder UNICODE hat. Benutze das.
Weitere Hinweise sind ausgeblendet. Verwenden Sie Rabit, um den Zeichencode von Zawgyi in UNICODE zu konvertieren
Rabbit-Converter https://github.com/Rabbit-Converter
Es wurden zwei Bibliotheken gefunden.
Mit PHP müssen Sie lediglich die Bibliothek mit Composer installieren, die Klasse laden und weitergeben. Es ist einfach zu bedienen.
python
$ZawgyiDetector = new ZawgyiDetector();
$Rabbit = new Rabbit();
$text = 'Myanmar Text';
$check = $ZawgyiDetector->getZawgyiProbability($input1);
if($check >= 0.95){
$newtext = $Rabbit->zg2uni($text);
}
Wenn Sie den Zeichencode wie folgt korrigieren, wird er in UNICODE korrekt angezeigt. Für UNICODE Myanmar-Schriftarten muss die UNICODE-Version der Webschrift auf CSS angewendet werden.
Wenn Sie bei Verwendung von CMS usw. diesen Code entweder beim Einfügen in die Datenbank oder beim Löschen eingeben, werden die verstümmelten Zeichen gelöst. Ich denke, es ist besser, eine Überprüfungsfunktion hinzuzufügen, wenn Sie sie in die Datenbank stellen. Wenn Sie diese Logik jedes Mal ausführen, ist das Rendern abhängig von der Anzahl der Zeichen langsam.
Es ist eine seltene Geschichte, aber wenn Sie im Myanmar-bezogenen Web arbeiten, beziehen Sie sich bitte darauf.
Wir sehen uns wieder.
Recommended Posts