Le Myanmar est l'une des régions où le développement de la technologie Internet a été laissé à l'écart du monde en raison de son histoire. Dans le passé, le code de caractère Zawgyi était le plus courant, mais à mesure que le marché s'ouvre et que l'internationalisation progresse, Il passe à UNICODE.
Dans le cas du Japon, cela ressemble à l'histoire du passage à UTF8 à partir de l'époque où il y avait des sites Web tels que EUC et SJIS. https://enjoy-yangon.com/ja/enyanblog/351-change-myanmar-font-zawgyi-to-unicode
Si vous n'êtes pas une personne locale, les personnages eux-mêmes sont brouillés, il est donc vrai que nous, ingénieurs et prorameurs, ne savons pas quel est le problème. Cependant, si vous êtes ingénieur, vous devez travailler à la résolution du problème.
En d'autres termes, vous devez déterminer les exigences nécessaires pour résoudre le problème et le résoudre avec un logiciel.
Exigence 1 Zawgyi ou UNICODE peuvent être jugés en phrases Exigence 2 Conversion de code de caractère de Zawgyi à UNICODE
Ces deux points sont des exigences essentielles.
J'ai cherché Github etc. L'outil Google Myanmar a été un succès. https://github.com/google/myanmar-tools
Si vous vérifiez ce contenu, il est écrit qu'il a une fonction pour juger Zawgyi ou UNICODE. Utilisez ceci.
D'autres indices sont cachés, utilisez Rabit pour convertir le code de caractère de Zawgyi en UNICODE
Rabbit-Converter https://github.com/Rabbit-Converter
Deux bibliothèques ont été trouvées.
Avec PHP, tout ce que vous avez à faire est d'installer la bibliothèque avec composer, de charger la classe et de la transmettre. C'est facile à utiliser.
python
$ZawgyiDetector = new ZawgyiDetector();
$Rabbit = new Rabbit();
$text = 'Texte du Myanmar';
$check = $ZawgyiDetector->getZawgyiProbability($input1);
if($check >= 0.95){
$newtext = $Rabbit->zg2uni($text);
}
Si vous corrigez le code de caractère de cette manière, il s'affichera correctement dans UNICODE. Pour les polices UNICODE Myanmar, la version UNICODE de la police Web doit être appliquée au CSS.
Lorsque vous utilisez CMS, etc., si vous insérez ce code lorsque vous le mettez dans la base de données ou lorsque vous le sortez, les caractères déformés seront résolus. Je pense qu'il est préférable d'ajouter une fonction de vérification lors de la mise dans la base de données. Si vous exécutez cette logique à chaque fois, le rendu sera lent en fonction du nombre de caractères.
C'est une histoire rare, mais si vous travaillez sur le Web lié au Myanmar, veuillez vous y référer.
À la prochaine.
Recommended Posts