7.1.1 Unicode
--Unicode est une norme internationale en développement qui cherche à définir des symboles pour toute la littérature et les mathématiques des langues du monde et d'autres disciplines.
>>> def unicode_test(v):
... import unicodedata
#Extraire le nom des lettres
... name=unicodedata.name(v)
#Extrayez une chaîne du nom.
... v2=unicodedata.lookup(name)
... print("v=%s,name=%s,v2=%s"%(v,name,v2))
...
>>> unicode_test("A")
v=A,name=LATIN CAPITAL LETTER A,v2=A
#Symbole ASCII Unicode
>>> unicode_test("$")
v=$,name=DOLLAR SIGN,v2=$
#Symbole monétaire Unicode
>>> unicode_test("\u00a2")
v=¢,name=CENT SIGN,v2=¢
>>> unicode_test("\u20ac")
v=€,name=EURO SIGN,v2=€
#Affichage de symboles alternatifs
>>> unicode_test("\u2603")
v=☃,name=SNOWMAN,v2=☃
>>> place = "cafe"
>>> place
'cafe'
>>> import unicodedata
>>> unicodedata.name('\u00e9')
'LATIN SMALL LETTER E WITH ACUTE'
>>> unicodedata.lookup('LATIN SMALL LETTER E WITH ACUTE')
'é'
#Spécifiez une chaîne de caractères par code
>>> place = "caf\u00e9"
>>> place
'café'
#Chaîne de caractères spécifiée par nom
>>> place = "caf\N{LATIN SMALL LETTER E WITH ACUTE}"
>>> place
'café'
>>> u="\N{LATIN SMALL LETTER U WITH DIAERESIS}"
>>> u
'ü'
#len()Compte le nombre de caractères Unicode, pas le nombre d'octets.
>>> len("&")
1
>>> len("\U0001f47b")
1
Il y a pas mal de mots que je ne me souviens pas avoir entendus, comme l'encodage, le décodage et les chaînes d'octets. Vérifions chacun d'eux.
"Introduction à Python3 par Bill Lubanovic (publié par O'Reilly Japon)"
Recommended Posts