Résumé de ce que j'ai appris en lisant la documentation Python 2.7
Unicode HOWTO — Python 2.7.13 documentation https://docs.python.org/2/howto/unicode.html
7.8. codecs — Codec registry and base classes — Python 2.7.13 documentation https://docs.python.org/2/library/codecs.html#encodings-and-unicode
Les numéros 0-127 ont été attribués aux lettres par ASCII (American Standard Code for Information Interchange). Exemple) a: 97
$ python -V
Python 2.7.10
>>> unichr(97)
u'a'
>>> ord('a')
97
unichr(i) - 2. Built-in Functions — Python 2.7.13 documentation ord(i) - 2. Built-in Functions — Python 2.7.13 documentation
Cependant, il ne pouvait pas représenter les caractères é et russe Kirill utilisés en Europe.
Les ordinateurs 8 bits (2 ^ 8 = 256) sont devenus courants et 128 à 255 ont chacun reçu des caractères dans leur propre format.
Unicode a été développé pour éliminer cette différence.
Unicode
The Unicode standard describes how characters are represented by code points.
Character: a code points: 97 (0x61)
Initialement, Unicode utilisait 16 bits (65 536). Il a actuellement une largeur de 0 à 1 114 111 (0x10ffff).
a Unicode string is a sequence of code points, which are numbers from 0 to 0x10ffff.
Encodings
The rules for translating a Unicode string into a sequence of bytes are called an encoding.
>>> 'a'.encode('hex')
'61'
$ python -V
Python 2.7.10
>>> s = 'a b c x y z'
>>> s.encode('hex')
'612062206320782079207a'
ʻAest entré avec
CTRL-v + u0061`.
Recommended Posts