Manipulation de chaîne en python
Résumé des opérations de base sur les chaînes en python
Je l'oublie souvent, alors prends note
Déterminer si une chaîne est incluse
"ho" in "hoge" # True
Modifier et supprimer des sous-chaînes
"hogehoge".replace('h', 'k') # "kogekoge"
"hogehoge".replace('h', '') # "ogeoge"
Convertir un tableau en chaîne (bien sûr, le contenu peut être converti en chaîne)
"".join([str(x) for x in l]) # "Chaîne"
"\t".join([str(x) for x in l]) # "tsv"
Nombre de fréquences d'occurrence d'une chaîne de caractères spécifique
"hogehoge".count('h') # 2
Nombre de mots * Cependant, l'analyse morphologique est terminée et elle est séparée par des espaces.
from collections import Counter
Counter("hoge nga kuke".split()) # {"hoge":1, "nga":1, "kuke":1}
Conversion mutuelle de caractères en code ASCII
ord('a') # 97
chr(97) # a
Extraire le japonais avec des expressions régulières (Hiragana)
import re
jap = re.compile("[Ah-Hmm]")
print(jap.findall("Hogehoge nga ward cheveux")) # ['Ho','Ge','Ho','Ge']
Je ferai de mon mieux en Unicode pour les kanji et les symboles
Unicode:Wikipedia => http://ja.wikipedia.org/wiki/Unicode
- Petits mots
Lorsqu'on traite du japonais avec python, utilisons le système 3 (autodiscipline
Raison: http://www.pythonweb.jp/tutorial/string/index5.html