J'ai décidé de secouer le rubis de la phrase kanji. Je l'ai fait dans le processus. Code ci-dessous
def hiragana_split(s):
#Divisez le texte original avec hiragana
#Liste de 50 sons
fifty_text = [chr(i) for i in range(12353, 12436)] + ['。', '、']
split_list = []
#Que ce soit hiragana
start_point = 0
section = ''
for i in range(len(s) - 1):
if not (s[i] in fifty_text) == (s[i + 1] in fifty_text):
split_list += [s[start_point:i + 1]]
start_point = i + 1
return split_list
if __name__ == '__main__':
s = 'Je n'ai aucune idée d'où je suis né. Je me souviens avoir pleuré dans un endroit sombre et humide.'
print(hiragana_split(s))
# ['où', 'Brut', 'C'était', 'S'inscrire', 'Je ne peux pas comprendre.', 'quoi', 'Mais', 'Faible', 'Harcèlement', 'Endroit', 'alors', 'Miaou miaou pleurer', 'Était là', 'Chose', 'Seulement', 'Mémoire']
Recommended Posts