Cartes du Nouvel An envoyées chaque année ... Lorsque j'organisais ma chambre, j'ai reçu beaucoup de cartes du Nouvel An de mes seniors et juniors. Je me suis demandé si cela pouvait être utile.
Ensuite, j'ai eu l'idée que je pouvais me visualiser comme vu par les autres à travers la carte du Nouvel An. Je me suis demandé si la soi-disant auto-analyse pouvait être faite par le biais de la carte du Nouvel An.
À bien y penser, quand j'écris à une autre personne, j'écris avec les impressions et les épisodes de cette personne de l'année dernière. Je me suis demandé si c'était la même chose pour les autres.
Vous devriez pouvoir extraire votre impression de vous-même en analysant morphologiquement la carte du Nouvel An ... Je voulais en faire un nuage de mots et visualiser mon impression des autres.
Tout d'abord, nous devons collecter les données à analyser, nous allons donc résumer le contenu de la carte du Nouvel An dans Excel.
Comme ça, je suis entré sans les salutations ridicules de Happy New Year et Kotoyoro. Autant que possible, j'ai essayé de n'entrer que des mots liés à mes impressions et épisodes.
Ensuite, combinez l'Excel entré en une seule donnée
python
import xlrd
wb = xlrd.open_workbook('/nenga2020.xlsx')
sheet = wb.sheet_by_name('Sheet1')
col_values = sheet.col_values(0)
text=""
for i in col_values:
text=text+i
print(text)
Cela signifie que le texte contient tout le texte de la carte du Nouvel An.
Enfin, l'analyse morphologique et la création de nuages de mots se font à partir d'ici.
import MeCab
import wordcloud, codecs
m = MeCab.Tagger("")
text = text.replace('\r', '')
parsed = m.parse(text)
splitted = ' '.join(
[x.split('\t')[0] for x in parsed.splitlines()[:-1] if x.split('\t')[1].split(',')[0] in ["nom","adjectif","Verbe adjectif"] ])
wordc = wordcloud.WordCloud(font_path='HGRGM.TTC',
background_color='white',
contour_color='steelblue',
contour_width=2).generate(splitted)
wordc.to_file('nenga2020.png')
Cela résoudra l'impression écrite sur la carte du Nouvel An.
python
splitted = ' '.join(
[x.split('\t')[0] for x in parsed.splitlines()[:-1] if x.split('\t')[1].split(',')[0] in ["nom","adjectif","Verbe adjectif"] ])
À propos, les parties sont réduites à la nomenclature, aux adjectifs et aux verbes adjectifs. C'est parce que le but est d'extraire mon impression.
Code entier
import xlrd
import MeCab
import wordcloud, codecs
wb = xlrd.open_workbook('/nenga2020.xlsx')
sheet = wb.sheet_by_name('Sheet1')
col_values = sheet.col_values(0)
text=""
for i in col_values:
text=text+i
m = MeCab.Tagger("")
text = text.replace('\r', '')
parsed = m.parse(text)
splitted = ' '.join(
[x.split('\t')[0] for x in parsed.splitlines()[:-1] if x.split('\t')[1].split(',')[0] in ["nom","adjectif","Verbe adjectif"] ])
wordc = wordcloud.WordCloud(font_path='HGRGM.TTC',
background_color='white',
contour_color='steelblue',
contour_width=2).generate(splitted)
wordc.to_file('nenga2020.png')
Et voici le nuage de mots complet pour l'auto-analyse.
J'ai reçu beaucoup de cartes du Nouvel An du club de Kendo, donc il y a beaucoup de mots liés ...
Des mots tels que drôle, compétent et respect sont considérés comme mes impressions des autres.
Recommended Posts