Défiez le text mining avec Python. (Pour la série Python3) Suivez les étapes ci-dessous.
① Analyse morphologique (précédente) ② Visualisation avec Word Cloud (cette fois) ③ Analyse morphologique de documents japonais et visualisation avec Word Cloud (la prochaine fois)
Selon le dictionnaire goo, «Sélectionnez plusieurs mots qui apparaissent fréquemment dans une phrase et classez-les en fonction de leur fréquence. Méthode illustrée. (Omis) En modifiant non seulement la taille des caractères, mais également la couleur, la police et l'orientation, le contenu du texte peut être impressionné en un coup d'œil. "
En bref, ↓ un tel gars.
Userlocal a publié Web Service gratuitement, mais je vais essayer ceci avec Python. ..
Il semble y avoir word_cloud publié par Andreas Mueller qui peut être utilisé en Python, donc ceci Essayez d'utiliser.
Il peut être installé avec pip.
sudo pip3 install wordcloud
J'ai pu l'installer en douceur, je vais donc l'essayer. Il semble qu'il soit nécessaire de passer une chaîne de caractères séparés par un espace demi-largeur, donc pour l'instant, en anglais. Le sujet est le début du discours d'investiture du président Trump.
wordcloud_sample.py
# coding: utf-8
from wordcloud import WordCloud
text = "Chief Justice Roberts, President Carter, President Clinton, President \
Bush, President Obama, fellow Americans, and people of the world: \
thank you. We, the citizens of America, are now joined in a great \
national effort to rebuild our country and to restore its promise for \
all of our people. \
Together, we will determine the course of America and the world for \
years to come. \
We will face challenges. We will confront hardships. But we will get \
the job done. \
Every four years, we gather on these steps to carry out the orderly \
and peaceful transfer of power, and we are grateful to President Obama \
and First Lady Michelle Obama for their gracious aid throughout this \
transition. They have been magnificent."
wordcloud = WordCloud(background_color="white",
font_path="/usr/share/fonts/truetype/takao-gothic/TakaoPGothic.ttf",
width=800,height=600).generate(text)
wordcloud.to_file("./wordcloud_sample.png ")
Pour l'expliquer brièvement, créez un objet WordCloud avec les paramètres liés à l'image à créer comme argument, passez la chaîne de caractères à dessiner à la méthode generate () et initialisez-la. Cela ressemble à une sortie dans un fichier image avec la méthode to_file (). Voir Référence officielle pour les arguments du constructeur.
L'image créée en déplaçant l'échantillon ci-dessus est celle du début.
python3 wordcloud_sample.py
Recommended Posts