Collecter des informations depuis Twitter avec Python (construction de l'environnement)

Système à faire cette fois

7b140c972221df05d34479ef3cdd851e.png

Explorez les informations de Twitter, formatez les informations et créez un système pour les stocker dans la base de données. Pour le moment, créez un environnement de test sur l'environnement virtuel en utilisant Vagrant comme expérience.

Construire un environnement autour d'une machine virtuelle

Installation de VirtualBox

Installez la dernière version depuis https://www.virtualbox.org/wiki/Downloads.

Créez un environnement virtuel à partir de Vagrant.

Installez Vagrant

Téléchargez et installez la dernière version à partir de http://www.vagrantup.com/downloads.

Créer une machine virtuelle

Créez un environnement virtuel avec Vagrant.

$ mkdir -p ~/vagrant/debian7_twitter
$ vagrant box add debian7.6_twitter https://github.com/jose-lpa/packer-debian_7.6.0/releases/download/1.0/packer_virtualbox-iso_virtualbox.box
$ vagrant init debian7.6_twitter
$ vagrant up
$ vagrant ssh

Vous pouvez maintenant vous connecter à l'environnement virtuel.

Si vous souhaitez quitter, après vous être déconnecté

$ vagrant halt

Vous pouvez terminer par. Après cela, sous le répertoire où l'environnement virtuel a été créé, Vous pouvez vous connecter à cet environnement à tout moment avec vagrant up-> vagrant ssh.

Paramètres autour de Python

Python Python 2.7.3 est installé par défaut, alors utilisez-le.

$ Python -V
Python 2.7.3

virtualenv Utilisez virtualenv pour gérer les modules utilisés projet par projet.

Installation

Utilisez apt.

$ sudo apt-get update
$ sudo apt-get install python-dev python-virtualenv

Changer d'environnement Python avec virtualenv

Accédez à n'importe quel répertoire de travail et exécutez la commande suivante.

$ virtualenv twi-py

Cela créera un répertoire twi-py dans le répertoire courant, et un environnement Python indépendant sera créé ici. Accédez au répertoire créé et exécutez la commande suivante.

$ source bin/activate

Si (twi-py) ... est ajouté au début de l'invite du shell, l'environnement est passé à twi-py.

Pour quitter l'environnement de module spécifique et revenir à la valeur par défaut, exécutez la commande suivante.

$ deactivate 

Après cela, installez les modules liés à MeCab dans cet environnement twi-py.

Paramètres autour de MeCab

Installation de l'unité principale MeCab

Utilisez apt.

$ sudo apt-get update
$ sudo apt-get -y install mecab
$ sudo apt-get -y install mecab-ipadic-utf8
$ sudo update-alternatives --config mecab-dictionary # ipadic-Vérifiez si c'est utf8

Installer la liaison Python de MeCab (mecab-python)

Installation des bibliothèques requises avec apt.

$ sudo apt-get -y install python-dev
$ sudo apt-get -y install libmecab-dev
$ sudo apt-get -y install build-essential
$ sudo apt-get -y install g++

Installez la version des liaisons Python pour Debian 7 wheezy sous l'environnement twi-py.

(twi-py)$ pip install https://mecab.googlecode.com/files/mecab-python-0.99.tar.gz

Vérification du fonctionnement de MeCab et Python

Analysons la morphologie du «hors des cuisses et des cuisses».

$ Python
>>> import MeCab
>>> mecab = MeCab.Tagger("-Ochasen")
>>> print mecab.parse("Des cuisses et des cuisses")
Sumomo Sumomo substantif-Général
Les deux mo et mo-Assistance
Nomenclature de la pêche de la cuisse-Général
Les deux mo et mo-Assistance
Nomenclature de la pêche de la cuisse-Général
L'assistant de Nono-syndicat
Uchi Uchi Noun-Non indépendant-Avocat possible
EOS

>>>

J'ai pu l'analyser correctement.

Maintenant, nous avons tous les outils pour réaliser le système que nous allons créer cette fois.

Paramètres MySQL

Installation

Installé à l'aide d'apt.

Paramètres MySQL

Installation

Installé à l'aide d'apt.

$ sudo apt-get -y install libmysqlclient-dev
$ sudo apt-get -y install mysql-server-5.5

Lors de l'installation, il vous sera demandé de définir un mot de passe root, alors entrez vagrant.

Contrôle de fonctionnement

Connectez-vous en tant qu'utilisateur root.

$ mysql -u root -pvagrant
mysql> SELECT user,host,password FROM mysql.user; 
+------------------+----------------------------------+-------------------------------------------+
| user             | host                             | password                                  |
+------------------+----------------------------------+-------------------------------------------+
| root             | localhost                        | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| root             | packer-virtualbox-iso-1411922062 | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| root             | 127.0.0.1                        | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| root             | ::1                              | *04E6E1273D1783DF7D57DC5479FE01CFFDFD0058 |
| debian-sys-maint | localhost                        | *A5B3FEE41C7F1F2C147B4876D39D6A4F65E79B7D |
+------------------+----------------------------------+-------------------------------------------+

Cela a fonctionné en toute sécurité.

Installez des modules Python pour accéder à MySQL

Installé sous l'environnement twi-py.

(twi-py)$ pip install MySQL-python

Contrôle de fonctionnement

$ python
>>> import MySQLdb

S'il n'y a pas d'erreur avec cela, c'est OK.

finalement

Vous disposez désormais de tous les outils dont vous avez besoin. Désormais, nous allons créer la partie crawl, la partie de moulage d'informations, la partie store dans la base de données, etc. Ces articles viendront plus tard.

Recommended Posts

Collecter des informations depuis Twitter avec Python (construction de l'environnement)
Collecter des informations sur Twitter avec Python (API Twitter)
Collecte d'informations sur Twitter avec Python (analyse morphologique avec MeCab)
Collecte d'informations sur Twitter avec Python (intégration de MySQL et Python)
De la construction d'environnement Python à la construction d'environnement virtuel avec anaconda
Commencez avec Python! ~ ① Construction de l'environnement ~
Construction de l'environnement Python3 avec pyenv-virtualenv (CentOS 7.3)
Construction de l'environnement pytorch @ python3.8 avec pipenv
OpenJTalk sur Windows10 (parler japonais avec Python depuis la construction de l'environnement)
Construction d'environnement (python)
construction d'environnement python
Python - Construction de l'environnement
Construction de l'environnement Python
Tweet de python avec Twitter Developer + Tweepy
Entendons-nous bien avec Python # 0 (Construction de l'environnement)
Collecter des tweets avec Python
Construction d'environnement explosif Python à partir de zéro (Mac)
construction d'environnement python homebrew
Construction de l'environnement de développement Python
Construction d'environnement Poetry-virtualenv avec python de centos-sclo-rh ~ Notes
environnement python avec docker-compose
Construction de l'environnement de développement python2.7
Premier python ① Construction de l'environnement avec pythonbrew & Hello World !!
Environnement virtuel avec Python 3.6
Construction de l'environnement Python @ Win7
Construction d'environnement virtuel avec Docker + Flask (Python) + notebook Jupyter
[Python] Construction de l'environnement OpenCV avec Docker (cv2.imshow () fonctionne également)
De Kafka à KSQL - Construction d'environnement facile avec docker
Construction d'un environnement d'analyse de données avec Python (notebook IPython + Pandas)
Application Web réalisée avec Python3.4 + Django (Construction de l'environnement Part.1)
Construction de l'environnement de développement Python 2020 [De l'installation de Python à l'introduction à la poésie]
Construction d'environnement avec anyenv + pyenv (migrer depuis pyenv uniquement (Mac))
Construction de l'environnement de développement de plug-in QGIS3 Python avec VSCode (macOS)
Procédure pour convertir un fichier python en exe à partir de la construction de l'environnement Ubunts
[Bases de la science des données] Collecte de données depuis RSS avec python
Installer l'environnement Python avec Anaconda
Mémo graphique Twitter avec Python
Obtenez la chronologie Twitter avec Python
Gérez l'environnement python avec virtualenv
Utiliser l'API Twitter avec Python
Informations obtenues à partir de tweet_id (Python)
Construction de l'environnement Python (Windows10 + Emacs)
Construction de l'environnement CI ~ Édition Python ~
Créer un environnement python3 avec ubuntu 16.04
Construction de l'environnement Python pour Mac
Procédure de construction de l'environnement python Anaconda3
Préparer l'environnement python3 avec Docker
Construire un environnement python avec direnv
Construction de l'environnement Python3 (pour les débutants)
Construction d'environnement Python et TensorFlow
Construire un environnement Python sous un environnement Windows 7
[MEMO] [Construction de l'environnement de développement] Python
Rechercher des tweets Twitter avec Python
Construction de l'environnement de python2 & 3 (OSX)
Avec skype, notifiez avec skype de python!
Obtenez des informations sur l'alambic avec Python