Sortie de données Excel en écriture séparée à l'aide de Python3 + xlrd + mecab

Objectif

Les données texte existent dans le fichier Excel, et les données texte sont divisées et sorties au format délimité par des tabulations (fichier tsv).

Environnement de vérification de fonctionnement

Mac OS 10.12.3 Python 3.6.0 mecab of 0.996 mecab-python3==0.7

Préparation

Installer mecab et dictionnaire

Installation avec Homebrew (Mac) Utiliser MeCab de Python 3 Ou faites-le et installez-le vous-même Activer le moteur d'analyse morphologique MeCab dans Python3 (version de mars 2016)

Installer des liaisons python

Utilisation de mecab avec Python3

Installez xlrd

[Python] Lire Excel avec des pandas

Code source

mecab.py


#!/usr/bin/env python

import xlrd
import MeCab
import sys

args = sys.argv

#Ouvrez le fichier Excel
book = xlrd.open_workbook(args[1])
sh = book.sheet_by_index(0)

# header
print("\t".join(('text','price')))

#Perspective avec option de division
t = MeCab.Tagger ("-Owakati")

#À propos de chaque ligne
for rx in range(1, sh.nrows):

    #Choisissez les colonnes dont vous avez besoin
    text = sh.cell_value(rowx=rx, colx=1)
    price = sh.cell_value(rowx=rx, colx=2)

    #Supprimer les sauts de ligne
    text = text.replace('\n','').replace('\r','')

    try:
        #Suppression de perspective et de saut de ligne
        m = t.parse(text).replace('\n','')

        #production
        print( "\t".join((m, price)) )

    except RuntimeError as e:
        print("RuntimeError:" + e)

Courir

$ ./mecab.py [nom de fichier Excel]





Recommended Posts

Sortie de données Excel en écriture séparée à l'aide de Python3 + xlrd + mecab
Entrée / sortie de données en Python (CSV, JSON)
Obtenez des données Youtube en Python à l'aide de l'API Youtube Data
Résumé des opérations Excel utilisant OpenPyXL en Python
Nettoyage des données à l'aide de Python
Sortie japonaise avec Python
Programmation Python avec Excel
Créer un bot de collecte de données en Python à l'aide de Selenium
Enregistrez collectivement des données dans Firestore à l'aide d'un fichier csv en Python
Obtenez des données LEAD à l'aide de l'API REST de Marketo en Python
Gérer les données ambiantes en Python
Afficher les données UTM-30LX en Python
Gonfler des données textuelles par retranslation à l'aide de Google Traduction en Python
Graphique des données de séries chronologiques en Python à l'aide de pandas et matplotlib
Un mémo que j'ai écrit une fonction de base en Python en utilisant la récurrence
Analyse de données à l'aide de pandas python
Traduit à l'aide de googletrans en Python
Utilisation du mode Python dans le traitement
Lire la sortie Fortran avec python
[Python ORM] Notation lors de l'écriture de SQL à l'aide de sous-requêtes dans la clause IN dans SQL Alchemy
Obtenez des données LeapMotion en Python.
Programmation GUI en Python avec Appjar
Précautions lors de l'utilisation de Pit avec Python
Acquisition de données à l'aide de l'API googlemap de python
Lire les données des tampons de protocole avec Python3
Obtenir des données de Quandl en Python
Remarques sur l'utilisation de MeCab depuis Python
Gérez les données au format NetCDF avec Python
Essayez d'utiliser LevelDB avec Python (plyvel)
Rendre la sortie standard non bloquante en Python
Windows10: Installation de la bibliothèque MeCab pour python
Utilisation de variables globales dans les fonctions python
Hashing de données en R et Python
Voyons voir l'utilisation de l'entrée en python
Puissance totale en Python (en utilisant functools)
Exporter et exporter des fichiers en Python
Création de graphique Excel à l'aide de python xlwings
Sortie interactive de BPE à l'aide de curses python
Lire et écrire du texte en Python
Reconnaissance de caractères manuscrits à l'aide de KNN en Python
le codeur Web a essayé d'exceller en Python
Essayez d'utiliser LeapMotion avec Python
Recherche de priorité de profondeur à l'aide de la pile en Python
Lors de l'utilisation de MeCab avec python dans virtualenv
Lors de l'utilisation d'expressions régulières en Python
Lors de l'écriture d'un programme en Python
Création d'interface graphique en python avec tkinter 2
Comment tracer les données de lumière visible d'une galaxie à l'aide de la base de données OpenNGC en python
Obtenez des données supplémentaires vers LDAP avec python
Fonctionnement de la souris à l'aide de l'API Windows en Python
Notes utilisant cChardet et python3-chardet dans Python 3.3.1.
Essayez d'utiliser l'API Wunderlist en Python
De Python à l'utilisation de MeCab (et CaboCha)
Création d'interface graphique en python à l'aide de tkinter partie 1
Obtenir l'équilibre Suica en Python (en utilisant libpafe)
Pratique d'utilisation de ceci en Python (mauvais)
Hachez lentement les mots de passe en utilisant bcrypt en Python
Livre Ali en python: Sec.2-4, structure de données
Utilisation de venv dans un environnement Windows + Docker [Python]