Remplacez la représentation unique du fichier texte lu par une étiquette (en utilisant GiNZA)

J'ai eu du mal comme ça, donc je vais le poster pour le moment. Il y a peut-être un meilleur moyen. Si vous êtes un débutant comme moi, veuillez vous y référer.

L'environnement est python 3.6.9 et Ubuntu 18.04.4.

change_NER.py


# coding:utf-8
import spacy

with open('input.txt','r') as f:
  nlp = spacy.load('ja_ginza')
  data = f.read()
  doc = nlp(data)

with open('output.txt','w') as f:

    text = list(data)                               #Enregistrer le personnage dans la liste
    entity = [ent.label_ for ent in doc.ents]       #Étiquette d'expression unique
    start = [ent.start_char for ent in doc.ents]    #De quel caractère est l'expression unique
    end = [ent.end_char for ent in doc.ents]        #Combien de caractères sont des expressions uniques
    num = 0                                        
    stop = False

    for i in range(len(text)):
        if i == start[num]:
            f.write(entity[num])
            if num < len(start) - 1: #Prévention hors de portée
                num += 1
            stop = True

        elif stop == True:
            if i < end[num-1]: #Seul le nombre de caractères dans l'expression unique
                continue    #Consommer je
            elif i == end[num-1]:
                stop = False
                f.write(text[i])

        else:
            f.write(text[i])

Recommended Posts

Remplacez la représentation unique du fichier texte lu par une étiquette (en utilisant GiNZA)
Lisez le fichier en Python avec un chemin relatif depuis le programme
Remplacez le nom du répertoire et le nom du fichier dans le répertoire par une commande Linux.
Obtenir le nom de fichier dans un dossier à l'aide de glob
[Sublime Text 2] Toujours exécuter un fichier spécifique dans le projet
Traitez le contenu du fichier dans l'ordre avec un script shell
[Python] Lire un fichier csv avec une grande taille de données à l'aide d'un générateur
Un mémo organisé en renommant les noms de fichiers dans le dossier avec python
Extraire les lignes qui correspondent aux conditions d'un fichier texte avec python
Lire le fichier Python # .txt pour Python super débutant super débutant avec travail .py
Lisons le fichier RINEX avec Python ①
Créer un gros fichier texte avec shellscript
Lisez le fichier ligne par ligne avec Python
Lisez le fichier ligne par ligne avec Python
Créer un enregistrement avec des pièces jointes dans KINTONE à l'aide du module de requêtes Python
Lire le fichier de données de caractères avec numpy
[Python] Lire la ligne spécifiée dans le fichier
Lire des caractères dans des images avec Python OCR
Différentes façons de lire la dernière ligne d'un fichier csv en Python
Enregistrez les conditions de paramétrage sous forme de fichier CSV à l'aide de UDF Manager avec OCTA
Comment lire un fichier CSV avec Python 2/3
Créer un fichier GIF en utilisant Pillow en Python
[Python] Récupérez les fichiers dans le dossier avec Python
Parler en japonais avec OpenJtalk (lire un fichier texte)
Lire un fichier contenant des lignes brouillées en Python
Parler en japonais avec gTTS (lire un fichier texte)
Effectuer une analyse d'entité à l'aide de spaCy / GiNZA en Python
Enregistrer l'objet dans un fichier avec pickle
Créez un fichier MIDI en Python en utilisant pretty_midi
Lire ligne par ligne à partir d'un fichier avec Python
Comment lire des fichiers dans différents répertoires
J'ai essayé d'extraire le texte du fichier image en utilisant Tesseract du moteur OCR
Python2 / numpy> Remplacer uniquement une colonne spécifique d'un fichier par les données de colonne d'un autre fichier> numpy.c_
Je souhaite extraire uniquement les pods avec l'étiquette spécifiée à l'aide du sélecteur d'étiquettes dans Client-go
Convertir un fichier texte avec des valeurs hexadécimales en fichier binaire
Lisez le fichier csv et affichez-le dans le navigateur
Lire la liste de liens au format csv avec l'outil graphique
Exécuter un fichier Python avec une importation relative dans PyCharm
Enregistrez le modèle pystan et les résultats dans un fichier pickle
[Python] Lisez le fichier csv et affichez la figure avec matplotlib
Accédez au fichier avec un chemin relatif à partir du script d'exécution.
Renommez et remplacez les fichiers distants en utilisant NcFTP dans le shell
Lire le fichier GRIB2 de l'Agence météorologique sur pygrib
Traitez les fichiers du dossier dans l'ordre avec le script shell
Comment générer une requête à l'aide de l'opérateur IN dans Django
[Note] Importation de fichiers dans le répertoire parent en Python
Lisez le fichier VTK et affichez la carte des couleurs avec jupyter.
Paramètres d'exécution d'un test à chaque fois que vous enregistrez un fichier dans l'éditeur à l'aide de watchmedo (chien de garde)