Traitement linguistique 100 coups 2015 ["Chapitre 6: Traitement de texte anglais"](http: //www.cl.ecei) Il s'agit de l'enregistrement du 50e «coupure de phrase» de .tohoku.ac.jp / nlp100 / # ch6). Comparé au difficile 49, c'est très facile et cela ressemble à une courte pause. Utilisez des expressions régulières pour séparer les instructions.
Lien | Remarques |
---|---|
050.Pause de phrase.ipynb | Lien GitHub du programme de réponse |
100 coups de traitement du langage amateur:50 | Copiez et collez la source de nombreuses pièces source |
type | version | Contenu |
---|---|---|
OS | Ubuntu18.04.01 LTS | Il fonctionne virtuellement |
pyenv | 1.2.16 | J'utilise pyenv car j'utilise parfois plusieurs environnements Python |
Python | 3.8.1 | python3 sur pyenv.8.J'utilise 1 Les packages sont gérés à l'aide de venv |
Un aperçu des différentes technologies de base pour le traitement du langage naturel grâce au traitement de texte anglais à l'aide de la PNL Stanford Core.
Stanford Core NLP, Stemming, Part-word tagging, Unique expression extraction, Co-reference analysis, Dependency analysis, Clause structure analysis, S expression
Effectuez le traitement suivant sur le texte anglais (nlp.txt).
(. Ou; ou: ou?
import re
with open('./nlp.txt') as file_in, \
open('./050.result.txt', 'w') as file_out:
for line in file_in:
if line != '\n':
line = re.sub(r'''
(?<=[\.|;|:|\?|!]) #Avec un regard en arrière affirmatif. or ; or : or ? or !
\s #Vide(Cible de remplacement pour les sauts de ligne)
(?=[A-Z]) #Capitale anglaise avec anticipation affirmative
''', '\n', line, flags = re.VERBOSE)
print(line.rstrip(), file=file_out)
Cette fois, nous utilisons des assertions affirmatives d'anticipation et d'anticipation dans les expressions régulières. Bien qu'il ne soit pas inclus dans la cible de correspondance (cible de remplacement cette fois), il est utilisé comme condition de recherche. Pour plus d'informations, consultez ["Principes de base et astuces des expressions régulières Python apprises à partir de zéro"](https://qiita.com/FukuharaYohei/items/459f27f0d7bbba551af7#%E5%85%88%E8%AA%AD%E3%81%BF % E5% BE% 8C% E8% AA% AD% E3% 81% BF% E3% 82% A2% E3% 82% B5% E3% 83% BC% E3% 82% B7% E3% 83% A7% E3 Veuillez vous référer à% 83% B3).
Lorsque le programme est exécuté, les résultats suivants (uniquement les 10 premières lignes) sont émis.
text:050.result.txt(Seulement les 10 premières lignes)
Natural language processing
From Wikipedia, the free encyclopedia
Natural language processing (NLP) is a field of computer science, artificial intelligence, and linguistics concerned with the interactions between computers and human (natural) languages.
As such, NLP is related to the area of humani-computer interaction.
Many challenges in NLP involve natural language understanding, that is, enabling computers to derive meaning from human or natural language input, and others involve natural language generation.
History
The history of NLP generally starts in the 1950s, although work can be found from earlier periods.
In 1950, Alan Turing published an article titled "Computing Machinery and Intelligence" which proposed what is now called the Turing test as a criterion of intelligence.
The Georgetown experiment in 1954 involved fully automatic translation of more than sixty Russian sentences into English.
The authors claimed that within three or five years, machine translation would be a solved problem.
Recommended Posts