Parmi les tâches imposées à l'université cette fois, les suivantes étaient les tâches de préparation.
① Créer une base de données de 1000 phrases en anglais en utilisant Internet Assurez-vous que vous n'avez pas la même phrase ici.
Comme prévu, il est difficile de juger visuellement s'il y a des phrases en double quand il y a 1000 phrases, c'est donc un programme après avoir pensé à écrire avec python que je pratique récemment
check.py
# -*- coding: utf-8 -*-
import sys
str1 =""
try:
file_name = sys.argv[1]
except IndexError:
print('Usage: {0} TEXTFILE'.format(file_name))
sys.exit(1)
with open(file_name, 'r') as f:
#Les doublons disparaissent en en faisant un type collectif (l'ordre n'est pas garanti)
# .rstrip()Cela élimine le besoin d'insérer un saut de ligne sur la dernière ligne
unique_texts = {line.rstrip() for line in f}
for i in unique_texts:
str1 += i+"\n"
with open(file_name + '.disticted.txt', 'w') as f:
f.writelines(str1)
Puisque ce programme compare une phrase du texte tel quel, il ne sera pas supprimé lorsque la dernière phrase sera dupliquée à moins qu'un saut de ligne ne soit effectué après la dernière phrase.
J'ai modifié la demande d'édition de hatchinee et l'ai modifiée à nouveau.