Ceci est utilisé lorsque vous souhaitez copier et coller un document à partir d'un pdf et le traduire dans Google. Ouvrez la sortie conv.html et cliquez avec le bouton droit de la souris pour traduire. J'en avais besoin rapidement, alors je l'ai rendu incroyablement adapté. Il n'y a aucun plan de maintenance.
"""
Ceci est utilisé lorsque vous souhaitez copier et coller un document à partir d'un pdf et le traduire dans Google.
.Compte tenu du chemin de txt_conv.Puisqu'il est sorti au format HTML, ouvrez-le avec chrome et cliquez avec le bouton droit pour traduire.
· Que fais tu
ctrl en pdf+Si vous le collez avec A, les sauts de ligne seront perdus et il ne se traduira pas bien.
L'éviter.
"""
import sys
import os
filepath = sys.argv[1]
# ---Traiter le texte pour la traduction Google
with open(filepath, "r", encoding="utf-8") as f:
lines = f.readlines()
newlines = []
lenbuf = [] #tampon len ligne
for line in lines:
if len(line) >= 2:
if line[-2] == ".": #Insérer un saut de ligne si la fin est un point
line = line[:-1] + "<br>"
else: #Sinon, mettez un espace
line = line[:-1] + " "
newlines.append(line)
lenbuf.append(len(line))
f.close()
# ---S'il est préférable d'insérer un saut de ligne, insérez un saut de ligne(longueur de ligne moyenne*0.Définir 8 comme seuil)
ave_len = sum(lenbuf) / len(lenbuf)
for n, linelen in enumerate(lenbuf):
if linelen < ave_len * 0.8:
newlines[n] = newlines[n] + "<br>"
# ---_Économisez avec conv
savepath = os.path.splitext(filepath)[0] + "_conv.html"
with open(savepath, "w", encoding="utf-8") as f:
f.writelines(newlines)
Recommended Posts