Si vous copiez et collez le texte lors de la traduction d'un article en anglais, des sauts de ligne et des caractères étranges peuvent être insérés en fonction du pdf. J'ai pensé que ce serait plus facile si je le traduisais ensemble lors du formatage de cette zone avec python, donc cette méthode
L'API Google Translate est payante, alors émulez le navigateur avec du sélénium et utilisez le navigateur Google Translate
pip install selenium
npm install -g phantomjs-prebuilt
from selenium.webdriver import PhantomJS
import time
driver = PhantomJS()
driver.get("https://translate.google.co.jp/?um=1&ie=UTF-8&hl=ja&client=tw-ob#en/ja/")
def eng2jp(eng_text):
driver.find_element_by_id("source").clear()
driver.find_element_by_id("source").send_keys(eng_text)
driver.find_element_by_id("gt-submit").click()
time.sleep(0.1) #attends un peu
return "".join([i.text for i in driver.find_elements_by_xpath('//span[@id="result_box"]//span')])
eng2jp("lement is no longer attached to the DOM")
# returns 'Traduire l'anglais en japonais'
Recommended Posts