Ceci est le premier message. Je vous remercie.
J'essaye de gratter mon propre site. Données récupérées
<div class="st-kaiwa-hukidashi">Chaîne de caractères cible</div>
<div class="st-kaiwa-hukidashi2">Chaîne de caractères cible</div>
Je souhaite conserver uniquement la "chaîne de caractères cible" de.
Donc,
for num in ["", "2"]:
kaiwa = "div.st-kaiwa-hukidashi{}" .format(num)
talk = soup.select(kaiwa)
for s in talk :
trash = "<div class={}>".format(kaiwa)
t = s.text.replace("trash" , '')
print(t)
Lorsque j'ai exécuté, j'ai pu récupérer uniquement la "chaîne de caractères cible" proprement.
Dans ce code
<div class="st-kaiwa-hukidashi">
<div class="st-kaiwa-hukidashi2">
Je prévoyais de supprimer uniquement
</div>
On dirait qu'il a été remplacé.
Je suis désolé pour la question d’introduction, mais je voudrais vous demander d’enseigner que __pourquoi </ div> est remplacé par «».
Je vous remercie.