[Question] Python string replacement.replace () remplacera même ceux qui ne sont pas spécifiés.

Ceci est le premier message. Je vous remercie.

J'essaye de gratter mon propre site. Données récupérées

<div class="st-kaiwa-hukidashi">Chaîne de caractères cible</div>
<div class="st-kaiwa-hukidashi2">Chaîne de caractères cible</div>

Je souhaite conserver uniquement la "chaîne de caractères cible" de.

Donc,

for num in ["", "2"]:
    kaiwa = "div.st-kaiwa-hukidashi{}" .format(num)
    talk = soup.select(kaiwa)
    for s in talk :
        trash = "<div class={}>".format(kaiwa)
        t = s.text.replace("trash" , '')
        print(t)

Lorsque j'ai exécuté, j'ai pu récupérer uniquement la "chaîne de caractères cible" proprement.

Dans ce code

<div class="st-kaiwa-hukidashi">
<div class="st-kaiwa-hukidashi2">

Je prévoyais de supprimer uniquement

</div>

On dirait qu'il a été remplacé.

Je suis désolé pour la question d’introduction, mais je voudrais vous demander d’enseigner que __pourquoi </ div> est remplacé par «».

Je vous remercie.

Recommended Posts

[Question] Python string replacement.replace () remplacera même ceux qui ne sont pas spécifiés.
Version Python (PHP vers Python) qui supprime la chaîne de caractères suivante de la chaîne de caractères spécifiée (extension)
À propos du fait que le contenu de l'impression Python n'est pas visible dans les journaux du docker
[Python] Programmation pour trouver le nombre de a dans une chaîne de caractères qui se répète un nombre spécifié de fois.
[Python3] "A // B" et "math.floor (A / B)" ne sont pas toujours les mêmes! ??