Je suis un débutant en scraping qui vient de commencer à gratter avec Python. Cette fois, notez comment extraire uniquement les nombres des données extraites par grattage.
Extraire uniquement les nombres des données extraites par scraping
Extraire uniquement des nombres à l'aide de ** expressions régulières **
Utilisez le module re. Exécutez la commande suivante à partir du terminal pour installer regex.
$ pip install regex
Ensuite, importons le ** re module ** dans sample.py.
sample.py
import re
Vous êtes maintenant prêt à utiliser le module re.
sample.py
import re
dt = "regnkrnfskrngkaer gksgnkq laergnnktga3r erfkl 400 inscrits aelrkna erglknnarg"
num = re.sub("\\D", "", dt)
print(num)
# 400
sample.py
import re
dt = ['regnkrnfskrngkaer', 'gksgnkq', 'laergnnktgar', 'erfkl', '400 inscrits', 'aelrkna erglknnarg']
dt_str = ",".join(dt)
dt_num = re.sub("\\D", "", dt_str)
print(dt_num)
# 400
sample.py
import re
dt = ['regr111kaer', 'gg443nkq', 'laen56nktgar', 'er39fkl', '400 inscrits', 'ael09narg']
dt_str = ",".join(dt)
dt_num = re.sub("\\D", "", dt_str)
print(dt_num)
# 111443563940009
sample.py
import re
dt = ['regr111kaer', 'gg443nkq', 'laen56nktgar', 'er39fkl', '400 inscrits', 'ael09narg']
dt_pop = (dt.pop(4))
dt_num = re.sub("\\D", "", dt_pop)
print(dt_num)
# 400
référence https://qiita.com/sakamossan/items/161db7418ade037f6f3d https://qiita.com/ikanamazu/items/ba2a32a1a5924f3bd8e9