J'étudie le scraping en Python. Je voulais obtenir la valeur de chaque page, mais j'ai la valeur dont le nom de classe, etc. n'a pas besoin. Par conséquent, cette fois, je voudrais mener "une stratégie de pillage uniquement de la partie qui est une expression régulière en combinant tous les arrangements pour chaque page pour le moment".
Je ne veux que ce ** Japon **
list = ['Cacher', 'Cacher', 'Cacher', 'Cacher', 'Cacher', 'Japan', 'Cacher']
list_join = (''.join(list))
print(list_join)
#Cacher Cacher Cacher Cacher Cacher Cacher Cacher Japon
list_join = (''.join(list))
compile = re.compile('[a-zA-Z]+')
print(''.join(compile.findall(list_join)))
# Japan
référence https://murashun.jp/blog/20200113-20.html https://note.nkmk.me/python-re-regex-character-type/
Recommended Posts