"""
21.Extraire des lignes contenant des noms de catégories
Extrayez la ligne qui déclare le nom de la catégorie dans l'article.
"""
import json
def get_uk_text(path):
with open(path) as f:
for line in f:
line_data = json.loads(line)
if line_data["title"] == "Angleterre":
data = line_data
break
return data["text"]
uk_text = get_uk_text("jawiki-country.json")
uk_text_list = uk_text.split("\n")
ans = [x for x in uk_text_list if "Category:" in x[:11]]
for a in ans:
print(a)
# [[Category:Angleterre|*]]
# [[Category:Pays membres du Royaume-Uni]]
# [[Category:Royaume du Royaume-Uni|*]]
# [[Category:Pays membres du G8]]
# [[Category:Pays membres de l'Union européenne|Ancien]]
# [[Category:Nation marine]]
# [[Category:Pays souverain existant]]
# [[Category:Pays insulaire]]
# [[Category:Une nation / territoire créé en 1801]]
Recommended Posts