Certaines lignes du fichier journal d'une application Web qui n'a pas été testée en détail peuvent être déformées (comme un message d'erreur émis par l'application).
Lorsque j'essaye de lire le fichier journal avec Python pour tenter d'obtenir des informations statistiques à partir d'un tel fichier journal, comme prévu, une exception "Cannot decode" se produit sur la ligne brouillée.
De plus, lorsque vous obtenez soudainement un journal d'un système inconnu et que vous demandez une analyse, vous pouvez obtenir une erreur indiquant "Impossible de décoder" lorsque vous le lisez avec Pyhon même si cela ressemble à une ligne normale. Dans ce cas, vous pouvez examiner attentivement le code de caractère du fichier journal, mais si la ligne n'est pas liée à l'analyse, vous n'aurez peut-être pas le temps de traiter l'erreur qui se produit.
Par conséquent, lors de l'ouverture du fichier, si le paramètre "` ʻerrors = 'replace'`` "est spécifié dans l'argument, la partie déformée (la partie où le décodage a échoué) est remplacée par"? "Et lue. Te donnera.
f = open('foo.log', mode='r', errors='replace')
Je souhaite agréger les informations statistiques du journal, mais essayez-le lorsque vous n'avez pas le temps d'écrire le traitement de l'erreur de décodage.
Bonne vie en Python! !!
Recommended Posts