Sur le site de Kaggle, reportez-vous au Code source d'une certaine personne et voyez comment le lire. Je vais l'enregistrer ici parce que je veux le comprendre.
L'environnement utilise Python 3, matplotlib et pandas.
Cette fois, j'essaierai de comprendre le log (log) à ma manière. Je n'ai jamais utilisé le journal (journal) une fois en 10 ans en tant que membre de la société. Je n'ai qu'un faible souvenir d'étudier quand j'étais étudiant.
J'ai donc essayé de savoir pourquoi un journal était nécessaire. Différence entre l'intensité et la magnitude sismiques? Simple et clair! a été lu.
Lorsque le nombre est trop grand et difficile à gérer, le journal est utilisé pour le rendre plus facile à manipuler.
Si vous n'utilisez pas de log, cela ressemble à ceci. La plupart de l'histogramme n'est pas affiché et je ne suis pas sûr de ce que c'est.
python
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("./creditcard.csv")
f, (ax1, ax2 ) = plt.subplots(2, 1, sharex=True, figsize=(12,4))
bins = 30
ax1.hist(df.Amount[df.Class == 1], bins = bins)
ax1.set_title('Fraud')
ax2.hist(df.Amount[df.Class == 0], bins = bins)
ax2.set_title('Normal')
plt.xlabel('Amount ($)')
plt.ylabel('Number of Transactions')
plt.show()
Ce qui suit est ajouté au code source lorsque le journal n'est pas utilisé.
plt.yscale('log')
python
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("./creditcard.csv")
f, (ax1, ax2 ) = plt.subplots(2, 1, sharex=True, figsize=(12,4))
bins = 30
ax1.hist(df.Amount[df.Class == 1], bins = bins)
ax1.set_title('Fraud')
ax2.hist(df.Amount[df.Class == 0], bins = bins)
ax2.set_title('Normal')
plt.xlabel('Amount ($)')
plt.ylabel('Number of Transactions')
plt.yscale('log')
plt.show()
Il s'avère que la tendance générale est quelque peu visible lors de l'utilisation de log que lors de l'absence de log.
Recommended Posts