Une formule qui donne une indication de la distribution de fréquence et du nombre de classes lors de la création d'un histogramme. Il peut être calculé par la formule suivante, où n est le nombre d'échantillons et k le nombre de classes.
k = 1 + log_2N
En supposant qu'il existe des données avec 40 échantillons (N = 40), le nombre de classes lors de la création d'un histogramme est calculé à partir de celui-ci.
1 + log_240 = 6.3219280948874 ≒ 6
A partir de là, le nombre de classes 6 est défini.
Le nombre de classes obtenues en utilisant la formule de Starges n'est qu'une ** ligne directrice **. (Il n'y a pas de réponse absolue pour définir le numéro de classe lors de la création d'un tableau / histogramme de distribution de fréquence)
sturges.py
import math
def sturges_rule(n):
u"""
Star Jess Officiel
"""
return round(1 + math.log2(n))
Vérifiez dans «l'exemple» ci-dessus.
>>> from sturges import sturges_rule
>>> sturges_rule(40)
6
Recommended Posts