Prenons d'abord l'exemple de 1 à 6 dés sans distorsion: game_die:.
Puisque chacun des lancers de dés 1 à 6 est également probable (il n'y a pas de biais dans chaque jet), chaque jet peut être donné avec la probabilité suivante.
$
P (probabilité d'obtenir un 1) = \ frac {1} {6} \ qquad
P (probabilité d'obtenir un 2) = \ frac {1} {6} \ qquad
P (probabilité d'obtenir un 3) = \ frac {1} {6} \
P (probabilité d'obtenir un 4) = \ frac {1} {6} \ qquad
P (probabilité d'obtenir un 5) = \ frac {1} {6} \ qquad
P (probabilité d'obtenir un 6) = \ frac {1} {6}
$
Si vous définissez ici la variable de probabilité $ X $ comme suit
$
X = \left\{
\begin{array}{ll}
1 & (quand 1 est déployé) \
2 & (quand un 2 rouleau apparaît) \
3 & (quand 3 rouleaux) \
4 & (quand un 4 est lancé) \
5 & (quand un 5 est lancé) \
6 & (quand un 6 est obtenu) \
\end{array}\right.
$
Ce sera. Une variable qui fluctue de manière probabiliste, comme ici $ X $, est appelée une ** variable probabiliste **. La valeur réellement prise par la variable de probabilité est ici appelée la ** valeur réalisée **.
$ P(X = x) = \frac{1}{6}, \qquad x = 1,2,3,4,5,6 $
Lançons réellement les dés avec python.
import numpy as np
import matplotlib as mpl
np.random.seed()
prob_dice = np.array([])
dice = np.array([1,2,3,4,5,6])
dice_data = np.random.choice(dice, dice_times)
dice_times = 10000
for i in range(1,7):
p = len(dice_data[dice_data == i]) / dice_times
print(i, "Probabilité de", p)
prob_dice = np.append(prob_dice, len(dice_data[dice_data == i]) / dice_times)
plt.bar(dice, prob_dice)
plt.grid(True)
Voici le résultat. Cette fois, nous avons lancé les dés 10 000 fois et calculé la probabilité. Comme le montrent les résultats, chaque œil est proche de $ \ frac {1} {6} = 0,1666 ... $.
Il existe différentes variables stochastiques, et $ X $ est une ** variable probabiliste discrète ** lorsque les valeurs possibles de $ X $ sont finies ou infinies (1, 2, 3, 4, Cela signifie une valeur qui est discrète comme 5 ...), et $ X $ est une ** variable de probabilité continue ** lorsqu'elle a une fonction de densité. Dans le cas d'une probabilité discrète, la probabilité est considérée pour chaque $ x $ comme dans les dés précédents, et la fonction de $ x $ est appelée ** fonction de probabilité ** et peut être exprimée comme suit.
$
p(x) = P(X = x)\
$
De plus, la fonction de probabilité a les propriétés suivantes. Notez que $ \ sum $ représente ici la somme des probabilités.
$
p(x) \ge 0, \qquad \forall x \
\sum_{x}^{} p(x) = 1
$
La somme des sommes cumulées des fonctions de probabilité est appelée la ** fonction de distribution cumulative ou fonction de distribution **. La fonction de distribution a les propriétés suivantes, telles que la monotonie et la continuité droite.
$
F(x) = P(X \le x) = \sum_{y \le x} p(y)\
(1) \quad \lim_{n \to -\infty}F(x) = 0\
(2) \ quad \ forall x, y \ in \ mathbb {R} (nombre réel) \
\qquad F(x) \ge F(y), \quad F(x) = \lim_{\varepsilon \to 0}F(x + \varepsilon)\
(3) \quad \lim_{n \to +\infty}F(x) = 1
$
Ici, dans $ \ forall x $, $ F (X) $ est continu à droite (exprimé comme $ F (X +) = F (X) $), et $ x_n $ est une suite de nombres qui décroît de manière monotone et converge. $ \ lim_ {x_n \ to + \ infty} F (x_n) = F (x) $. Ici, $ x + $ indique qu'il décroît de manière monotone à partir de la direction positive et converge vers $ x $. Ensuite, la fonction stochastique peut être obtenue en prenant la différence entre les fonctions de distribution cumulative de $ X $ comme indiqué ci-dessous.
$ p(x) = F(x) - \lim_{x_n \to x-} F(x_n) = F(x) - F(x-) $
Si vous implémentez la distribution cumulative en python, ce sera comme suit.
import numpy as np
import matplotlib as mpl
from scipy.stats import norm
import matplotlib.pyplot as plt
x = np.arange(0,3000)
y = norm.cdf(x, loc=1500, scale=500)
plt.plot(x,y)
plt.grid(True)
plt.xlabel("value")
plt.ylabel("possibility")
Recommended Posts