Der Zentrale Grenzwertsatz
Der Zentrale Grenzwertsatz der Statistik bei identischer Verteilung.
Zentraler Grenzwertsatz
Seien \(X_1, X_2, ..., X_n\) unabhängige und identisch verteilte Zufallsvariablen mit bekanntem Erwartungswert \(E(X_i) = \mu\) und bekannter Varianz \(Var(X_i)=\sigma^2\).
Für die Summe \(S_n = \sum_{i=1}^n X_i\) ist dann der Erwartungswert \(E(S_n)= n \cdot \mu\) und die Varianz \(Var(S_n)= n \cdot \sigma^2\).
Dann gilt für die standardisierte Zufallsvariable
\[ \begin{align*} Z_n &= \frac{\left(\sum\limits_{i=1}^n X_i\right) - n \cdot \mu}{\sqrt{n\cdot \sigma^2}} = \frac{S_n - n \cdot \mu}{\sigma \cdot \sqrt{n}} = \frac{n \cdot \bar{X}_n-n \cdot \mu}{\sigma \cdot n / \sqrt{n}} \\ &= \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} = \frac{\bar{X}_n - \mu}{\sigma} \cdot \sqrt{n}, \end{align*} \]
dass sie für wachsendes \(n\) immer besser durch die Standardnormalverteilung \(N(0, 1)\) approximiert werden kann.
Mit anderen Worten:
\[ P(Z_n \leq x) \longrightarrow \Phi(x), \quad \text{ für }\; n \rightarrow \infty \]
Ein Beispiel:
Nehmen wir drei Verteilungen mit Zufallsvariable \(U\), \(X\), \(Y\) und jeweils \(n\) Realisationen \(u_1,\dots, u_n\), \(x_1,\dots, x_n\), \(y_1,\dots, y_n\).
Wählen wir zunächst \(n=5\):
u
## [1] 19.726 69.683 60.790 0.955 42.901
x
## [1] 7.942 15.905 12.917 6.818 4.434
y
## [1] 59.961 56.552 51.094 75.288 47.985
Standardisieren wir die Werte:
library(mosaic)
zscore(u)
## [1] -0.6695256 1.0830283 0.7710507 -1.3280357 0.1434823
zscore(x)
## [1] -0.3543069 1.3440714 0.7067796 -0.5940379 -1.1025063
zscore(y)
## [1] 0.1677971 -0.1526624 -0.6657361 1.6085958 -0.9579944
Die Behauptung des Zentralengrenzwertsatzes ist nun, dass mit steigender Anzahl an Werten \(n\) die standardisierten Werte in der empirischen Verteilungsfunktion sich immer mehr der Verteilungsfunktion der Standardnormalverteilung annähern:
Weiterführende Literatur und Quellen dieses Eintrags: