Inhaltsverzeichnis
Die Aussage des Zentralen Grenzwertsatzes lässt sich in Worten dadurch beschreiben, dass die Summe von unabhängigen, identisch verteilten Zufallsvariablen Xi für immer größeres n sich beliebig genau durch eine Normalverteilung berechnen lässt, d.h. dass die Verteilung von $\sum _{i\;=\;1}^nX_i$ immer besser durch N(n·μ, σ·$\sqrt n$) beschrieben wird – hierbei bezeichnet μ den Erwartungswert von Xi, also μ = E(Xi), und σ die Standardabweichung von Xi, also σ = $\sqrt{\mathit{Var}(X_i)}$. Also:
Zentraler Grenzwertsatz
Methode
Xi seien unabhängig, identisch verteilte Zufallsvariablen mit bekanntem Erwartungswert E(Xi) = μ und bekannter Varianz Var(Xi) = σ. Dann gilt, dass die standardisierte Zufallsvariable
Yn = $\frac{\sum _{i\;=\;1}^nX_i\;-\;n_{\mu }}{\sigma \sqrt n}$ = $\frac{\overline X_n\;-\;\mu }{\sigma }$· $\sqrt n$ für wachsendes n immer besser durch die Standardnormalverteilung N(0,1) approximiert werden kann, anders ausgedrückt:
P(Yn ≤ x) $\genfrac{}{}{0pt}{0}{n\;\rightarrow \;\infty }{\rightarrow }$ Ф (x).
Merke
Merke
Man standardisiert die Zufallsvariable $\overline X_n$, da die Grenzverteilung von $\sum _{i\;=\;1}^n\;$ Xi, nämlich N(n·μ, σ·$\sqrt n$), noch von der Anzahl n abhängig ist, was als störend empfunden wird. Die standardisierte Zufallsvariable Yn =$\frac{\sum _{i\;=\;1}^nX_i\;-\;n_{\mu }}{\sigma \sqrt n}$ hat diesen Nachteil nicht mehr, die Zufallsvariable N(0,1) ist unabhängig von n.
Der Sinn des Zentralen Grenzwertsatzs ist: obwohl die exakte Verteilung der einzelnen Xi unbekannt ist, so ist es doch möglich, einfach die entsprechende Normalverteilung zu nehmen, um Wahrscheinlichkeiten approximativ zu berechnen, denn das Ergebnis ist für immer größeres n brauchbar.
Beispiel
Beispiel
Wir werfen die o.e. faire Münze aus Beispiel 8.1 n = 10 mal bzw. n = 20 mal. Berechne die Wahrscheinlichkeit, dass bei n – fachem Münzwurf höchstens 0,6×n mal Kopf fällt, und zwar
exakt
mit Hilfe des Zentralen Grenzwertsatzes.
Exakte Lösung mit der Binomialverteilung
Die einzelnen Xi sind binomialverteilt mit dem Erwartungswert μ = E(Xi) = 1·½ = 0,5 und der Standardabweichung σ = $\sqrt{1\;\cdot \;\frac 1 2\;\cdot \;(1\;-\;\frac 1 2)}$ = 0,5. Da die einzelnen Xi unabhängig voneinander sind, gilt $\sum _{i\;=\;1}^n\;$ Xi ~ B(n, 1/2) als exakte Verteilung.
Für n = 10 rechnet man also mit der B(10,1/2) – Verteilung:
P($\sum _{i\;=\;1}^{10}\;$ Xi ≤ 6) = P($\sum _{i\;=\;1}^{10}\;$ Xi = 0) + P($\sum _{i\;=\;1}^{10}\;$ Xi = 1) + ... + P($\sum _{i\;=\;1}^{10}\;$ Xi = 6)
= $\left(\genfrac{}{}{0pt}{0}{10}0\right)$· $\left(\frac 1 2\right)^0$· $\left(1\;-\;\frac 1 2\right)^{10\;-\;0}$ + $\left(\genfrac{}{}{0pt}{0}{10}1\right)$· $\left(\frac 1 2\right)^1$· $\left(1\;-\;\frac 1 2\right)^{10\;-\;1}$ + ... + $\left(\genfrac{}{}{0pt}{0}{10}6\right)$· $\left(\frac 1 2\right)^6$· $\left(1\;-\;\frac 1 2\right)^{10\;-\;6}$
= $\left(\frac 1 2\right)^{10}$ + 10· $\left(\frac 1 2\right)^{10}$ + 45· $\left(\frac 1 2\right)^{10}$ + 120· $\left(\frac 1 2\right)^{10}$ + 210· $\left(\frac 1 2\right)^{10}$ + 252· $\left(\frac 1 2\right)^{10}$ + 210· $\left(\frac 1 2\right)^{10}$
= $\left(\frac 1 2\right)^{10}$ ·(1 + 10 + 45 + 120 + 210 + 252 + 210)
= $\frac{848}{2^{10}}$
= 0,828.
Für n = 20 gilt analog
P($\sum _{i\;=\;1}^{20}\;$Xi ≤ 12) = P($\sum _{i\;=\;1}^{10}\;$Xi = 0) + P($\sum _{i\;=\;1}^{10}\;$Xi = 1) + ... + P($\sum _{i\;=\;1}^{10}\;$Xi = 12)
= $\left(\genfrac{}{}{0pt}{0}{20}0\right)$· $\left(\frac 1 2\right)^0$· $\left(1\;-\;\frac 1 2\right)^{20\;-\;0}$ + $\left(\genfrac{}{}{0pt}{0}{20}1\right)$· $\left(\frac 1 2\right)^1$· $\left(1\;-\;\frac 1 2\right)^{20\;-\;1}$ + ... + $\left(\genfrac{}{}{0pt}{0}{20}{12}\right)$· $\left(\frac 1 2\right)^{12}$· $\left(1\;-\;\frac 1 2\right)^{20\;-\;12}$
= $\left(\frac 1 2\right)^{20}$ ·(1 + 20 + 190 + 1.140 + 4.845 + 15.504 + 38.760 + 77.520 + 125.970 + 167.960 + 184.756 + 167.960 + 125.970)
= $\frac{910.596}{2^{20}}$ = 0,8684
als exakte Wahrscheinlichkeit.
Approximative Lösung
Approximativ – d.h. mit Hilfe des Zentralen Grenzwertsatzes – rechnet man mit der entsprechenden Normalverteilung, die von n abhängig ist:
für n = 10: $\sum _{i\;=\;1}^{10}\;$ Xi ~ N(10·$\frac 1 2$; $\sqrt{10}$· $\sqrt{0,25}$) = N(5; $\sqrt{2,5}$)
für n = 20: $\sum _{i\;=\;1}^{20}\;$ Xi ~ N(20·$\frac 1 2$; $\sqrt{20}$· $\sqrt{0,25}$) = N(10; $\sqrt{5}$)
also für n = 10:
P($\sum _{i\;=\;1}^{10}\;$Xi ≤ 6) = P($\frac{\sum _{i\;=\;1}^{10}X_i\;-\;10\;\cdot \;\frac 1 2}{\frac 1 2\;\cdot \;\sqrt{10}}$ ${\leq}$ $\frac{6\;-\;5}{\frac 1 2\;\cdot \;\sqrt{10}}$)
= Ф($\frac 1{\frac 1 2\;\cdot \;\sqrt{10}}$) = Ф (0,6325) = 0,736.
Die Abweichung zwischen dem exakten Wert – 0,828 und dem approximativen Ergebnis ist also 0,092.
Für n = 20 rechnet man approximativ
P($\sum _{i\;=\;1}^{20}\;$Xi ≤ 12) = Ф($\frac{12\;-\;10}{\frac 1 2\;\cdot \;\sqrt{20}}$) = Ф(0,8944) = 0,8133.
Die Abweichung zwischen dem wahren Wert 0,8684 und dem approximativ richtigen ist nun lediglich noch –0,0551. Bei größerem n wird diese Abweichung daher immer kleiner.
Zentraler Grenzwert
Video: Zentraler Grenzwertsatz
Weitere Interessante Inhalte zum Thema
-
Signifikanztests bei einfachen Stichproben
Vielleicht ist für Sie auch das Thema Signifikanztests bei einfachen Stichproben (Testtheorie) aus unserem Online-Kurs Stichprobentheorie interessant.
-
Erhaltungsaufwand - Baumaßnahmen bei Gebäuden
Vielleicht ist für Sie auch das Thema Erhaltungsaufwand - Baumaßnahmen bei Gebäuden (Wirtschaftsgut) aus unserem Online-Kurs Bilanz nach Steuerrecht interessant.