Kursangebot | Wahrscheinlichkeitsrechnung | Normalverteilung

Wahrscheinlichkeitsrechnung

Normalverteilung

x
Juracademy JETZT WEITER LERNEN!

Weitere Lernvideos sowie zahlreiche Materialien für deine Prüfungsvorbereitung erwarten dich:
wiwiweb.de Flatrate


1272 Lerntexte mit den besten Erklärungen

412 weitere Lernvideos von unseren erfahrenen Dozenten

3121 Übungen zum Trainieren der Inhalte

516 informative und einprägsame Abbildungen

Die NormalVerteilung hat eine überaus große Bedeutung in der Statistik, weil sie als Approximation (= Annäherung) an andere Verteilungen ist:

LAMBERT-KOCHREZEPT NORMALVERTEILUNG

Methode

1) um welche Normalverteilung handelt es sich? Was ist der Erwartungswert µ was ist die Streuung σ?

2) Nach welcher Wahrscheinlichkeit ist gefragt?

a) P(X ≤ a) die Wahrscheinlichkeit, dass die Zufallsvariable X höchstens den Wert a annimmt

Abb. 6.7: Fläche bis zu bestimmter Stelle unterhalb Glockenkurve
Abb. 6.7: Fläche bis zu bestimmter Stelle unterhalb Glockenkurve

b) P(X ≥ a) die Wahrscheinlichkeit, dass die Zufallsvariable X min destens den Wert a annimmt

Abb. 6.8: Fläche ab bestimmter Stelle unterhalb der Glockenkurve
Abb. 6.8: Fläche ab bestimmter Stelle unterhalb der Glockenkurve

c) P(b ≤ X ≤ c) Die Wahrscheinlichkeit, dass die Zufallsvariable zwischen den Werten b und c liegt.

Abb. 6.9: Fläche zwischen zwei Zahlen unterhalb der Glockenkurve
Abb. 6.9: Fläche zwischen zwei Zahlen unterhalb der Glockenkurve

3) Standardisiere, d.h. ziehe den Erwartungswert µ ab und dividiere durch die Streuung σ.

a) P(X ≤ a) = P($\frac{X\;-\;\mu }{\sigma }$ ≤ $\frac{a\;-\;\mu }{\sigma }$)

b) P(X ≥ a) = 1 – P(X < a) = 1 – P($\frac{X\;-\;\mu }{\sigma }$ ≤ $\frac{a\;-\;\mu }{\sigma }$)

c) P(b ≤ X ≤ c) = P(X ≤ c) – P(X ≤ b) = P($\frac{X\;-\;\mu }{\sigma }$ ≤ $\frac{c\;-\;\mu }{\sigma }$) - P($\frac{X\;-\;\mu }{\sigma }$ ≤ $\frac{d\;-\;\mu }{\sigma }$)

4) da die neue Zufallsvariable XST: =  standardnormalverteilt ist XSt ~N(0,1) gilt und die Verteilungsfunktion der N(0,1) - Verteilung mit Φ geschrieben wird, wende diese Φ -Schreibweise an:

a) P(X ≤ a) = ... = Φ ($\frac{a\;-\;\mu }{\sigma }$)

b) P(X ≥ a) = ... = 1 - Φ ($\frac{a\;-\;\mu }{\sigma }$)

c) P(b ≤ X ≤ c) = ... = Φ ($\frac{c\;-\;\mu }{\sigma }$) - Φ ($\frac{d\;-\;\mu }{\sigma }$).

5) Wende, falls nötig, einen Trick an: Φ (- g) = 1 – Φ (g), da die Tabellen zur Standardnormalerteilung N(0,1) meistens erst beim Abszissenwert 0 beginnen.

6) Schlage in der Tabelle der N(0,1)-Verteilung nach.

Merke

Merke

  • ob man P(X ≤ a) oder P(X < a) schreibt, ist bei der Normalverteilung – wie bei jeder anderen stetigen Verteilung auch – egal, da die Wahrscheinlichkeit der Gleichheit, also P(X = a), gleich null ist:

    P(X ≤ a) = P(X < a) + P(X = a) = P(X < a) + 0 = P(X < a)

  • in manchen Lehrbüchern findet man als „Symbol“ der Normalverteilung N(µ,σ), in anderen N(µ,σ2).Wir schreiben N(µ,σ), also mit der Streuung σ statt mit der Varianz σ2.

  • Der Abstand zwischen dem Erwartungswert µ und den Wendepunkten ist genau gleich der Streuung σ.

Nun zum besseren Verständnis ein

Beispiel

Beispiel

Die Körpergröße von Männern in Deutschland sei normalverteilt mit einem Erwartungswert von 1,7 m bei einer Streuung von 0,1 m. Wie groß ist die Wahrscheinlichkeit,
a) kleiner zu sein als 1,65,
b) größer zu sein als 1,72 sowie
c) eine Körpergröße zwischen 1,55 m und 1,75 m zu haben?

Wir wenden zur Lösung das obenstehende Kochrezept an:

Schritt 1) Es handelt sich offenbar um die Normalverteilung N(1,7; 0,1).

Schritt 2) Danach schreiben wir die Aufgabenstellung formal auf

a) P(X ≤ 1,65)

b) P(X ≥ 1,72)

c) P(1,55 ≤ X ≤ 1,75)

Wir drehen die Richtung, wenn nötig, auf „kleiner oder gleich“

a) man muss nichts ändern

b) P(X ≥ 1,72) = 1 – P(X ≤ 1,72)

c) P(1,55 ≤ X ≤ 1,75) = P(X ≤ 1,75) – P(X ≤ 1,55)

Schritt 3) Danach standardisieren wir

a) P(X ≤ 1,65) = P(XST ≤ ${{1,65-1,7}\over{0,1}}$) = P(XST ≤ - 0,5)

b) P(X ≥ 1,72) = 1 – P(XST ≤ ${{1,72-1,7}\over{0,1}}$ ) = 1 – P(XST ≤ 0,2)

c) P(1,55 ≤ X ≤ 1,75) = P(XST ≤ 0,5) – P(XST ≤ - 1,5)

Schritt 4) Φ – Schreibweise anwenden liefert

a) P(XST ≤ - 0,5) = Φ ( - 0,5)

b) 1 – P(XST ≤ 0,2) = 1 – Φ (0,2)

c) P(XST ≤ 0,5) – P(XST ≤ - 1,5) = Φ (0,5) – Φ ( - 1,5)

Schritt 5) Trick anwenden bei a) und c), nämlich Φ ( - g)=1 - Φ (g)

a) Φ ( - 0,5) = 1 – Φ (0,5)

b) nicht notwendig, da Φ an einer positiven Stelle nachgeschlagen wird

c) Φ (0,5) – Φ ( - 1,5) = Φ (0,5) – [1 - Φ (1,5)] = Φ (0,5) – 1 + Φ (1,5)

Schritt 6) in einer Tabelle zur N(0,1)-Verteilung nachschlagen:

a) 1 – Φ (0,5) = 1 – 0,691462 = 0,308538

b) 1 – Φ (0,2) = 1 – 0,57926 = 0,42074

c) Φ (0,5) – 1 + Φ (1,5) = 0,691462 – 1 + 0,933193 = 0,624655.

Merke

Merke

Die Ergebnisse kann man dadurch überprüfen, indem man die Dichtefunktion und die Größe der schraffierten Fläche anschaut. Die Fläche insgesamt unterhalb der Dichtefunktion ist 1, die gefragte Fläche hat dann insgesamt den ausgerechneten Anteil.

Eine andere Art von Aufgabenstellung behandeln wir hier extra:

Beispiel

Beispiel

Welche Körpergröße überschreiten 30 % der deutschen Männer?

Diese Abwandlung der Aufgabe führt auf das „Nachschauen von innen nach außen“ und wird deshalb gesondert behandelt. Das Ergebnis der Wahrscheinlichkeit, nämlich 30 %, ist bereits bekannt, es geht nun darum, die Körpergröße zu finden, die mit der Wahrscheinlichkeit von 30% überschritten wird: P(X ≥ a) = 0,3.

Eben verhielt es sich genau umgekehrt: die Körpergröße war bekannt, die Wahrscheinlichkeit hingegen gesucht.

Man löst die Aufgabe nach dem o.e. Lambert-Kochrezept

Schritt 1) X ~ N(1,7; 0,1)

Schritt 2) P(X ≥ a) = 0,6, also Fall b), weil eine Mindestwahrscheinlichkeit gegeben ist. Hieran kann man sehen, wonach gefragt ist.

Wir drehen das Zeichen um, damit man die Verteilungsfunktion anwenden kann:

P(X ≥ a) = 0,3 $\Leftrightarrow$ 1 – P(X ≤ a) = 0,3$\Leftrightarrow$ - P(X ≤ a) = - 0,7 $\Leftrightarrow$ P(X ≤ a) = 0,7.

Schritt 3) Standardisiere P(X ≤ a) = 0,7$\Leftrightarrow$ P(XST ≤ ) = 0,7.

Schritt 4) Wende die Φ - Schreibweise an:

P(XST ≤ $\frac{a\;-\;1,7}{0,1}$) = 0,7 $\Leftrightarrow$ Φ ($\frac{a\;-\;1,7}{0,1}$) = 0,7.

Schritt 5) war hier nicht nötig

Schritt 6) Nachgucken von innen nach außen: man schlägt innen in der Tabelle nach, wo 0,7 erreicht oder gerade überschritten wird und schaut dann, für welche Zahlen dies außen geschieht. Hier wird die Zahl 0,7 zum erstenmal bei 0,53 überschritten. Also:

$\frac{a\;-\;1,7}{0,1}$ = 0,53 $\Leftrightarrow$ a = 0,53·0,1 + 1,7 = 1,753.

Das heißt, dass 30 % der deutschen Männer größer sind als 1,753 m.

Merke

Merke

Man sieht, dass die Tabellen zur N(0,1)-Verteilung erst bei 0,5 starten. Was passiert, wenn danach gefragt ist, welche Körpergröße 40 % der deutschen Männer überschreiten?

Hier braucht man 0,4 als Wert innerhalb der Tabelle und findet keine Zahl. Da hilft folgender Trick, der speziell für die Standardnormalverteilung gilt (da diese symmetrisch ist um null herum):

Merke

xα = - x 1 - α.

Also x0,4 = - x1 - 0,4 = - x0,6. Man schlägt also das 0,6 - Fraktil nach und schreibt ein Minus-Zeichen davor. Es überschreiten 60 % der deutschen Männer eine Körpergröße von 1,675m.

Man sieht im oben gerechneten Beispiel, dass wir noch recht ungenau gerechnet haben. Wir nahmen in der Tabelle jenen Wert, der das gesuchte Fraktil gerade überschritt, nicht traf. Diesen Fehler können wir zwar nicht ganz auslöschen, aber durch lineare Interpolation vermindern, auf die wir hier nicht weiter eingehen werden.

Das 0,7 - Fraktil der N(0,1) - Verteilung liegt also ungefähr bei 0,5244. Diese Schätzung ist genauer als 0,53.

Merke

Merke

Die Dichtefunktion von N(0,1) ist

Abb. 6.10: Dichtefunktion der Standardnormalteilung N(0,1)
Abb. 6.10: Dichtefunktion der Standardnormalteilung N(0,1)


Die Verteilungsfunktion der Standardnormalverteilung lautet

Abb. 6.11: Verteilungsfunktion der Standardnormalverteilung N(0,1)
Abb. 6.11: Verteilungsfunktion der Standardnormalverteilung N(0,1)

Videos

Video: Normalverteilung

Die Normalverteilung hat eine überaus große Bedeutung in der Statistik, weil sie als Approximation (= Annäherung) an andere Verteilungen ist.

Video: Normalverteilung

Die Normalverteilung hat eine überaus große Bedeutung in der Statistik, weil sie als Approximation (= Annäherung) an andere Verteilungen ist.

Video: Normalverteilung

Die Normalverteilung hat eine überaus große Bedeutung in der Statistik, weil sie als Approximation (= Annäherung) an andere Verteilungen ist.

Video: Normalverteilung

Die Normalverteilung hat eine überaus große Bedeutung in der Statistik, weil sie als Approximation (= Annäherung) an andere Verteilungen ist.

Aufgabe (Richtig-Falsch-Fragen zur Normalverteilung)

Die folgenden Aussagen sind richtig oder falsch. Entscheide.

a) Bei der Normalverteilung stimmen Modus, Erwartungswert und Median stets überein.

b) Wenn eine beliebige normalverteilte Zufallsvariable standardisiert wird, erhält man immer eine standardnormalverteilte Zufallsvariable.

c) Im 1 - σ - Bereich der Normalverteilung liegen ca. 95 % aller Werte.

d) Bei der Normalverteilung ist es wichtig, dass man standardisiert. Hierbei ist der Prozess des Zentrierens ein wichtiger Teil.

e) Bei der Standardnormalverteilung lassen sich durch lineare Interpolation Zwischenwerte, die in der Verteilungsfunktionstabelle der N(0,1)-Verteilung nicht angegeben sind, exakt berechnen.

Lösung:

a) Bei der Normalverteilung stimmen Modus, Erwartungswert und Median stets überein.

Richtig.

b) Wenn eine beliebige normalverteilte Zufallsvariable standardisiert wird, erhält man immer eine standardnormalverteilte Zufallsvariable.

Richtig.

c) Im 1 - σ - Bereich der Normalverteilung liegen ca. 95 % aller Werte.

Falsch, im 1·σ - Bereich liegen ca. 68 % aller Werte.

d) Bei der Normalverteilung ist es wichtig, dass man standardisiert. Hierbei ist der Prozess des Zentrierens ein wichtiger Teil.

Richtig. Zentrieren heißt, vom gesuchten Wert x den Erwartungswert μ abzuziehen. Standardisieren bedeutet, danach durch die Standardabweichung σ zu dividieren: $\frac{x\;-\;\mu }{\sigma }$.

e) Bei der Standardnormalverteilung lassen sich durch lineare Interpolation Zwischenwerte, die in der Verteilungsfunktionstabelle der N(0,1)-Verteilung nicht angegeben sind, exakt berechnen.

Falsch, sie lassen sich lediglich interpolieren (= approximieren).