ZU DEN KURSEN!

Wahrscheinlichkeitsrechnung - Weitere diskrete Verteilungen

Kursangebot | Wahrscheinlichkeitsrechnung | Weitere diskrete Verteilungen

Wahrscheinlichkeitsrechnung

Weitere diskrete Verteilungen

Multinomialverteilung

Für die Multinomialverteilung oder Polynomialverteilung schauen wir uns zunächst ein Beispiel an.

-

In einer Urne befinden sich zehn Kugeln, davon sind vier gelb, zwei blau drei rot und eine violett. Wie groß ist die Wahrscheinlichkeit, dass wir zwei gelbe und eine blaue Kugel ziehen, wenn dreimal mit Zurücklegen gezogen wird?

Diese Aufgabe lässt sich jetzt nicht mehr mit der Binomialverteilung lösen, da wir hier nicht mehr zwei Ergebnisse vorliegen haben (wie Blau, Nicht-Blau), sondern und zwei Ergebnisse interessieren.

Folgender Merksatz gilt:

Regel Multinomialverteilung (=Polynomverteilung)

-

Voraussetzungen:

  1. Es seien r Ereignisse A1, A2, ..., Ar eines Versuchs gegeben
  2. Diese treten mit den Wahrscheinlichkeiten p1, p2, ..., pr ein
  3. Die Ereignisse seien unabhängig voneinander.

Wie groß ist nun die Wahrscheinlichkeit, dass bei n nacheinander gemachten Ziehungen, das Ereignis A1 genau k1 mal, A2 exakt k2 mal, usw., das Ereignis Ar exakt kr mal eintritt? Es gilt insgesamt:

$\sum _{i\;=\;1}^r\;$ki = 1 und $\sum _{i\;=\;1}^r\;$pi = 1.

Merke

Antwort: f(k1, k2, ..., kr) = $\frac{n!}{k_1!k_2!...k_r!}p_1^{k_1}\;\cdot \;p_2^{k_2}\;\cdot \;...\;\cdot \;p_r^{k_r}$..

Zurück zu unserer Beispielaufgabe:

Beispiel

Insgesamt exsitieren vier unterschiedliche Farben, damit gibt es r=4 mögliche Ereignisse A1, A2, Aund A4. Da die gelben (A1), blauen (A2), roten (A3) und violetten (A4) Kugeln nach dem Ziehen auch wieder Zurükgelegt werden ist auch die Voraussetzung der Unabhängigkeit gewahrt. Es soll jetzt so gezogen werden, dass k1=2, k2=1, k3=0 und k4=0 erfüllt ist. Die Erfolgswahrscheinlichkeiten bei jedem Zug sind entsprechend p1 = ${4 \over 10}$, p2 = ${2 \over 10}$, p3 = ${3 \over 10}$ und p4 = ${1 \over 10}$. Die Wahrscheinlichkeit eine blaue Kugel zu ziehen ist bspw. p2 = ${2 \over 10}$, da zwei von zehn Kugeln blau ist. Dies gilt für jede Runde der Ziehung. n = k1 + k2 + k3 + k4 = 2 + 1 + 0 + 0 = 3, weil dreimal gezogen wird.

Insgesamt erhält man

f(2, 1, 0, 0) = $\frac{3!}{2!1!0!0!}\left(\frac 4 {10}\right)^2\;\cdot \;\left(\frac 2 {10}\right)^1\;\cdot \;\left(\frac 3 {10}\right)^0\;\cdot \;\left(\frac 1 {10}\right)^0\;=\;\frac{96}{10^3}$.

Hinweis

Wie man sich jetzt sicherlich denken kann, handelt es sich bei der Binomialverteilung um einen Sonderfall der Multinomialverteilung für r = 2.

Aufgabe

Berechne die Wahrscheinlichkeit, dass im Urnenexperiment aus dem vorigen Beispiel

  1. genau zwei rote Kugeln
  2. drei gelbe und eine voilette Kugel

gezogen werden.

Vertiefung

Lösung a:

Für diese Aufgabe kann man sowohl die Binominalverteilung, als auch die Multinomialverteilung  anwenden. Da es nur um zwei Ereignisse geht, um "rot" oder "nicht-rot", also r = 2.

mit der Binomialverteilung B(3,$3\over{10}$):

P(X = 2) = $\left(\genfrac{}{}{0pt}{0}22\right)\;\cdot \;\left(\frac 3 {10}\right)^2\;\cdot \;\left(1\;-\;\frac 3 {10}\right)^{2\;-\;2}\;=\;\frac{9}{10^2}$

mit der Multinomialverteilung kommt man klarerweise auf dasselbe Ergebnis:

f(0, 0, 2, 0) = $\frac{2!}{0!0!2!0!}\left(\frac 4 {10}\right)^0\;\cdot \;\left(\frac 2 {10}\right)^0\;\cdot \;\left(\frac 3 {10}\right)^2\;\cdot \;\left(\frac 1 {10}\right)^0\;=\;\frac{9}{10^2}$.

Vertiefung

Lösung b:

Im zweiten Fall ist lediglich die Multinomialverteilung möglich, da es mehr als zwei Ausgänge gibt, nämlich „grau“, „grün“ und „nicht grün“.

f (3, 0, 0, 1) = $\frac{4!}{3!0!0!1!}\left(\frac 4 {10}\right)^3\;\cdot \;\left(\frac 2 {10}\right)^0\;\cdot \;\left(\frac 3 {10}\right)^0\;\cdot \;\left(\frac 1 {10}\right)^1\;=\;\frac 256{10^4}$.

 

Hypergeometrische Verteilung

 

Regel Hypergeometrische Verteilung H(N,M,n)

Merke

Voraussetzungen:

Wir haben nun eine Urne mit insgesamt N Kungeln, davon besitzen M Stück die geforderte Eigenschaft. Jetzt wird n mal ohne Zurücklegen gezogen

Wie groß ist die Wahrscheinlichkeit, genau k mal eine Kugel mit der gewünschten Eigenschaft gezogen zu haben?

 

Merke

f(k) = P(X = k) = $\frac{\left(\genfrac{}{}{0pt}{0}Mk\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{N\;-\;M}{n\;-\;k}\right)}{\left(\genfrac{}{}{0pt}{0}Nn\right)}$.

Im Gegensatz zur Binomialverteilung wird nun ohne Zurücklegen gezogen, dass bedeutet, das die Ereignisse nicht mehr unabhängig voneinander sind, sondern abhängig.

Beispiel

Gegeben sei eine Urne mit acht Kugeln, von denen vier blau und vier weiß sind. Es wird viermal ohne Zurücklegen gezogen. Wie groß ist die Wahrscheinlichkeit, drei blaue Kugeln zu ziehen?

Da alle Vorausetzungen für die hypergeometrischen Verteilung gegeben sind, könne wir mit dieser rechnen. N= 8 die Anzahl aller Kugeln. M= 4 die Anzahl der Kugeln mit der gesuchten Eigenschaft, hier also blau. n=4 mal wird insgesamz gezogen, wo von dann k= 3 Kugeln blau sein sollen.

$$ \begin{align} P(X = 3) & = \frac{\left(\genfrac{}{}{0pt}{0}43\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{8\;-\;4}{4\;-\;3}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)}= \frac{\left(\genfrac{}{}{0pt}{0}43\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{4}{1}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{4\;\cdot \;4}{\left(\genfrac{}{}{0pt}{0}84\right)}
\\ & = \frac{4\;\cdot \;4}{\frac{8!}{4!4!}}=  \frac {16}{70} = \frac 8{35} ≈ 0,229 \end{align}$$

Zur Vervollständigung auch die anderen Werte der Wahrscheinlichkeitsfunktion von X:

$$ \begin{align} P(X = 0) & = \frac{\left(\genfrac{}{}{0pt}{0}40\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{8\;-\;4}{4\;-\;0}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{\left(\genfrac{}{}{0pt}{0}40\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{4}{4}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{1\;\cdot \;1}{\left(\genfrac{}{}{0pt}{0}84\right)}
\\ & = \frac{1\;\cdot \;1}{\frac{8!}{4!4!}} = \frac {1}{70} ≈ 0,014 \end{align}$$

 

$$ \begin{align} P(X = 1) & = \frac{\left(\genfrac{}{}{0pt}{0}41\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{8\;-\;4}{4\;-\;1}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{\left(\genfrac{}{}{0pt}{0}41\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{4}{3}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{4\;\cdot \;4}{\left(\genfrac{}{}{0pt}{0}84\right)}
\\ & = \frac{4\;\cdot \;4}{\frac{8!}{4!4!}} = \frac {16}{70} = \frac 8{35} ≈ 0,229 \end{align}$$

 

$$ \begin{align} P(X = 2) & = \frac{\left(\genfrac{}{}{0pt}{0}42\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{8\;-\;4}{4\;-\;2}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{\left(\genfrac{}{}{0pt}{0}42\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{4}{2}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{6\;\cdot \;6}{\left(\genfrac{}{}{0pt}{0}84\right)}
\\ & = \frac{6\;\cdot \;6}{\frac{8!}{4!4!}} = \frac {36}{70} = \frac 18{35} ≈ 0,514\end{align}$$

 

$$ \begin{align} P(X = 4) & = \frac{\left(\genfrac{}{}{0pt}{0}44\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{8\;-\;4}{4\;-\;4}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{\left(\genfrac{}{}{0pt}{0}44\right)\;\cdot \;\left(\genfrac{}{}{0pt}{0}{4}{0}\right)}{\left(\genfrac{}{}{0pt}{0}84\right)} = \frac{1\;\cdot \;1}{\left(\genfrac{}{}{0pt}{0}84\right)}
\\ & = \frac{1\;\cdot \;1}{\frac{8!}{4!4!}} = \frac {1}{70} ≈ 0,014 \end{align}$$

Die Verteilung in einer Tabelle dargestellt:

xP
0${{1} \over {70}}$
1${{16} \over {70}}$
2${{36} \over {70}}$
3${{16} \over {70}}$
4${{1} \over {70}}$

Die Rekursionsformel bei hypergeometrischen Verteilung:

Merke

$p_{k + 1}$ =$\frac{(M\;-\;k)}{(k\;+\;1)}\;\cdot \;\frac{(n\;-\;k)}{(N\;-\;M\;-\;n\;+\;k\;+\;1)}\cdot {p_k}$

für k = 0, 1, 2, …, n - 1.

So kann man aus pk = P(X = k) weitere Wahrscheinlichkeiten berechnen:

Aus unserm Beispiel:

$$ P(X = 3) = p_3 = p_{2 + 1} = \frac{4\;-\;2}{2\;+\;1}\;\cdot \;\frac{4\;-\;2}{8\;-\;4\;-\;4\;+\;2\;+\;1}\cdot {p_2} =  \frac 2 3 \cdot \frac 2 3 \cdot \frac {18}{35} = \frac {8}{35} ≈ 0,229 $$

Aufgabe (hypergeometrische Verteilung)

Sind diese Aussagen richtig oder falsch?

  1. Sowohl die hypergeometrische, als auch die Binomialverteilung kann man beide verstehen als eine Stichprobe mit Zurücklegen.
  2. Die hypergeometrische Verteilung kann man immer auf ein Ziehen aus einer Urne mit insgesamt N Kugelen verstehen, wobei M Kugeln die gewünschte Eigenschaft haben. Dabei soll aus n-fachem Ziehen ohne Zurücklegen k-mal eine Kugel der gewünschten Eigenschaft aufweisen. Für dieses Experiment ist dieWahrscheinlichkeitsfunktion der hypergeometrischen Verteilung anwendbar.

Vertiefung

Lösung a:

Falsch. Die hypergeometrische Verteilung geht vielmehr von einer Stichprobe ohne Zurücklegen aus.

Vertiefung

Lösung b:

Richtig.

Poissonverteilung

Die Poissonverteilung kommt von Natur aus nicht vor, sonder ist lediglich aproximativ (also näherungsweise) anwendbar, weil sie nur unter bestimmten Voraussetzungen Grenzverteilung der Binomialverteilung ist. Es gilt, je geringer die Erfolgswahrscheinlichkeit p und je größer der Umfang der Stichprobe n einer Binomialverteilung B(n, p), desto besser. Darumm wird sie auch Verteilung der seltenen Ereignisse genannt.

Die Poissonverteilung ist über ihre Wahrscheinlichkeitsfunktion definiert:

Merke

Jede Zufallsvariable X für deren Wahrscheinlichkeitsfunktion folgendes gilt ist poissonverteilt zum Parameter λ (in Zeichen X ~ ∏λ):

f(k) =$\left\{\genfrac{}{}{0pt}{0}{\frac{\Lambda ^k}{k!}\;\cdot \;e^{-\Lambda }\mathit{f\text{ü}r} \text{ }k\;=\;0,1,2,3,...}{0\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \mathit{sonst}}\right.$

wobei λ > 0.

 

Dabei ist λ einerseits Erwartungswert E(X)= λ, andererseits auch Varianz der Zufallsvariablen X Var(X) = λ.

Möchte man die Poissonverteilung nutzen, rechnet man λ= n*p. Wie man erkennt, ist das Ereignis genau genommen auch binomial verteilt.

Die Approximation ist anwendbar für n ≥ 50, p ≤ 10, n·p ≤ 10.

Die Poissonverteilung besitzt eine Reproduktionseigenschaft, nämlich dass die Summe unabhängig poissonverteilter Zufallsvariablen wieder poissonverteilt ist. Anders ausgedrückt:

X1, X2, ..., Xn ~ ∏λi Xi ~ ∏λi + ... + λn.

Zur Veranschaulichung rechnen wir folgendes Beispiel:

-

Ein vollautomatischer Backautomat produziert Donuts, wobei 2,5% auf Grund von Mängeln nicht zu verkaufen sind. Das Auftreten einzelner Mängel ist unabhängig von den anderen. Wie groß ist die Wahrscheinlichkeit, dass bei 70 gebackenen Donuts

  1. genau einer Mängel aufweist?
  2. mindestens drei fehlerhaft sind?

Diese Aufgabe kann man auf zwei Wegen lösen, einmal über die Binomialverteilung, welche die genaue Lösung liefert und einmal über die Poissonverteilung, welche die approximative Lösung liefert:

Vertiefung

Exakte Lösung - über die Binomialverteilung

Die Zufallsvariable Xi, die als Ergebnis des i. Zuges definiert ist, ist gleich 1, wenn der Donut mangelhaft ist (die 1 steht immer für den Erfolg). Für einen verkaufsfähigen Donut ist Xi= 0.

Xi =$\left\{\genfrac{}{}{0pt}{0}{1\ \ \ \mathit{fehlerhaft}}{0\ \ \ \ \ \ \ \mathit{sonst}}\right.$

Xi ist binomialverteilt, also Xi ~ B(1; 0,025).

Da die fehlerhaften Donuts unabhägig von einander sind, ist die Summe unabhängig binomialverteilter Zufallsvariablen ebenso binomialverteilt:

X =$\sum _{i\;=\;1}^{70}\;$ Xi und X ~ B(70; 0,025).

Mit Hilfe der Binomialverteilung  sind die Ergebnisse also genau zu bestimmen:


  1. $ \begin{align} P(X = 1) & = \left(\genfrac{}{}{0pt}{0}{70}1\right) \cdot 0,025^1 \cdot 0,975^{70 - 1}
    \\ & = 70 \cdot 0,025 \cdot 0,1743
    \\ & = 0,3050398 \end{align}$


  2. $ \begin{align} P(X ≥ 3) & = 1 - P(X < 3)
    \\ & = 1 - [P(X = 0) + P(X = 1) + P(X = 2)]
    \\ & = 1 - [0,97570 + 0,305 + \left(\genfrac{}{}{0pt}{0}{70}2\right) \cdot 0,025^2 \cdot 0,975^{68}]
    \\ & = 1 – [0,16995 + 0,3050398 + 0,26984]
    \\ & = 0,2551702. \end{align}$

Wie man erkennen kann, ist es sehr aufwändig die genaue Verteilung auszurechnen.

Vertiefung

Approximative Lösung – über die Poissonverteilung

Die Approximationskriterien sind erfüllt: n = 70 ≥ 50, p = 0,025 ≤ 10 und n·p = 70·0,025 = 1,75 ≤ 10
Deshalb können wir mit der Poissonverteilung zum Parameter λ = n·p = 70·0,025 = 1,75 rechnen. Wir nutzen ∏1,75 anstelle von B(70; 0,025).


  1. $ \begin{align} P(X = 1) & = \frac{17,5^1}{1!} \cdot e^{-1,75} = \frac{1,75} 1 \cdot 0,1737794 = 0,3041044 \end{align}$

  2. $ \begin{align} P(X ≥ 3) & = 1 - P(X < 3) = 1 - P(X ≤ 2)
    \\ & = 1 – [(X = 0) + P(X = 1) + P(X = 2)]
    \\ & = 1 - [\frac{1,75^0}{0!} \cdot e^{-1,75} + \frac{1,75^1}{1!} \cdot e^{- 1,75} + \frac{1,75^2}{2!} \cdot e^{- 1,75}]
    \\ & = 1 - e^{-1,75} [1 + 1,75 + 1,53125]
    \\ & = 1 – 0,1737794 \cdot 4,28125
    \\ & = 0,256007 \end{align}$

Man sieht, dass die Approximation in beiden Fällen recht brauchbar ist.

Rekursionsformel

Merke

Die Rekursionsformel für die Poisson-Verteilung lautet

p0 = e - λ pk

pk+1 = $\frac{\Lambda }{k\;+\;1}$·pk,

für k = 0, 1, 2, 3, …

Für unser Beispiel der Donuts sähe das z.B. so aus:

Aus p2 = P(X = 2) = 0,26609 könnte man die Wahrscheinlichkeit für p3 = P(X = 3) schließen:

p3 = $\frac{1,75}{2\;+\;1}$·0,26609 = 0,15522,

Auf anderem Wege: p3 = P(X = 3) = $\frac{1,75^3}{(2\;+\;1)!}$·e - 1,75 = 0,15522.

Aufgabe (Richtig-Falsch-Fragen zur Poissonverteilung)

Die folgenden Aussagen sind richtig oder falsch. Entscheide.

  1. Kennt man die Varianz einer poissonverteilten Zufallsvariable, kennt man gleichzeitig auch ihren Erwartungswert.
  2. Eine poissonverteilte Zufallsvariable zum Erwartungswert 4 kann nur Werte von 0 bis einschließlich 4 annehmen.
  3. Es gilt bei der Poissonverteilung, dass die Summe von n unabhängigen poissonverteilten Zufallsvariablen wieder poissonverteilt ist.

-

Lösung a:

Richtig, denn es gilt für eine poissonverteilte Zufallsvariable, dass ihr Erwartungswert und ihre Varianz übereinstimmen und beide jeweils der Parameter der Poissonverteilung sind:

X ~ ∏λ $\Rightarrow$E(X) = Var(X) = λ.

-

Lösung b:

Falsch.

Ist eine poissonverteilte Zufallsvariable kann in der Theorie beliebig hohe Werte annehmen. Der Wertebereich ist 0, 1, 2, 3, 4, 5, ..., usw. Bspw. ist die Wahrscheinlichkeit, dass der Wert 7 angenommen wird P(X = 7) = $\frac{4^7}{7!}$·e-4 = 0,05954.
Die Werte werden jedoch immer kleiner, bei P(X = 11) ist er nur noch P(X = 11) = $\frac{4^{11}}{11!}$ ·e-4= 0,001924

Vertiefung

Lösung c:

Richtig.