ZU DEN KURSEN!

Deskriptive Statistik - Bedingte Verteilungen

Kursangebot | Deskriptive Statistik | Bedingte Verteilungen

Deskriptive Statistik

Bedingte Verteilungen

Wir betrachten nun Ereignisse, die unter der Maßgabe (= Voraussetzung) auftreten, dass ein anderes Ereignis bereits eingetreten sei. So kann man sich z.B. für die Frage interessieren, wieviele Studenten Anglistik studieren, wenn sie katholisch sind. Allgemein lauten die relativen Häufigkeiten für solche bedingten Ereignisse in Zeichen: $$\ h(a_i∣b_j)={ h_{ij} \over h_{.j}} $$

bedingte Verteilungen berechnen

Die bedingte relative Häufigkeit, dass ein Student Anglistik studiert, wenn er katholisch ist, lautet nicht 0,18 (denn dies wäre die relative Häufigkeit dafür, dass er Anglistik-Student ist und er katholisch ist), sondern vielmehr: $$\ h(b_4∣a_1)= {h_{14} \over h_{1.}} ={ 0,18 \over 0,46 }=0,39. $$
Nicht zu verwechseln ist dies mit der umgekehrten Fragestellung: Wie groß ist die relative Häufigkeit des Ereignisses, dass ein Student katholisch ist, wenn er Anglistik studiert (für das bessere Verständnis schreiben wir dies ausführlich und nicht lediglich mit Symbolen auf):
$$\ h(X = katholisch|Y = Anglistik) $$
$$\ = {f(X = katholisch \text {und} Y = Anglistik) \over f(Y = Anglistik)} $$
in Zeichen $$\ h(a_1∣b_4)= {h_{14} \over h_{.4}} = {0,18 \over 0,28}=0,64 $$
Insgesamt lautet also die bedingte Verteilung für die katholischen Studenten:

  • rel. Häufigkeit ( Y = BWL | X = katholisch),
    • in Zeichen $\ h(b_1∣a_1)= {h_{11} \over h_{1.}} ={0,1 \over 0,46}=0,217 $
  • rel. Häufigkeit ( Y = Jura | X = katholisch),
    • also $\ h(b_2∣a_1)= {h_{12} \over h_{1.}} ={0,12 \over 0,46}=0,261 $
  • rel. Häufigkeit ( X = Medizin | Y = katholisch) = $\ 0,13 $,
  • rel. Häufigkeit ( X = Anglistik | Y = katholisch) = $\ 0,391 $.

Wenn man nun die Zahlen in eine einzige Tabelle einträgt, erhält man die bedingte Verteilung für die katholischen Studenten, d.h. wenn x = katholisch gesetzt wird:

Y|(X = katholisch) rel. Häufigkeit
BWL 0,217
Jura 0,261
Medizin 0,13
Anglistik 0,391

Die bedingte Verteilung der Studienrichtungen für evangelische Studenten lautet

Y|(X = evangelisch) rel. Häufigkeit
BWL 0,211
Jura 0,079
Medizin 0,474
Anglistik 0,237

Jene für muslimische hingegen

Y|(x = muslimisch) rel. Häufigkeit
BWL 0,4375
Jura 0,375
Medizin 0,125
Anglistik 0,0625

Die bedingte Verteilung der Studienrichtung unter den Voraussetzungen der gegebenen Religion ist in der folgenden Tabelle zusammen gefasst:

  BWL Jura Medizin Anglistik $$\ \sum $$
katholisch 0,217 0,261 0,13 0,391 1
evangelisch 0,211 0,079 0,474 0,237 1
muslimisch 0,4375 0,375 0,125 0,0625 1

Kennzahlen bei bedingten Verteilungen

Es lassen sich nun außerdem für bedingte Verteilungen gewisse Kennzahlen berechnen, nämlich

  • bedingte Lagemaße,
  • bedingte Streuungsmaße,
  • bedingte Formmaße.

Die Ermittlung erfolgt hierbei absolut analog zu den unbedingten Maßen. Der bedingte Modus der katholischen Studenten ist das Anglistik Studium, weil die bedingte relative Häufigkeit mit 0,391 in der Zeile für „katholisch“ am größten ist. Genauso ist der bedingte Modus der evangelischen Studenten das Fach Medizin, bei den Moslems hingegen die BWL.