ZU DEN KURSEN!

Deskriptive Statistik - Unabhängigkeit

Kursangebot | Deskriptive Statistik | Unabhängigkeit

Deskriptive Statistik

Unabhängigkeit

Es stellt sich alsdann die Frage, ob die Studienrichtung mit der Religion zusammenhängt, ob z.B. muslimische Studenten bevorzugt Medizin oder ein anderes Fach studieren etc. Diese Frage wird beantwortet durch die Analyse der Abhängigkeit zweier Verteilungen.
Zwei Verteilungen X und Y heißen statistisch unabhängig (= empirisch unabhängig), wenn gilt

relative Häufigkeit (X = x  und  Y = y)  =  rel. Häufigkeit (X = x) ∙ rel. Häufigkeit (Y = y)

und zwar für alle x und y.

In Zeichen wenn gilt:

  • für die relativen Häufigkeiten
    • $\ h_{ij} = h_{i.} \cdot h_{.j} $, für $\ i = 1,…, k $ und $\ j = 1,…, l $
  • für die absoluten Häufigkeiten
    • $\ H_{ij}={{H_{i.} \cdot H_{.j}} \over n} $, für $\ i = 1,…, k $ und $\ j = 1,…, l $

Konkret heißt dies, dass die Gleichheit für alle Werte erfüllt sein muss, die von den Verteilungen X und Y angenommen werden können.

Statistische Unabhängigkeit:
Wenn eine zweidimensionale Tabelle bereits bekannt ist, heißt dies konkret, dass
  • das Produkt der relativen Randhäufigkeiten gleich dem Eintrag in der Zelle sein muss, und zwar für alle Zellen (Tabelle mit relativen Häufigkeiten), beziehungsweise, dass
  • das Produkt der absoluten Randhäufigkeiten geteilt durch Beobachtungsumfang n gleich dem Eintrag in der Zelle sein muss (Tabelle mit absoluten Häufigkeiten). Dies muss für alle Zellen gelten.

Statistische Unabhängigkeit berechnen

Bezogen auf das vorherige Beispiel also müsste bei Unabhängigkeit (!) die relative Häufigkeit wie folgt lauten:

  BWL Jura Medizin Anglistik $$\ \sum $$
katholisch 0,115 0,0966 0,1196 0,1288 0,46
evangelisch 0,095 0,0798 0,0988 0,1064 0,38
muslimisch 0,04 0,0336 0,0416 0,0448 0,16
$\ \sum $ 0,25 0,21 0,26 0,28 1

So müsste z.B. bei Unabhängigkeit die relative Häufigkeit, Jura zu studieren und evangelisch zu sein, 0,21∙0,38 = 0,0798 lauten (siehe Tabelle oben). Allerdings gilt für die relative Häufigkeit vielmehr 0,03 (wie in der Tabelle im Kapitel "Gemeinsame Verteilungen" berechnet wurde). Da also bereits für eine Zelle die Ungleichheit gilt, sind die beiden Verteilungen X und Y nicht unabhängig, sondern abhängig.

Merke

Merke: Bei Unabhängigkeit der Merkmale ist die gesamte Information über die gemeinsame Verteilung bereits in den Randverteilungen enthalten.