ZU DEN KURSEN!

Deskriptive Statistik - Unabhängigkeit

Kursangebot | Deskriptive Statistik | Unabhängigkeit

Deskriptive Statistik

Unabhängigkeit

wiwiweb JETZT WEITER LERNEN!

Weitere Lernvideos sowie zahlreiche Materialien erwarten dich:
Komplettpaket für wiwi-Studenten


1755 Lerntexte mit den besten Erklärungen

468 weitere Lernvideos von unseren erfahrenen Dozenten

3813 Übungen zum Trainieren der Inhalte

1755 informative und einprägsame Abbildungen

Folglich stellt sich die Frage, ob eine Korrelation zwischen dem Studiengang und der Ernährungsweise besteht. Studiert jemand, der sich vegetarisch ernährt vorzugsweise Lehramt bzw. ernährt sich jemand, der Lehramt studiert, lieber vegetarisch? Beantwortet durch diese Frage durch die Analyse der Abhängigkeit zweier Verteilungen.

Zwei Verteilungen X und Y heißen statistisch unabhängig (= empirisch unabhängig), wenn für alle x und y gilt:

relative Häufigkeit (X = x  und  Y = y)  =  rel. Häufigkeit (X = x) • rel. Häufigkeit (Y = y)

In Zeichen:

  • für die relativen Häufigkeiten
    • $\ h_{ij} = h_{i.} \cdot h_{.j} $ $\;\;\;\; $ (für $\ i = 1,…, k $ und $\ j = 1,…, l$)

  • für die absoluten Häufigkeiten
    • $\ H_{ij}={{H_{i.} \cdot H_{.j}} \over n} $ $\;\;\;\; $ (für $\ i = 1,…, k $ und $\ j = 1,…, l$)

Konkret heißt dies, dass die Gleichheit für alle Werte erfüllt sein muss, die von den Verteilungen X und Y angenommen werden können.

Methode

Statistische Unabhängigkeit:

Wenn eine zweidimensionale Tabelle bereits bekannt ist, heißt dies konkret, dass

  1. das Produkt der relativen Randhäufigkeiten gleich dem Eintrag in der Zelle sein muss, und zwar für alle Zellen (Tabelle mit relativen Häufigkeiten), beziehungsweise, dass

  2. das Produkt der absoluten Randhäufigkeiten geteilt durch Beobachtungsumfang n gleich dem Eintrag in der Zelle sein muss (Tabelle mit absoluten Häufigkeiten).

Dies muss für alle Zellen gelten.

Statistische Unabhängigkeit berechnen

Für das vorangegangenes Beispiel würden sich bei Unabhängigkeit (!) folgende Werte für die relativen Häufigkeiten ergeben:

 SALAMWMBΣ
flexibel0,07050,16450,09870,13630,47
vegetarisch0,04950,11550,06930,09570,33
vegan0,030,070,0420,0580,2
Σ0,150,350,210,291

So ergäbe sich bei Unabhängigkeit für die relative Häufigkeit, dass jemand Lehramtsstudierender und Vegetarier ist, 0,35 · 0,33 = 0,1155 (siehe Tabelle oben). Jedoch wissen wir aus der Tabelle im vorherigen Kapitel ("gemeinsame Verteilungen"), dass die relative Häufigkeit für dieses Ereignis gleich 0,06 ist. Da wir hier schon eine Ungleichheit der Werte aufgedeckt haben, lässt sich dies auch für alle anderen übertragen. Daraus schließen wir nun, dass die zwei Verteilungen X und Y abhängig sind.

Merke

Bei Unabhängigkeit der Merkmale ist die gesamte Information über die gemeinsame Verteilung bereits in den Randverteilungen enthalten.

Damit haben wir anhand dieses Beispiels 49 also alle relevanten Aspekte mehrdimensionale Verteilungen kennengelernt. Nochmals als kleine Wiederholung bzw. zur Erinnerung, welche Themen alles behandelt wurden:

  1. gemeinsame Verteilung
  2. Randverteilung
  3. bedingte Verteilung
  4. statistische Unabhängigkeit

Bei ein- und demselben Studenten wird also das Merkmal Studienrichtung X und Ernährungsweise Y gemessen.

In diesem Video wird das Gelernte nochmals kurz zusammengefasst und an einem weiten Beispiel erläutert: