Inhaltsverzeichnis
Folglich stellt sich die Frage, ob eine Korrelation zwischen dem Studiengang und der Ernährungsweise besteht. Studiert jemand, der sich vegetarisch ernährt vorzugsweise Lehramt bzw. ernährt sich jemand, der Lehramt studiert, lieber vegetarisch? Beantwortet durch diese Frage durch die Analyse der Abhängigkeit zweier Verteilungen.
Zwei Verteilungen X und Y heißen statistisch unabhängig (= empirisch unabhängig), wenn für alle x und y gilt:
relative Häufigkeit (X = x und Y = y) = rel. Häufigkeit (X = x) • rel. Häufigkeit (Y = y)
In Zeichen:
- für die relativen Häufigkeiten
- $\ h_{ij} = h_{i.} \cdot h_{.j} $ $\;\;\;\; $ (für $\ i = 1,…, k $ und $\ j = 1,…, l$)
- $\ h_{ij} = h_{i.} \cdot h_{.j} $ $\;\;\;\; $ (für $\ i = 1,…, k $ und $\ j = 1,…, l$)
- für die absoluten Häufigkeiten
- $\ H_{ij}={{H_{i.} \cdot H_{.j}} \over n} $ $\;\;\;\; $ (für $\ i = 1,…, k $ und $\ j = 1,…, l$)
Konkret heißt dies, dass die Gleichheit für alle Werte erfüllt sein muss, die von den Verteilungen X und Y angenommen werden können.
Methode
Statistische Unabhängigkeit:
Wenn eine zweidimensionale Tabelle bereits bekannt ist, heißt dies konkret, dass
- das Produkt der relativen Randhäufigkeiten gleich dem Eintrag in der Zelle sein muss, und zwar für alle Zellen (Tabelle mit relativen Häufigkeiten), beziehungsweise, dass
- das Produkt der absoluten Randhäufigkeiten geteilt durch Beobachtungsumfang n gleich dem Eintrag in der Zelle sein muss (Tabelle mit absoluten Häufigkeiten).
Dies muss für alle Zellen gelten.
Statistische Unabhängigkeit berechnen
Für das vorangegangenes Beispiel würden sich bei Unabhängigkeit (!) folgende Werte für die relativen Häufigkeiten ergeben:
SA | LA | MW | MB | Σ | |
flexibel | 0,0705 | 0,1645 | 0,0987 | 0,1363 | 0,47 |
vegetarisch | 0,0495 | 0,1155 | 0,0693 | 0,0957 | 0,33 |
vegan | 0,03 | 0,07 | 0,042 | 0,058 | 0,2 |
Σ | 0,15 | 0,35 | 0,21 | 0,29 | 1 |
So ergäbe sich bei Unabhängigkeit für die relative Häufigkeit, dass jemand Lehramtsstudierender und Vegetarier ist, 0,35 · 0,33 = 0,1155 (siehe Tabelle oben). Jedoch wissen wir aus der Tabelle im vorherigen Kapitel ("gemeinsame Verteilungen"), dass die relative Häufigkeit für dieses Ereignis gleich 0,06 ist. Da wir hier schon eine Ungleichheit der Werte aufgedeckt haben, lässt sich dies auch für alle anderen übertragen. Daraus schließen wir nun, dass die zwei Verteilungen X und Y abhängig sind.
Merke
Bei Unabhängigkeit der Merkmale ist die gesamte Information über die gemeinsame Verteilung bereits in den Randverteilungen enthalten.
Damit haben wir anhand dieses Beispiels 49 also alle relevanten Aspekte mehrdimensionale Verteilungen kennengelernt. Nochmals als kleine Wiederholung bzw. zur Erinnerung, welche Themen alles behandelt wurden:
- gemeinsame Verteilung
- Randverteilung
- bedingte Verteilung
- statistische Unabhängigkeit
Bei ein- und demselben Studenten wird also das Merkmal Studienrichtung X und Ernährungsweise Y gemessen.
In diesem Video wird das Gelernte nochmals kurz zusammengefasst und an einem weiten Beispiel erläutert:
Weitere interessante Inhalte zum Thema
-
Verkauf zum Buchwert
Vielleicht ist für Sie auch das Thema Verkauf zum Buchwert (Bewertung und Abschreibungen) aus unserem Online-Kurs Buchführung interessant.
-
Zusammenhangsmaße auf der Nominalskala
Vielleicht ist für Sie auch das Thema Zusammenhangsmaße auf der Nominalskala (Korrelationsanalyse) aus unserem Online-Kurs SPSS Software interessant.