Nun könnte man sich sicherlich fragen, wie stark der Zusammenhang aus unserem Beispiel 49 (der Ernährungsweise und dem Studiengang) denn genau ist, also für die Stärke der Zugehörigkeit eine Zahl zu finden. Sowohl die Werte Ernährungsweise als auch dem Studiengang sind nominalskaliert, weil nur Unterschiede aber keine Reihenfolge erkennbar oder Wertung möglich ist. Bedeutet, dass der Rangkorrelationskoeffizient (ab ordinalskalierten Daten) und der Bravais-Pearsonsche Korrelationskoeffizient (ab metrischen Skalen) nicht nutzbar sind.
-
Wir rechnen im Folgenden mit den absoluten Häufigkeiten
Im erste Schritt bestimmt man die erwarteten Häufigkeiten
Für das Beispiel ergeben sich folgende Werte:
SA | LA | MW | MB | ∑ | |
flexibel | 7,05 | 16,45 | 9,87 | 13,63 | 47 |
vegetarisch | 4,95 | 11,55 | 6,93 | 9,57 | 33 |
vegan | 3 | 7 | 4,2 | 5,8 | 20 |
∑ | 15 | 35 | 21 | 29 | 100 |
Wenn das Studienfach und die Ernährungsweise unabhängig voneinander wären, dann ergäbe sich z.B.
Chi-Quadrat berechnen
Das
SA | LA | MW | MB | |||||
flexibel | 6 | 7,05 | 19 | 16,45 | 5 | 9,87 | 17 | 13,63 |
vegetarisch | 5 | 4,95 | 6 | 11,55 | 13 | 6,93 | 9 | 9,57 |
vegan | 4 | 3 | 10 | 7 | 3 | 4,2 | 3 | 5,8 |
So ergibt sich ein Wert für
Logischerweise ist
Problem dieser Kenngröße sind zwei Aspekte:
- die Zahl
ist nicht normiert, gilt demnach nicht die wünschenswerte Eigenschaft - die Zahl
ist abhängig vom Stichprobenumfang n. Bedeutet bei anderem n (bspw. n = 150), jedoch gleichen relativen Häufigkeiten ändert sich , was für ein Zusammenhangsmaß wenig sinnvoll ist.
Messen des Zusammenhangs zweier nominalskalierter Merkmale
Man nimmt deshalb die Zahl
- der Phi-Koeffizient Φ,
- der Kontingenzkoeffizient nach Pearson
- der korrigierte Kontingenzkoeffizient
- der Kontingenzkoeffizient nach Cramér
Die oben genannten Koeffizienten werden wir nun auf das Beispiel anwenden:
- Phi-Koeffizient Φ:
- Kontingenzkoeffizienten nach Pearson
:
Die Zahlnimmt nicht den Wert 1 an und ist damit nicht voll als Zusammenhangsmaß geeignet. Dieser Schönheitsfehler wird geheilt durch: - korrigierte Kontingenzkoeffizient
:
Hierbei istdas Minimum aus der Anzahl der Zeilen k und der Anzahl der Spalten l, also = min {k; l}. Im obigen Beispiel ist C = min {3; 4} = 3.
Der korrigierte Kontingenzkoeffizientist normiert, liegt also zwischen 0 und 1: - Wenn
ist, dann kann von einem Merkmal sicher auf die Ausprägung des anderen Merkmals geschlossen werden (jedenfalls in eine Richtung). - Wenn
ist, dann ergibt sich die relative Häufigkeit der gemeinsamen Verteilung als Produkt der relativen Randhäufigkeiten.
- Wenn
- Kontingenzkoeffizient nach Cramér
:
Auch hier gilt, der Cramérsche Koeffizient ist also normiert.
Weitere interessante Inhalte zum Thema
-
Zusammenhangsmaße auf der Nominalskala
Vielleicht ist für Sie auch das Thema Zusammenhangsmaße auf der Nominalskala (Korrelationsanalyse) aus unserem Online-Kurs SPSS Software interessant.
-
Kreuztabellen
Vielleicht ist für Sie auch das Thema Kreuztabellen (Statistische Kennzahlen (Deskriptive Statistik)) aus unserem Online-Kurs SPSS Software interessant.