Beispiel:
Eine Befragung unter 100 Studenten bzgl. der Religionszugehörigkeit und der Studienrichtung ergibt folgendes Ergebnis:
BWL | Jura | Medizin | Anglistik | |
katholisch | 10 | 12 | 6 | 18 |
evangelisch | 8 | 3 | 18 | 9 |
muslimisch | 7 | 6 | 2 | 1 |
Im o.e. Beispiel der Religionszugehörigkeit und dem Studienfach könnte man sich die Frage stellen, den Zusammenhang zu quantifizieren, d.h. die Stärke der Zugehörigkeit durch eine Zahl auszudrücken. Beide Merkmale sind nominalskaliert, da lediglich Unterschiede, nicht hingegen eine Reihenfolge feststellbar ist. Relevant ist also nicht der Bravais-Pearsonsche Korrelationskoeffizient (dieser nur bei den metrischen Skalen) oder der Spearmansche Rangkorrelationskoeffizient (dieser erst ab ordinalskalierten Daten).
Achtung: Wir rechnen im folgenden mit den absoluten Häufigkeiten
Man berechnet zunächst die erwarteten Häufigkeiten
- addiert man zeilen- bzw. spaltenweise die Zahlen der Tabelle,
- multipliziert die sich ergebenden Randhäufigkeiten und
- dividiert durch den Stichprobenumfang n.
Man erhält für das Beispiel somit
BWL | Jura | Medizin | Anglistik | | |
katholisch | 11,5 | 9,66 | 11,96 | 12,88 | 46 |
evangelisch | 9,5 | 7,98 | 9,88 | 10,64 | 38 |
muslimisch | 4 | 3,36 | 4,16 | 4,48 | 16 |
25 | 21 | 26 | 28 | 100 |
Wenn also das Studienfach und die Zugehörigkeit zu einer Glaubensrichtung unabhängig voneinander wären, dann gäbe es z.B.
Chi-Quadrat berechnen
BWL | Jura | Medizin | Anglistik | |||||
katholisch | 10 | 11,5 | 12 | 9,66 | 6 | 11,96 | 18 | 12,88 |
evangelisch | 8 | 9,5 | 3 | 7,98 | 18 | 9,88 | 9 | 10,64 |
muslimisch | 7 | 4 | 6 | 3,36 | 2 | 4,16 | 1 | 4,48 |
Damit ist
Es ist klar, dass
- die Zahl
ist nicht normiert, es gilt also nicht die wünschenswerte Eigenschaft - die Zahl
ist abhängig vom Stichprobenumfang n, d.h. bei einem anderen n, z.B. n = 200, aber gleichen relativen Häufigkeiten verändert sich , was für ein Zusammenhangsmaß wenig sinnvoll ist.
Testen des Zusammenhang zweier nominalskalierter Merkmale
Man nimmt deshalb die Zahl
- der Phi-Koeffizient φ,
- der Kontingenzkoeffizient nach Pearson
- der korrigierte Kontingenzkoeffizient
- der Kontingenzkoeffizient nach Cramér
Zur Berechnung der einzelnen Maßzahlen: Der Phi-Koeffizient ist definiert als
Im vorliegenden Beispiel gilt
Die Zahl
Dieser Schönheitsfehler wird durch den korrigierten Kontingenzkoeffizienten geheilt.
Hierbei ist
Der korrigierte Kontingenzkoeffizient
Wenn
Wenn
Darüber hinaus existiert der Kontingenzkoeffizient nach Cramér.
Auch hier gilt
Weitere interessante Inhalte zum Thema
-
Zusammenhangsmaße auf der Nominalskala
Vielleicht ist für Sie auch das Thema Zusammenhangsmaße auf der Nominalskala (Zusammenhangsmaße) aus unserem Online-Kurs Deskriptive Statistik interessant.
-
Bedingte Verteilungen
Vielleicht ist für Sie auch das Thema Bedingte Verteilungen (Mehrdimensionale Verteilungen) aus unserem Online-Kurs Deskriptive Statistik interessant.