ZU DEN KURSEN!

SPSS Statistik-Software - Zusammenhangsmaße auf der Nominalskala

Kursangebot | SPSS Statistik-Software | Zusammenhangsmaße auf der Nominalskala

SPSS Statistik-Software

Zusammenhangsmaße auf der Nominalskala

Beispiel:
Eine Befragung unter 100 Studenten bzgl. der Religionszugehörigkeit und der Studienrichtung ergibt folgendes Ergebnis:

  BWL Jura Medizin Anglistik
katholisch1012618
evangelisch83189
muslimisch7621

Im o.e. Beispiel der Religionszugehörigkeit und dem Studienfach könnte man sich die Frage stellen, den Zusammenhang zu quantifizieren, d.h. die Stärke der Zugehörigkeit durch eine Zahl auszudrücken. Beide Merkmale sind nominalskaliert, da lediglich Unterschiede, nicht hingegen eine Reihenfolge feststellbar ist. Relevant ist also nicht der Bravais-Pearsonsche Korrelationskoeffizient (dieser nur bei den metrischen Skalen) oder der Spearmansche Rangkorrelationskoeffizient (dieser erst ab ordinalskalierten Daten).

Achtung: Wir rechnen im folgenden mit den absoluten Häufigkeiten , nicht mit den relativen !

Man berechnet zunächst die erwarteten Häufigkeiten , (oder, in Langform geschrieben, die sich bei Unabhängigkeit ergeben („e” steht für „expected” = erwartet). Hierzu

  • addiert man zeilen- bzw. spaltenweise die Zahlen der Tabelle,
  • multipliziert die sich ergebenden Randhäufigkeiten und
  • dividiert durch den Stichprobenumfang n.

Man erhält für das Beispiel somit

BWL Jura Medizin Anglistik
katholisch11,59,6611,9612,8846
evangelisch9,57,989,8810,6438
muslimisch43,364,164,4816
25212628100

Wenn also das Studienfach und die Zugehörigkeit zu einer Glaubensrichtung unabhängig voneinander wären, dann gäbe es z.B. muslimische BWLer bzw. evangelische Mediziner bzw. katholische Juristen etc. Die beobachteten absoluten Häufigkeiten und die erwarteten Häufigkeiten werden dann zu einer Kennzahl (sprich: Chi-Quadrat) zusammengefasst.

Chi-Quadrat berechnen



steht für den Eintrag der i. Zeile entsprechend für jenen der j. Spalte. So ist (s. Zahlen dieses Beispiels aus vorherigen Kapiteln), usw. Das steht für beobachtete Häufigkeit (o wie observed), steht, wie oben bereits erwähnt, für die erwartete Häufigkeit (e wie expected). Die Doppelsumme heißt lediglich, dass über alle Felder aufsummiert wird, nämlich über alle Zeilen (erstes Summenzeichen) und alle Spalten (zweites Summenzeichen). Konkret stellt man am besten beobachtete (linke Zahl) und erwartete Häufigkeiten (rechte Zahl) zunächst zusammen dar und errechnet dann die Größe :

BWL Jura Medizin Anglistik
katholisch1011,5129,66611,961812,88
evangelisch89,537,98189,88910,64
muslimisch7463,3624,1614,48

Damit ist

Es ist klar, dass ist, wenn die beiden betrachteten Merkmale unabhängig sind, denn dann sind bereits die Zahlen innerhalb jeder Zelle gleich. Problematisch sind an der Kenngröße zwei Dinge:

  • die Zahl ist nicht normiert, es gilt also nicht die wünschenswerte Eigenschaft
  • die Zahl ist abhängig vom Stichprobenumfang n, d.h. bei einem anderen n, z.B. n = 200, aber gleichen relativen Häufigkeiten verändert sich , was für ein Zusammenhangsmaß wenig sinnvoll ist.

Testen des Zusammenhang zweier nominalskalierter Merkmale

Man nimmt deshalb die Zahl nicht als Maßzahl für den linearen Zusammenhang zwischen zwei nominalskalierten Merkmalen. Als Maßzahlen für den Zusammenhang zweier nominalskalierter Merkmale bieten sich vielmehr an:

  • der Phi-Koeffizient φ,
  • der Kontingenzkoeffizient nach Pearson
  • der korrigierte Kontingenzkoeffizient
  • der Kontingenzkoeffizient nach Cramér

Zur Berechnung der einzelnen Maßzahlen: Der Phi-Koeffizient ist definiert als und ist hier also

, der sogenannte Kontingenzkoeffizienten nach Pearson, ist
Im vorliegenden Beispiel gilt .
Die Zahl nimmt nicht den Wert 1 an und ist damit nicht voll als Zusammenhangsmaß geeignet.

Dieser Schönheitsfehler wird durch den korrigierten Kontingenzkoeffizienten geheilt.


Hierbei ist das Minimum aus der Anzahl der Zeilen k und der Anzahl der Spalten l, also = min {k; l}. Im o.e. Beispiel ist C = min {3; 4} = 3, also

Der korrigierte Kontingenzkoeffizient ist normiert, liegt also zwischen 0 und 1:
Wenn ist, dann kann von einem Merkmal sicher auf die Ausprägung des anderen Merkmals geschlossen werden (jedenfalls in eine Richtung).
Wenn ist, dann ergibt sich die relative Häufigkeit der gemeinsamen Verteilung als Produkt der relativen Randhäufigkeiten.

Darüber hinaus existiert der Kontingenzkoeffizient nach Cramér.


Auch hier gilt , der Cramérsche Koeffizient ist also normiert. Für das o.e. Beispiel ist damit

Lerne erfolgreich mit unseren Online-Kursen

This browser does not support the video element.

Sichere dir jetzt das kompakte Wissen mit unserem Vollzugriff Komplettpaket für wiwi-Studenten


  • Alle Lernmaterialien komplett mit 470 Videos, 3814 interaktiven Übungsaufgaben und 1747 Lerntexten
  • Günstiger als bei Einzelbuchung nur 14,90 € mtl. bei 1 Monaten Mindestvertragslaufzeit
Jetzt entdecken

This browser does not support the video element.

Einzelkurs: SPSS Statistik-Software


  • Die besten Lernmaterialien: 40 Texte, 70 Abbildungen, 12 Videos und 78 Übungsaufgaben.
Jetzt entdecken

This browser does not support the video element.

Webinare: Du brauchst Hilfe? Frage unsere Dozenten im Webinar!


  • Perfekt vorbereitet auf die Präsentation in der mündlichen Prüfung
  • Am 10.05.2024 ab 18:00 Uhr
  • In diesem zweistündigen Webinar gibt Ihnen CMA Natalia Menzel einen Überblick über die Vorbereitungen auf die mündliche Prüfung.
Jetzt teilnehmen