wiwiweb
online lernen

Besser lernen mit Online-Kursen

NEU! Jetzt online lernen:
SPSS Software
Den Kurs kaufen für:
einmalig 19,00 €
Zur Kasse
Korrelationsanalyse > Statistische Grundlagen > Zusammenhangsmaße auf Nominal- und Ordinalskala:

Zusammenhangsmaße auf der Nominalskala

WebinarTerminankündigung aus unserem Online-Kurs Volks- und Betriebswirtschaft:
 Am 12.01.2017 (ab 18:00 Uhr) findet unser nächstes Webinar statt.
Gratis-Webinar Grundbegriffe der Bilanzierung
- In diesem 60-minütigen Gratis-Webinar gibt Daniel Lambert einen Überblick über die zentralen Begriffe der Bilanzierung - hier im Besonderen dem Bilanzausweis.
[weitere Informationen] [Terminübersicht]

Beispiel:
Eine Befragung unter 100 Studenten bzgl. der Religionszugehörigkeit und der Studienrichtung ergibt folgendes Ergebnis:

  BWL Jura Medizin Anglistik
katholisch 10 12 6 18
evangelisch 8 3 18 9
muslimisch 7 6 2 1

Im o.e. Beispiel der Religionszugehörigkeit und dem Studienfach könnte man sich die Frage stellen, den Zusammenhang zu quantifizieren, d.h. die Stärke der Zugehörigkeit durch eine Zahl auszudrücken. Beide Merkmale sind nominalskaliert, da lediglich Unterschiede, nicht hingegen eine Reihenfolge feststellbar ist. Relevant ist also nicht der Bravais-Pearsonsche Korrelationskoeffizient (dieser nur bei den metrischen Skalen) oder der Spearmansche Rangkorrelationskoeffizient (dieser erst ab ordinalskalierten Daten).

Achtung: Wir rechnen im folgenden mit den absoluten Häufigkeiten $\ H_{ij} $, nicht mit den relativen $\ h_{ij} $!

Man berechnet zunächst die erwarteten Häufigkeiten $\ H_{ij}^e $, (oder, in Langform geschrieben, $\ H^e(xi, yj)$ die sich bei Unabhängigkeit ergeben („e” steht für „expected” = erwartet). Hierzu

  • addiert man zeilen- bzw. spaltenweise die Zahlen der Tabelle,
  • multipliziert die sich ergebenden Randhäufigkeiten und
  • dividiert durch den Stichprobenumfang n.

Man erhält für das Beispiel somit

BWL Jura Medizin Anglistik $$\ \sum $$
katholisch 11,5 9,66 11,96 12,88 46
evangelisch 9,5 7,98 9,88 10,64 38
muslimisch 4 3,36 4,16 4,48 16
$\ \sum $ 25 21 26 28 100

Wenn also das Studienfach und die Zugehörigkeit zu einer Glaubensrichtung unabhängig voneinander wären, dann gäbe es z.B. $\ H_{31}^e=4 $muslimische BWLer bzw. $\ H_{23}^e =9,88 $evangelische Mediziner bzw. $\ H_{12}^e=9,66 $ katholische Juristen etc. Die beobachteten absoluten Häufigkeiten $\ H_{ij}^0 = H_ij $ und die erwarteten Häufigkeiten $\ H_{ij}^e $ werden dann zu einer Kennzahl $\ \chi^2 $(sprich: Chi-Quadrat) zusammengefasst.

Chi-Quadrat berechnen

$$\ \chi^2= \sum_{i=1}^k \sum_{j=1}^l {(H^0 (x_i,y_j)- H^e (x_i,y_j))^2 \over H^e (x_i,y_j)}= \sum_{i=1}^k \sum_{j=1}^l {(H_{ij}^0-H_{ij}^e)^2 \over H_{ij}^e } $$

$\ x_i $ steht für den Eintrag der i. Zeile $\ y_j $ entsprechend für jenen der j. Spalte. So ist $\ h^o(x_2,y_3) = 18, h^o(x_3,y_4) = 1 $(s. Zahlen dieses Beispiels aus vorherigen Kapiteln), $\ h^e(x_2,y_1) = 9,5 $ usw. Das $\ H^o $ steht für beobachtete Häufigkeit (o wie observed),$\ H^e $ steht, wie oben bereits erwähnt, für die erwartete Häufigkeit (e wie expected). Die Doppelsumme heißt lediglich, dass über alle Felder aufsummiert wird, nämlich über alle Zeilen (erstes Summenzeichen) und alle Spalten (zweites Summenzeichen). Konkret stellt man am besten beobachtete (linke Zahl) und erwartete Häufigkeiten (rechte Zahl) zunächst zusammen dar und errechnet dann die Größe $\ \chi^2 $:

BWL Jura Medizin Anglistik
katholisch 10 11,5 12 9,66 6 11,96 18 12,88
evangelisch 8 9,5 3 7,98 18 9,88 9 10,64
muslimisch 7 4 6 3,36 2 4,16 1 4,48

Damit ist
$$\ \chi^2={(10-11,5)^2 \over 11,5}+{(12-9,66)^2 \over 9,66}+...+{(1-4,48)^2 \over 4,48} $$ $$\ = 0,1957 + 0,5668 + ... + 2,7032 = 24,1878 $$
Es ist klar, dass $\ \chi^2 = 0 $ ist, wenn die beiden betrachteten Merkmale unabhängig sind, denn dann sind bereits die Zahlen innerhalb jeder Zelle gleich. Problematisch sind an der Kenngröße zwei Dinge:

  • die Zahl $\ \chi^2 $ ist nicht normiert, es gilt also nicht die wünschenswerte Eigenschaft $\ \chi^2 \leq 1 $
  • die Zahl $\ \chi^2 $ ist abhängig vom Stichprobenumfang n, d.h. bei einem anderen n, z.B. n = 200, aber gleichen relativen Häufigkeiten verändert sich $\ \chi^2 $, was für ein Zusammenhangsmaß wenig sinnvoll ist.

Testen des Zusammenhang zweier nominalskalierter Merkmale

Man nimmt deshalb die Zahl $\ \chi^2 $ nicht als Maßzahl für den linearen Zusammenhang zwischen zwei nominalskalierten Merkmalen. Als Maßzahlen für den Zusammenhang zweier nominalskalierter Merkmale bieten sich vielmehr an:

  • der Phi-Koeffizient φ,
  • der Kontingenzkoeffizient nach Pearson $\ C_P $
  • der korrigierte Kontingenzkoeffizient $\ C_{korr} $
  • der Kontingenzkoeffizient nach Cramér $\ C_C $

Zur Berechnung der einzelnen Maßzahlen: Der Phi-Koeffizient ist definiert als $$\ \Phi = \sqrt { \chi^2 \over n} $$ und ist hier also $\ \Phi = \sqrt {24,1878 \over 100} =0,4918 $

$\ C_P $, der sogenannte Kontingenzkoeffizienten nach Pearson, ist $$\ C_P = \sqrt {\chi^2 \over \chi^2+n} $$
Im vorliegenden Beispiel gilt $\ C_P= \sqrt { \chi^2 \over \chi^2+n}= \sqrt {24,1878 \over 24,1878+100} =0,4413 $.
Die Zahl $\ C_P $ nimmt nicht den Wert 1 an und ist damit nicht voll als Zusammenhangsmaß geeignet.

Dieser Schönheitsfehler wird durch den korrigierten Kontingenzkoeffizienten geheilt.
$$\ C_{korr} = C_P \sqrt {C^* \over C^*-1} = \sqrt {{\chi^2 \over \chi^2+n} \cdot {C^* \over (C^*-1}} $$

Hierbei ist $\ C^* $ das Minimum aus der Anzahl der Zeilen k und der Anzahl der Spalten l, also $\ C^* $ = min {k; l}. Im o.e. Beispiel ist C = min {3; 4} = 3, also
$\ C_{korr} = \sqrt {{24,1878 \over 24,1878+100} \cdot {3 \over 3-1}}=0,5405 $
Der korrigierte Kontingenzkoeffizient $\ C_{korr} $ ist normiert, liegt also zwischen 0 und 1:$\ 0 \leq C_{korr} \leq 1 $
Wenn $\ C_{korr} = 1 $ ist, dann kann von einem Merkmal sicher auf die Ausprägung des anderen Merkmals geschlossen werden (jedenfalls in eine Richtung).
Wenn $\ C_{korr} = 0 $ ist, dann ergibt sich die relative Häufigkeit der gemeinsamen Verteilung als Produkt der relativen Randhäufigkeiten.

Darüber hinaus existiert der Kontingenzkoeffizient nach Cramér.
$\ C_C = \sqrt {\chi^2 \over {n \cdot [min(m,l)-1]}} $

Auch hier gilt $\ 0 \leq C_C \leq 1 $, der Cramérsche Koeffizient ist also normiert. Für das o.e. Beispiel ist damit
$\ C_C= \sqrt {24,1878 \over {100 \cdot [min(4;3)-1}}= \sqrt {24,1878 \over 200} =0,3478 $

Vorstellung des Online-Kurses SPSS Statistik-SoftwareSPSS Statistik-Software
Dieser Inhalt ist Bestandteil des Online-Kurses

SPSS Software

wiwiweb - Interaktive Online-Kurse (wiwiweb.de)
Diese Themen werden im Kurs behandelt:

[Bitte auf Kapitelüberschriften klicken, um Unterthemen anzuzeigen]

  • Grundlagen
    • Aufbau
    • Einführung
    • Erste Schritte
    • Datenmatrix, Zeilen, Spalten
    • Dateneingabe
  • Daten
    • Definieren und Validieren
      • Einleitung zu Definieren und Validieren
      • Eigenschaften definieren
      • Messniveau festlegen
    • Strukturieren, Sortieren und Transponieren
      • Sortieren
      • Fälle auswählen
  • Transformieren
    • Berechnen, verschieben, zählen
    • Umcodieren und klassieren
  • Statistische Kennzahlen (Deskriptive Statistik)
    • Einleitung zu Statistische Kennzahlen (Deskriptive Statistik)
    • Häufigkeiten
    • Fälle zusammenfassen
    • Kreuztabellen
  • Mittelwertvergleiche
    • Einleitung zu Mittelwertvergleiche
    • T-Test
    • Zwei unabhängige Stichproben
    • Zwei abhängige Stichproben
  • Korrelationsanalyse
    • Statistische Grundlagen
      • Zusammenhangsmaße auf Nominal- und Ordinalskala
        • Korrelationsanalysen
        • Zusammenhangsmaße auf der Nominalskala
        • Zusammenhangsmaße auf der Ordinalskala
      • Zusammenhangsmaße auf metrischen Skalen
        • Übersicht
        • Bravais-Pearsonscher Korrelationskoeffizient
        • Korrelationskoeffizient von Ferchner
    • Durchführung in SPSS
      • Einleitung zu Durchführung in SPSS
      • Bivariat
      • Partiell
  • Regressionsanalyse
    • Einleitung zu Regressionsanalyse
    • Lineare Regression
    • Nichtlineare Regression
  • Einfaktorielle Varianzanalyse
    • Mathematische Grundlagen
    • Varianzanalyse in SPSS
  • Clusteranalyse
    • Einführung
    • Distanzmaße
    • Hierarchische Klassifikation
      • Einleitung zu Hierarchische Klassifikation
      • Linkage Methoden
      • Zentroidverfahren
    • Klassifikation von Variablen
  • 40
  • 13
  • 78
  • 56
einmalig 19,00
inkl. 19% Mehrwertsteuer
Online-Kurs Top AngebotTrusted Shop

Unsere Nutzer sagen:

  • Odelette Bisson

    Odelette Bisson

    "Ich hatte zu Beginn des Studiums keine Ahnung von BWL. Dank wiwiweb.de hab ich jetzt den Durchblick!"
  • Andreas Sommer

    Andreas Sommer

    "Großes Lob für die guten Kurse! Ich hab zum Glück bestanden."
  • Barbara Kalb

    Barbara Kalb

    "Die Videos von Daniel Lambert sind einfach klasse. Johnny Controlleti :)"

NEU! Sichere dir jetzt die perfekte Prüfungsvorbereitung und spare 10% bei deiner Kursbuchung!

10% Coupon: lernen10

Zu den Online-Kursen