ZU DEN KURSEN!

Deskriptive Statistik - Zusammenhangsmaße auf der Nominalskala

Kursangebot | Deskriptive Statistik | Zusammenhangsmaße auf der Nominalskala

Deskriptive Statistik

Zusammenhangsmaße auf der Nominalskala

Nun könnte man sich sicherlich fragen, wie stark der Zusammenhang aus unserem Beispiel 49 (der Ernährungsweise und dem Studiengang) denn genau ist, also für die Stärke der Zugehörigkeit eine Zahl zu finden. Sowohl die Werte Ernährungsweise als auch dem Studiengang sind nominalskaliert, weil nur Unterschiede aber keine Reihenfolge erkennbar oder Wertung möglich ist. Bedeutet, dass der Rangkorrelationskoeffizient (ab ordinalskalierten Daten) und der Bravais-Pearsonsche Korrelationskoeffizient (ab metrischen Skalen) nicht nutzbar sind.

-

Hier klicken zum Ausklappen

Wir rechnen im Folgenden mit den absoluten Häufigkeiten , nicht mit den relativen !

Im erste Schritt bestimmt man die erwarteten Häufigkeiten (oder anders formuliert), welche sich bei Unabhängigkeit ergeben. Dafür multipliziert man die Randhäufigkeiten der entsprechenden Spalte bzw. Zeile und teilt sie durch die Anzahl der Stichproben n.

Für das Beispiel ergeben sich folgende Werte:

 SALAMWMB
flexibel7,0516,459,8713,6347
vegetarisch4,9511,556,939,5733
vegan374,25,820
15352129100


Wenn das Studienfach und die Ernährungsweise unabhängig voneinander wären, dann ergäbe sich z.B.   für vegane Studierende der Medienwissenschaften oder für sich flexibel ernährende Lehramtsstudierende oder vegetarische Maschinenbaustudierende, usw. Die beobachteten absoluten Häufigkeiten und die erwarteten Häufigkeiten werden dann zu einer Kennzahl (Chi-Quadrat) zusammengefasst.

Chi-Quadrat berechnen

steht für den Eintrag der i. Zeile, entsprechend für jenen der j. Spalte. So ist (s. Zahlen dieses Beispiels aus vorherigen Kapiteln), usw.
Das steht für beobachtete Häufigkeit (o = observed), steht für die erwartete Häufigkeit (e = expected). Die Doppelsumme heißt lediglich, dass über alle Felder aufsummiert wird, nämlich über alle Zeilen (erstes Summenzeichen) und alle Spalten (zweites Summenzeichen). Am einfachsten ist es, wenn man erst alle Größen zusammen in einer Tabelle zusammenfasst, dabei die beobachtete (linke Spalte) und erwartete Häufigkeiten (rechte Spalte) notiert und anschließend die Größe bestimmt:

 SALAMWMB
flexibel67,051916,4559,871713,63
vegetarisch54,95611,55136,9399,57
vegan4310734,235,8


So ergibt sich ein Wert für von:

Logischerweise ist , wenn beide beobachteten Merkmale unabhängig sind, da dann ja schon die Werte innerhalb jeder Zelle gleich sind.

Problem dieser Kenngröße sind zwei Aspekte:

  1. die Zahl ist nicht normiert, gilt demnach nicht die wünschenswerte Eigenschaft
  2. die Zahl ist abhängig vom Stichprobenumfang n. Bedeutet bei anderem n (bspw. n = 150), jedoch gleichen relativen Häufigkeiten ändert sich , was für ein Zusammenhangsmaß wenig sinnvoll ist.

Messen des Zusammenhangs zweier nominalskalierter Merkmale

Man nimmt deshalb die Zahl nicht als Maßzahl für den linearen Zusammenhang zwischen zwei nominalskalierten Merkmalen. Als Maßzahlen für den Zusammenhang zweier nominalskalierter Merkmale bieten sich vielmehr an:

  1. der Phi-Koeffizient Φ,
  2. der Kontingenzkoeffizient nach Pearson
  3. der korrigierte Kontingenzkoeffizient
  4. der Kontingenzkoeffizient nach Cramér

Die oben genannten Koeffizienten werden wir nun auf das Beispiel anwenden:

  1. Phi-Koeffizient Φ:


  2. Kontingenzkoeffizienten nach Pearson :


    Die Zahl nimmt nicht den Wert 1 an und ist damit nicht voll als Zusammenhangsmaß geeignet. Dieser Schönheitsfehler wird geheilt durch:

  3. korrigierte Kontingenzkoeffizient :


    Hierbei ist das Minimum aus der Anzahl der Zeilen k und der Anzahl der Spalten l, also = min {k; l}. Im obigen Beispiel ist C = min {3; 4} = 3.

    Der korrigierte Kontingenzkoeffizient ist normiert, liegt also zwischen 0 und 1:

    • Wenn ist, dann kann von einem Merkmal sicher auf die Ausprägung des anderen Merkmals geschlossen werden (jedenfalls in eine Richtung).
    • Wenn ist, dann ergibt sich die relative Häufigkeit der gemeinsamen Verteilung als Produkt der relativen Randhäufigkeiten.

  4. Kontingenzkoeffizient nach Cramér :

    Auch hier gilt , der Cramérsche Koeffizient ist also normiert.
Lerne erfolgreich mit unseren Online-Kursen

This browser does not support the video element.

Sichere dir jetzt das kompakte Wissen mit unserem Vollzugriff Komplettpaket für wiwi-Studenten


  • Alle Lernmaterialien komplett mit 470 Videos, 3814 interaktiven Übungsaufgaben und 1746 Lerntexten
  • Günstiger als bei Einzelbuchung nur 14,90 € mtl. bei 1 Monaten Mindestvertragslaufzeit
Jetzt entdecken

This browser does not support the video element.

Einzelkurs: Deskriptive Statistik


  • Die besten Lernmaterialien: 95 Texte, 105 Abbildungen, 25 Videos und 212 Übungsaufgaben.
Jetzt entdecken

This browser does not support the video element.

Webinare: Du brauchst Hilfe? Frage unsere Dozenten im Webinar!


  • Perfekt vorbereitet auf die Präsentation in der mündlichen Prüfung
  • Am 10.05.2024 ab 18:00 Uhr
  • In diesem zweistündigen Webinar gibt Ihnen CMA Natalia Menzel einen Überblick über die Vorbereitungen auf die mündliche Prüfung.
Jetzt teilnehmen