wiwiweb
online lernen

Besser lernen mit Online-Kursen

NEU! Jetzt online lernen:
Deskriptive Statistik
Den Kurs kaufen für:
einmalig 29,00 €
Zur Kasse
Zusammenhangsmaße > Zusammenhangsmaße auf Nominal- und Ordinalskala:

Zusammenhangsmaße auf der Nominalskala

WebinarTerminankündigung:
 Am 08.12.2016 (ab 18:00 Uhr) findet unser nächstes Webinar statt.
Gratis-Webinar Diskrete und stetige Verteilungen in der Wahrscheinlichkeitsrechnung
- In diesem 60-minütigen Gratis-Webinar gehen wir darauf ein, welche diskreten und stetigen Verteilungen Sie in der Prüfung beherrschen müssen.
[weitere Informationen] [Terminübersicht]

Im o.e. Beispiel 49 der Religionszugehörigkeit und dem Studienfach könnte man sich die Frage stellen, den Zusammenhang zu quantifizieren, d.h. die Stärke der Zugehörigkeit durch eine Zahl auszudrücken. Beide Merkmale sind nominalskaliert, da lediglich Unterschiede, nicht hingegen eine Reihenfolge feststellbar ist. Relevant ist also nicht der Bravais-Pearsonsche Korrelationskoeffizient (dieser erst bei den metrischen Skalen) oder der Spearmansche Rangkorrelationskoeffizient (dieser erst ab ordinalskalierten Daten).

Achtung: Wir rechnen im folgenden mit den absoluten Häufigkeiten $\ H_{ij} $, nicht mit den relativen $\ h_{ij} $!

Man berechnet zunächst die erwarteten Häufigkeiten $\ H_{ij}^e $, (oder, in Langform geschrieben, $\ H^e(xi, yj)$ die sich bei Unabhängigkeit ergeben („e” steht für „expected” = erwartet). Hierzu

  • addiert man zeilen- bzw. spaltenweise die Zahlen der Tabelle,
  • multipliziert die sich ergebenden Randhäufigkeiten und
  • dividiert durch den Stichprobenumfang n.

Man erhält für das Beispiel somit

  BWL Jura Medizin Anglistik $$\ \sum $$
katholisch 11,5 9,66 11,96 12,88 46
evangelisch 9,5 7,98 9,88 10,64 38
muslimisch 4 3,36 4,16 4,48 16
$\ \sum $ 25 21 26 28 100

Wenn also das Studienfach und die Zugehörigkeit zu einer Glaubensrichtung unabhängig voneinander wären, dann gäbe es z.B. $\ H_{31}^e=4 $muslimische BWLer bzw. $\ H_{23}^e =9,88 $evangelische Mediziner bzw. $\ H_{12}^e=9,66 $ katholische Juristen etc. Die beobachteten absoluten Häufigkeiten $\ H_{ij}^0 = H_ij $ und die erwarteten Häufigkeiten $\ H_{ij}^e $ werden dann zu einer Kennzahl $\ \chi^2 $(sprich: Chi-Quadrat) zusammengefasst.

Chi-Quadrat berechnen

$$\ \chi^2= \sum_{i=1}^k \sum_{j=1}^l {(H^0 (x_i,y_j)- H^e (x_i,y_j))^2 \over H^e (x_i,y_j)}= \sum_{i=1}^k \sum_{j=1}^l {(H_{ij}^0-H_{ij}^e)^2 \over H_{ij}^e } $$

$\ x_i $ steht für den Eintrag der i. Zeile, $\ y_j $ entsprechend für jenen der j. Spalte. So ist $\ h^o(x_2,y_3) = 18, h^o(x_3,y_4) = 1 $(s. Zahlen dieses Beispiels aus vorherigen Kapiteln), $\ h^e(x_2,y_1) = 9,5 $ usw. Das $\ H^o $ steht für beobachtete Häufigkeit (o wie observed),$\ H^e $ steht, wie oben bereits erwähnt, für die erwartete Häufigkeit (e wie expected). Die Doppelsumme heißt lediglich, dass über alle Felder aufsummiert wird, nämlich über alle Zeilen (erstes Summenzeichen) und alle Spalten (zweites Summenzeichen). Konkret stellt man am besten beobachtete (linke Zahl) und erwartete Häufigkeiten (rechte Zahl) zunächst zusammen dar und errechnet dann die Größe $\ \chi^2 $:

  BWL Jura Medizin Anglistik
katholisch 10 11,5 12 9,66 6 11,96 18 12,88
evangelisch 8 9,5 3 7,98 18 9,88 9 10,64
muslimisch 7 4 6 3,36 2 4,16 1 4,48

Damit ist
$$\ \chi^2={(10-11,5)^2 \over 11,5}+{(12-9,66)^2 \over 9,66}+...+{(1-4,48)^2 \over 4,48} $$ $$\ = 0,1957 + 0,5668 + ... + 2,7032 = 24,1878 $$
Es ist klar, dass $\ \chi^2 = 0 $ ist, wenn die beiden betrachteten Merkmale unabhängig sind, denn dann sind bereits die Zahlen innerhalb jeder Zelle gleich. Problematisch sind an der Kenngröße zwei Dinge:

  • die Zahl $\ \chi^2 $ ist nicht normiert, es gilt also nicht die wünschenswerte Eigenschaft $\ \chi^2 \leq 1 $
  • die Zahl $\ \chi^2 $ ist abhängig vom Stichprobenumfang n, d.h. bei anderem n, z.B. n = 200, aber gleichen relativen Häufigkeiten verändert sich $\ \chi^2 $, was für ein Zusammenhangsmaß wenig sinnvoll ist.

Messen des Zusammenhangs zweier nominalskalierter Merkmale

Man nimmt deshalb die Zahl $\ \chi^2 $ nicht als Maßzahl für den linearen Zusammenhang zwischen zwei nominalskalierten Merkmalen. Als Maßzahlen für den Zusammenhang zweier nominalskalierter Merkmale bieten sich vielmehr an:

  • der Phi-Koeffizient φ,
  • der Kontingenzkoeffizient nach Pearson $\ C_P $
  • der korrigierte Kontingenzkoeffizient $\ C_{korr} $
  • der Kontingenzkoeffizient nach Cramér $\ C_C $

Zur Berechnung der einzelnen Maßzahlen: Der Phi-Koeffizient ist definiert als $$\ \Phi = \sqrt { \chi^2 \over n} $$ und ist hier also $\ \Phi = \sqrt {24,1878 \over 100} =0,4918 $

$\ C_P $, der sogenannte Kontingenzkoeffizienten nach Pearson, ist $$\ C_P = \sqrt {\chi^2 \over \chi^2+n} $$
Im vorliegenden Beispiel 49 gilt $\ C_P= \sqrt { \chi^2 \over \chi^2+n}= \sqrt {24,1878 \over 24,1878+100} =0,4413 $.
Die Zahl $\ C_P $ nimmt nicht den Wert 1 an und ist damit nicht voll als Zusammenhangsmaß geeignet.

Dieser Schönheitsfehler wird geheilt durch
$$\ C_{korr} = C_P \sqrt {C^* \over C^*-1} = \sqrt {{\chi^2 \over \chi^2+n} \cdot {C^* \over (C^*-1}} $$ korrigierter Kontingenzkoeffizient.

Hierbei ist $\ C^* $ das Minimum aus der Anzahl der Zeilen k und der Anzahl der Spalten l, also $\ C^* $ = min {k; l}. Im o.e. Beispiel ist C = min {3; 4} = 3, also
$\ C_{korr} = \sqrt {{24,1878 \over 24,1878+100} \cdot {3 \over 3-1}}=0,5405 $
Der korrigierte Kontingenzkoeffizient $\ C_{korr} $ ist normiert, liegt also zwischen 0 und 1:$\ 0 \leq C_{korr} \leq 1 $
Wenn $\ C_{korr} = 1 $ ist, dann kann von einem Merkmal sicher auf die Ausprägung des anderen Merkmals geschlossen werden (jedenfalls in eine Richtung).
Wenn $\ C_{korr} = 0 $ ist, dann ergibt sich die relative Häufigkeit der gemeinsamen Verteilung als Produkt der relativen Randhäufigkeiten.

Darüber hinaus existiert
$\ C_C = \sqrt {\chi^2 \over {n \cdot [min(m,l)-1]}} $ Kontingenzkoeffizient nach Cramér.

Auch hier gilt $\ 0 \leq C_C \leq 1 $, der Cramérsche Koeffizient ist also normiert. Für das o.e. Beispiel 49 ist damit
$\ C_C= \sqrt {24,1878 \over {100 \cdot [min(4;3)-1]}}= \sqrt {24,1878 \over 200}=0,3478 $

Multiple-Choice
Welche der folgenden Aussagen zu Zusammenhangsmaßen auf der Nominalskala ist falsch?
0/0
Lösen

Hinweis:

Bitte kreuzen Sie die richtigen Aussagen an. Es können auch mehrere Aussagen richtig oder alle falsch sein. Nur wenn alle richtigen Aussagen angekreuzt und alle falschen Aussagen nicht angekreuzt wurden, ist die Aufgabe erfolgreich gelöst.

Bild von Autor Daniel Lambert

Autor: Daniel Lambert

Dieses Dokument Zusammenhangsmaße auf der Nominalskala ist Teil eines interaktiven Online-Kurses zum Thema Deskriptive Statistik.

Dipl.-Math. Dipl.-Kfm. Daniel Lambert gibt seit vielen Jahren Kurse zur Prüfungsvorbereitung. Er unterrichtet stets orientiert an alten Prüfungen und weiß aus langjähriger Erfahrung, wie sich komplexe Sachverhalte am besten aufbereiten und vermitteln lassen. Daniel Lambert ist Repetitor aus Leidenschaft seit nunmehr 20 Jahren.
Vorstellung des Online-Kurses Deskriptive StatistikDeskriptive Statistik
Dieser Inhalt ist Bestandteil des Online-Kurses

Deskriptive Statistik

wiwiweb - Interaktive Online-Kurse (wiwiweb.de)
Diese Themen werden im Kurs behandelt:

[Bitte auf Kapitelüberschriften klicken, um Unterthemen anzuzeigen]

  • Grundbegriffe der deskriptiven Statistik
    • Einleitung
      • Statistische Datenauswertung
      • Merkmal, Merkmalsausprägung und Merkmalsträger
    • Masse und Merkmal
      • Statistische Masse
      • Statistisches Merkmal
    • Skalierungen
      • Grundlagen Skalierung
      • Nominalskala
      • Ordinalskala
      • Metrische Skalen
      • Metrische Skalen - Intervallskala
      • Metrische Skalen - Verhältnisskala
      • Metrische Skalen - Absolutskala
      • Skalenniveau bestimmen
      • Aufgabe Skalierung
      • Lösung Aufgabe Skalierung
    • Skalentransformation
      • Grundlagen Skalentransformation
      • Skalentransformation auf der Nominalskala
      • Skalentransformation auf der Ordinalskala
      • Skalentransformation auf der Kardinalskala
    • Abzählbarkeit
      • Diskrete Merkmale
      • Stetige Merkmale
    • Quasistetige Merkmale und Klassierung
      • Gründe für quasistetige Merkmale
      • Quasistetige Merkmale
      • Klassierung
    • Selbstkontrollaufgabe zu den Grundbegriffen der deskriptiven Statistik
      • Aufgabe Merkmale
      • Lösung Aufgabe Merkmale
  • Häufigkeitsverteilungen
    • Unklassierte Daten und ihre Darstellung
      • Grundlagen der Häufigkeitsverteilung
      • Häufigkeiten
      • Absolute Häufigkeiten
      • Relative Häufigkeit
      • Graphische Darstellung
      • Stabdiagramm oder Säulendiagramm
      • Kreisdiagramm
    • Klassierte Daten und ihre Darstellung
      • Grundlagen Klassierung
      • Klassierung und ihre Darstellung
      • Histogramm
      • Aufgabe Histogramm
      • Lösung Aufgabe Histogramm
      • Häufigkeitspolygon
      • Regeln zur Klassenbildung in der Statistik
    • Empirische Verteilungsfunktion
      • Beispiel und Eigenschaften der Verteilungsfunktion
      • Beispielaufgabe empirische Verteilungsfunktion
    • Selbstkontrollaufgaben zu den Häufigkeitsverteilungen
      • Aufgabe Urliste und Median
      • Lösung Aufgabe Urliste und Median
  • Verteilungsmaße
    • Lagemaße
      • Modus
      • Fraktile
      • Median
      • Boxplot
      • Arithmetisches Mittel
      • Geometrisches Mittel
      • Harmonisches Mittel
      • Zusammenfassung Lagemaße
    • Streuungsmaße
      • Unterschiedliche Streuungsmaße
      • Streuungszerlegung
      • Mittlere quadratische Abweichung berechnen
    • Formmaße
      • Unterschiedliche Formmaße
      • Schiefe
      • Wölbung
  • Konzentrationsmessung
    • Einleitung
      • Konzentrationsmaße
    • Relative Konzentration
      • Übersicht relative Konzentration
      • Lorenzkurve
      • Gini-Koeffizient
      • Länge der Lorenzkurve
      • Concentration-Ratio
    • Absolute Konzentration
      • Übersicht absolute Konzentration
      • Absolute Konzentrationskurve
      • Herfindahl-Index
      • Exponentialindex
      • Rosenbluth-Index
  • Mehrdimensionale Verteilungen
    • Mehrdimensionale Verteilung - Einführung
    • Gemeinsame Verteilung
    • Randverteilungen
    • Bedingte Verteilungen
    • Unabhängigkeit
    • Beispiel mehrdimensionale Verteilung
  • Zusammenhangsmaße
    • Zusammenhangsmaße auf Nominal- und Ordinalskala
      • Korrelationsanalyse
      • Zusammenhangsmaße auf der Nominalskala
      • Zusammenhangsmaße auf der Ordinalskala
    • Zusammenhangsmaße auf metrischen Skalen
      • Übersicht Zusammenhangsmaße auf metrischen Skalen
      • Bravais-Pearsonscher Korrelationskoeffizient
      • Korrelationskoeffizient von Fechner
  • Zeitreihenanalyse
    • Einleitung
      • Längsschnittdaten und Querschnittdaten
    • Zeitreihenverfahren
      • Verfahren der Zeitreihenanalyse
      • Methode der gleitenden Durchschnitte
      • Exponentielle Glättung
      • Beispiel Methode der Kleinsten Quadrate
      • Methode der Kleinsten Quadrate
      • Exkurs: Linearisierung
      • Methode der Reihenhälften
    • Zeitreihenzerlegung
      • Zeitreihenzerlegung
  • Indexrechnung
    • Grundbegriffe
      • Verhältniszahlen
    • Preisindizes
      • Definition Preisindizes
      • Preisindizes nach Laspeyres und Paasche
      • Indexrechnung mit Preisindizes
    • Mengenindizes
      • Definition Mengenindizes
      • Mengenindizes nach Laspeyres und Paasche
    • Wertindizes
      • Der Wertindex
    • Weitere Indizes
      • Übersicht weitere Indizes
      • Index nach Lowe
      • Fisherscher Idealindex
      • Marshall-Edgeworth-Preisindex
    • Umbasierung und Verkettung von Indizes
      • Die Rundprobe
      • Umbasierung
      • Verkettung
  • 103
  • 27
  • 181
  • 37
einmalig 29,00
umsatzsteuerbefreit gem. § 4 Nr. 21 a bb) UStG
Online-Kurs Top AngebotTrusted Shop

Unsere Nutzer sagen:

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 22.07.2015:
    "gut aufgebaut, gut verständlich"

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 18.10.2014:
    "Man super. Mein Professor hat mich total mit seinen Ausführungen verwirrt, wo doch die Antwort so einfach ist. Vielen Dank Herr Lambert. Ich finde sowieso, dass Sie der Beste sind :o)"

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 01.09.2014:
    "sehr gut erklärt, schnell verständlich. Gute Beispiele!"

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 06.07.2014:
    "Locker flockig an anschaulichen Beispielen ausführlich erklärt."

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 14.06.2014:
    "Perfekt erklärt, danke!!!"

NEU! Sichere dir jetzt die perfekte Prüfungsvorbereitung und spare 10% bei deiner Kursbuchung!

10% Coupon: lernen10

Zu den Online-Kursen