Inhaltsverzeichnis
Im vorliegenden Kapitel wird die Abhängigkeit zweier Merkmale untersucht. Die Vorgehensweise nennt man auch Korrelationsrechnung (= Korrelationsanalyse). Das Skalenniveau ist hierbei äußerst wichtig, wir unterscheiden:
- Kontingenzmaße für nominalskalierte Merkmale
- φ- Koeffizient
- Kontingenzkoeffizient nach Pearson
- korrigierter Koeffizient nach Pearson
- Kontingenzkoeffizient nach Cramér
- Rangkorrelationsmaße für ordinalskalierte Daten
- Korrelationskoeffizienten für metrische Skalen
- Korrelationskoeffizient von Fechner
- Korrelationskoeffizient von Bravais und Pearson
Interpretation des Zusammenhanges
Grundsätzlich gilt, dass man zwei Dinge unterscheiden möchte, nämlich:
- die Richtung und
- die Stärke
des linearen Zusammenhanges zwischen zwei Merkmalen (was allerdings erst ab den Ordinalskalen möglich ist).
Beispiele zur Richtung des Zusammenhanges
Mit der „Richtung” des Zusammenhanges soll ausgedrückt werden, ob sich die beiden Merkmale
- gleichgerichtet (positiver Korrelationskoeffizient) oder
- entgegengerichtet (negativer Korrelationskoeffizient) bewegen.
Beispiel
Beispiel 1 - Negativer Korrelationskoeffizient:
Wenn z.B. der Preis eines Gutes steigt, bewegt sich i.A. (wenn man von preisunabhängigen- und Giffen-Gütern absieht) die nachgefragte Menge nach unten. Es liegt also ein entgegen gerichteter Zusammenhang vor, der Korrelationskoeffizient wäre negativ.
Beispiel
Beispiel 2 - Positiver Korrelationskoeffizient:
Wenn die Anzahl der BWL-Studenten der Universität Münster steigt, dann müssen die Assistenten der Professoren mehr Klausuren korrigieren als vorher. Der Zusammenhang zwischen der Anzahl der Studenten und der Korrekturzeit ist gleich gerichtet, der Korrelationskoeffizient entsprechend positiv.
Beispiele zur Stärke des Zusammenhanges
Bei der Stärke des Zusammenhanges ist die Fragestellung eine andere, nämlich ob die Veränderung des einen Merkmals eine deutliche Veränderung des anderen Merkmals bewirkt (bei einem starken Zusammenhang) oder nicht (bei einem schwachen Zusammenhang).
„Stark” bedeutet bei dem Korrelationskoeffizienten nach Spearman und Bravais-Pearson, dass die Werte nah bei + 1 oder -1 liegen, „schwach” hingegen ist der lineare Zusammenhang, wenn der jeweilige Korrelationskoeffizient nahe bei 0 liegt (auch zwischen -0,5 und +0,5 gilt der Zusammenhang noch als sehr schwach).
Zu beachten ist außerdem, dass wir hier nur einen statistischen, d.h. formalen Zusammenhang beschreiben bzw. erkennen können. Ob dieser auch kausal richtig ist, kann oft der Statistiker nicht sagen, sondern muss vom jeweiligen Fachmann (Mediziner, Ökonomen, Psychologen, etc.) untersucht werden.
Beispiel
Beispiel 3 - Statistischer Zusammenhang:
Eine altbekannte Frage: Fördert rauchen den Lungenkrebs? Der Statistiker kann (formal) untersuchen, ob die relative Häufigkeit, an Lungenkrebs zu erkranken, bei Rauchern höher ist als bei Nichtrauchern. Wenn die Antwort „Ja” lauten sollte, dann heißt dies noch lange nicht, dass der kausale Zusammenhang damit geklärt ist. Vielmehr müssen Mediziner diese Frage entscheiden. Es könnte nämlich z.B. sein, dass die Raucher eher durch andere Umwelteinflüsse an Lungenkrebs erkranken und deswegen die statistische Untersuchung verfälscht war.
Zwei weitere Probleme gibt es in diesem Zusammenhang, die eine Korrelation vortäuschen, obwohl sie aus anderen Gründen oder obwohl sie gar nicht besteht:
- Scheinkorrelation,
- Nonsenskorrelation.
Bei der Scheinkorrelation besteht ein Zusammenhang zwischen zwei Merkmalen nur deswegen, weil eine dritte Größe dahinter steht und beide beeinflusst.
Beispiel
Beispiel 4 - Scheinkorrelation:
Student Max erzielt in VWL eine 1,3 und in Recht eine 2,0.
Es existiert ein Zusammenhang zwischen den beiden guten Ergebnissen nur insofern, als dass eine dritte Größe, nämlich der Lernaufwand, dahinter steht.
Beispiel
Beispiel 5 - Scheinkorrelation:
Sonnenflecken und konjunkturelle Entwicklung in Westeuropa.
Als vor 200 Jahren die Gesellschaft noch sehr stark landwirtschaftlich geprägt war, sorgten Flecken auf der Sonne für schlechteres Wetter auf der Erde, dieses für Ernteausfälle und dieses wiederum für einen konjunkturellen Rückgang. Eine dritte Größe, nämlich das Wetter, sorgte also für diese Scheinkorrelation. Bei der Nonsenskorrelation hingegen lässt sich für einen (angeblichen) Zusammenhang gar keine kausale Begründung finden.
Beispiel
Beispiel 6 - Nonsenskorrelation:
In Upsala wurde die Anzahl der Störche und die Geburten über mehrere Jahre gezählt. Hierbei stellte man fest, dass in Monaten mit vielen Störchen auch viele Entbindungen stattfanden. Es wurde demnach „bewiesen”, dass der Klapperstorch die Kinder bringt. (Solche Statistiken wurden in der Realität wirklich erhoben)
Eine Aussage, die natürlich völlig falsch ist! Bevor man etwas auf Korrelations testet, sollte überprüft werden, ob überhaupt ein möglicher kausaler Zusammenhang überhaupt bestehen kann.
Weitere interessante Inhalte zum Thema
-
Korrelationsanalyse
Vielleicht ist für Sie auch das Thema Korrelationsanalyse (Zusammenhangsmaße) aus unserem Online-Kurs Deskriptive Statistik interessant.