ZU DEN KURSEN!

Deskriptive Statistik - Korrelationsanalyse

Kursangebot | Deskriptive Statistik | Korrelationsanalyse

Deskriptive Statistik

Korrelationsanalyse

Im vorliegenden Kapitel wird die Abhängigkeit zweier Merkmale untersucht. Die Vorgehensweise nennt man auch Korrelationsrechung (= Korrelationsanalyse). Das Skalenniveau ist hierbei äußerst wichtig, wir unterscheiden im Folgenden:

  • Kontingenzmaße für nominalskalierte Merkmale
    • φ- Koeffizient
    • Kontingenzkoeffizient nach Pearson
    • korrigierter Koeffizient nach Pearson
    • Kontingenzkoeffizient nach Cramér
  • Rangkorrelationsmaße für ordinalskalierte Daten
  • Korrelationskoeffizienten für metrische Skalen

Interpretation des Zusammenhanges

Grundsätzlich gilt, dass man zwei Dinge unterscheiden möchte, nämlich:

  • die Richtung und
  • die Stärke

des linearen Zusammenhanges zwischen zwei Merkmalen (was allerdings erst ab den Ordinalskalen möglich ist).

Beispiele zur Richtung des Zusammenhanges

Mit der „Richtung” des Zusammenhanges soll ausgedrückt werden, ob sich die beiden Merkmale

  • gleichgerichtet (positiver Korrelationskoeffizient) oder
  • entgegengerichtet (negativer Korrelationskoeffizient) bewegen.

Beispiel

Beispiel 50 - Negativer Korrelationskoeffizient:
Wenn z.B. der Preis eines Gutes steigt, bewegt sich i.A. (wenn man von preisunabhängigen- und Giffen-Gütern absieht) die nachgefragte Menge nach unten. Es liegt also ein entgegen gerichteter Zusammenhang vor, der Korrelationskoeffizient wäre negativ.

Beispiel

Beispiel 51 - Positiver Korrelationskoeffizient:
Wenn die Anzahl der BWL-Studenten der Universität Münster steigt, dann müssen die Assistenten der Professoren mehr Klausuren korrigieren als vorher. Der Zusammenhang zwischen der Anzahl der Studenten und der Korrekturzeit ist gleich gerichtet, der Korrelationskoeffizient entsprechend positiv.

Beispiele zur Stärke des Zusammenhanges

Bei der Stärke des Zusammenhanges ist die Fragestellung eine andere, nämlich ob die Veränderung des einen Merkmals eine deutliche Veränderung des anderen Merkmals bewirkt (bei einem starken Zusammenhang) oder nicht (bei einem schwachen Zusammenhang).

„Stark” bedeutet bei dem Korrelationskoeffizienten nach Spearman und Bravais-Pearson, dass die Werte nah bei + 1 oder -1 liegen, „schwach” hingegen ist der lineare Zusammenhang, wenn der jeweilige Korrelationskoeffizient nahe bei 0 liegt (auch zwischen -0,5 und +0,5 gilt der Zusammenhang noch als sehr schwach).
Zu beachten ist außerdem, dass wir hier nur einen statistischen, d.h. formalen Zusammenhang beschreiben bzw. erkennen können. Ob dieser auch kausal richtig ist, kann oft der Statistiker nicht sagen, sondern muss vom jeweiligen Fachmann (Mediziner, Ökonomen, Psychologen, etc.) untersucht werden.

Beispiel

Beispiel  52 - Statistischer Zusammenhang:
Eine altbekannte Frage: Fördert rauchen den Lungenkrebs? Der Statistiker kann (formal) untersuchen, ob die relative Häufigkeit, an Lungenkrebs zu erkranken, bei Rauchern höher ist als bei Nichtrauchern. Wenn die Antwort „Ja” lauten sollte, dann heißt dies noch lange nicht, dass der kausale Zusammenhang damit geklärt ist. Vielmehr müssen Mediziner diese Frage entscheiden. Es könnte nämlich z.B. sein, dass die Raucher eher durch andere Umwelteinflüsse an Lungenkrebs erkranken und deswegen die statistische Untersuchung verfälscht war.

Zwei weitere Probleme gibt es in diesem Zusammenhang, die eine Korrelation vortäuschen, obwohl sie aus anderen Gründen oder obwohl sie gar nicht besteht:

  • Scheinkorrelation,
  • Nonsenskorrelation.

Bei der Scheinkorrelation besteht ein Zusammenhang zwischen zwei Merkmalen nur deswegen, weil eine dritte Größe dahinter steht und beide beeinflusst.

Beispiel

Beispiel  53 - Scheinkorrelation:
Student Max erzielt in VWL eine 1,3 und in Recht eine 2,0.
Es existiert ein Zusammenhang zwischen den beiden guten Ergebnissen nur insofern, als dass eine dritte Größe, nämlich der Lernaufwand, dahinter steht.

Beispiel

Beispiel  54 - Scheinkorrelation:
Sonnenflecken und konjunkturelle Entwicklung in Westeuropa.
Als vor 200 Jahren die Gesellschaft noch sehr stark landwirtschaftlich geprägt war, sorgten Flecken auf der Sonne für schlechteres Wetter auf der Erde, dieses für Ernteausfälle und dieses wiederum für einen konjunkturellen Rückgang. Eine dritte Größe, nämlich das Wetter, sorgte also für diese Scheinkorrelation. Bei der Nonsenskorrelation hingegen lässt sich für einen (angeblichen) Zusammenhang gar keine kausale Begründung finden.

Beispiel

Beispiel 55 - Nonsenskorrelation:
In Upsala wurde die Anzahl der Störche und die Geburten über mehrere Jahre gezählt. Hierbei stellte man fest, dass in Monaten mit vielen Störchen auch viele Entbindungen stattfanden. Es wurde demnach „bewiesen”, dass der Klapperstorch die Kinder bringt.

Eine Aussage, die natürlich völlig falsch ist, schon der Aufwand, zu diesem Zweck die Daten zu erheben und einen Zusammenhang zu ermitteln war völlig sinn- und zwecklos. Bevor etwas miteinander korreliert wird, sollte überprüft werden, ob ein kausaler Zusammenhang überhaupt bestehen kann.