ZU DEN KURSEN!

Deskriptive Statistik - Korrelationsanalyse

Kursangebot | Deskriptive Statistik | Korrelationsanalyse

Deskriptive Statistik

Korrelationsanalyse

wiwiweb JETZT WEITER LERNEN!

Weitere Lernvideos sowie zahlreiche Materialien erwarten dich:
Komplettpaket für wiwi-Studenten


1682 Lerntexte mit den besten Erklärungen

374 weitere Lernvideos von unseren erfahrenen Dozenten

3837 Übungen zum Trainieren der Inhalte

2220 informative und einprägsame Abbildungen

In diesem Kapitel wollen wir die Abhängigkeit zweier Merkmale analysieren, sie wir aus Korrelationsrechnung bzw. Korrelationsanalyse genannt. Dabei ist es entscheidend welches Skalenniveau vorliegt, die wie folgt unterscheiden werden:

  • Kontingenzmaße für nominalskalierte Merkmale
    • φ- Koeffizient
    • Kontingenzkoeffizient nach Pearson
    • korrigierter Koeffizient nach Pearson
    • Kontingenzkoeffizient nach Cramér

  • Rangkorrelationsmaße für ordinalskalierte Daten
  • Korrelationskoeffizienten für metrische Skalen

 

Interpretation des Zusammenhanges

Im Allgemeinen sollen zwei Dinge unterschieden werden, zum einen die Richtung und zum anderen die Stärke des linearen Zusammenhanges zwischen zwei Merkmalen (was jedoch erst ab den Ordinalskalen möglich ist).

Die Richtung eines Zusammenhanges

Mit der „Richtung” des Zusammenhanges soll ausgedrückt werden, ob sich die beiden Merkmale gleichgerichtet (positiver Korrelationskoeffizient) oder entgegengerichtet (negativer Korrelationskoeffizient) bewegen.

-

Hier klicken zum Ausklappen

Beispiel 50: Negativer Korrelationskoeffizient

Betrachtet man den Stand einer Tankfüllung Benzin im Auto, sinkt dieser, wobei die zurückgelegte Strecke größer wird. Es handelt sich um einen Zusammenhang, der entgegen gerichtet ist, somit wäre der Korrelationskoeffizient negativ.

-

Hier klicken zum Ausklappen

Beispiel 51: Positiver Korrelationskoeffizient

Je häufiger man mit dem Auto fährt, desto öfter muss man mit dem Auto auch tanken fahren. Der Zusammenhang zwischen der Anzahl der Autofahrten und den Tankfüllungen ist gleichgerichtet, was einen positiven Korrelationskoeffizienten bedeutet würde.

Die Stärke eines Zusammenhanges

Mit der Stärke eines Zusammenhanges stellt sich die Frage, wie groß die Veränderung des einen Merkmals ist, wenn das andere Merkmal sich verändert.

  • Bei einem starken Zusammenhang führt die Änderung des einen auch zu einer großen Veränderung bei dem anderen.
  • Bei einem schwachen Zusammenhang führt die Änderung des keiner oder nur einer kleinen Veränderung des anderen.

In Zahlen bedeutet „stark” im Bezug auf den Korrelationskoeffizienten nach Spearman und Bravais-Pearson einen Wert um +1 oder -1, wohingegen ein „schwacher” linearer Zusammenhang besteht, wenn der Wert um 0 liegt (zwischen -0,5 und +0,5 gilt dieser immer noch als sehr schwach).
Es sei an dieser Stelle jedoch darauf hingewiesen, dass es sich dabei um einen rein statistisch formalen Zusammenhang handelt. Dieser muss nicht zwangsläufig auch kausal stimmen, dies kann ein Statistiker oft nicht beurteilen, sondern das muss dann der entsprechende Experte untersuchen.

-

Hier klicken zum Ausklappen

Beispiel 52:  Statistischer Zusammenhang

Stellen wir uns bspw. die Frage: Führt täglicher Alkoholkonsum zu Leberschäden? Ein Statistiker kann diese Fragestellung formal analysieren und schauen, ob die relative Häufigkeit an Leberschäden bei täglichem Alkoholkonsum größer ist als bei Menschen, die keinen oder weniger Alkohol trinken. Wird dies mit JA beantwortet, bedeutet das allerdings noch lange nicht, dass dann auch Kausalität in dieser Frage vorliegt. Es könnte ja auch durchaus sein, dass Menschen, die viel Alkohol trinken, eher anderen Einflüssen unterliegen, die dann ihrerseits zu einer Häufung an Lebererkrankungen führen. Diese Frage muss von einem medizinischen Experten beurteilt werden.

An dieser Stelle treten nun noch zwei weitere Probleme auf, die zu einer vorgetäuschten Korrelation führen, auch wenn dies aus anderen oder garkeinen Gründen besteht. Nämlich einmal die Scheinkorrelation und zum anderen die Nonsenskorrelation.

Unter einer Scheinkorrelation versteht man eine statistisch vorhandene Korrelation zwischen zwei Variablen, deren Zusammenhang jedoch nicht auf ein Ursache-Wirkungsprinzip zurückzuführen ist. Anderes formuliert: Eine Scheinkorrelation existiert dann, wenn ein Zusammenhang zwischen zwei Merkmalen nur durch eine weitere dahinterstehende Größe besteht, die beide beeinflusst.

-

Hier klicken zum Ausklappen

Beispiel 53 - Scheinkorrelation:

Die Anzahl der Krankenhausbesuche steigt mit dem Einkommen. Diese Aussage scheint vielleicht zunächst plausibel. Allerdings beeinflusst das Einkommen in keinem Fall die Anzahl der Krankenhausbesuche. Vielmehr steht dort ein anderer Faktor dahinter, nämlich das Alter der Personen. Im Schnitt verdienen ältere Menschen mehr Geld als jüngere, gleichzeitig sind ältere Menschen jedoch auch kränker bzw. junge Menschen gesünder.

-

Hier klicken zum Ausklappen

Beispiel 54 - Scheinkorrelation:

Es besteht eine Scheinkorrelation zwischen der Schuhgröße und dem Einkommen. Hier ist vielleicht noch eindeutiger, dass das Prinzip der Ursache und Wirkung noch weniger zu erkennen ist. Der dritte Parameter, der nämlich eigentlich dahinter steht ist das biologische Geschlecht. Auf dem aktuellen Arbeitsmarkt verdienen Männer statistisch gesehen mehr und haben auch im Mittel größere Füße als Frauen.

-

Hier klicken zum Ausklappen

Beispiel 55 - Nonsenskorrelation:

In den USA korreliert die Investitionen in Wissenschaften mit der Selbstmordrate druch Erhängen. Auch wenn dies viele mit einem Augenzwinkern nachvollziehen könnten, macht es deutlich, wie unsinnig manche rein statistische Korrelationen sind, die jedoch keinen ursächlichen Zusammenhang haben.

Dieses und weiter zum Teil lustige Beispiele lassen sich hier finden. Dort hat ein findiger Mathematiker aus den USA rein statistische Zusammenhänge zusammengetragen.

Beispiel 55 ist selbstverständlich total absurd und die Anstrengung dafür Daten zu ermitteln und diese zu analysieren wäre absolut sinnbefreit und zwecklos. Daraus sollte man lernen, dass vor einer statistischen Datenerhebung im Vorhinein geprüft werden sollte, ob ein kausaler Zusammenhang überhaupt möglich ist.

Zum anderen lernt man, wie wichtig es ist bei vermeintlichen Zusammenhängen nach Ursache und Wirkung zu fragen.