ZU DEN KURSEN!

SPSS Statistik-Software - Varianzanalyse in SPSS

Kursangebot | SPSS Statistik-Software | Varianzanalyse in SPSS

SPSS Statistik-Software

Varianzanalyse in SPSS

Inhaltsverzeichnis

 Die Varianzanalyse hat die Aufgabe, den Einfluss von qualitativen Variablen (Faktoren) auf beobachtbare Merkmale zu identifizieren. Im Modell der einfaktoriellen Varianzanalyse wird geprüft, wie groß der Einfluss eines Faktors auf die Merkmale ist.

Wollen wir vergleichen, ob die Mittelwerte von zwei Variablen gleich sind, können wir das über einen t-Test machen, den wir schon in einem früheren Kapitel kennengelernt haben. Wollen wir jetzt aber mehrere Gruppen eines Merkmals überprüfen, müssten wir wesentlich mehr Tests durchführen. Das alleine wäre ja noch kein Problem, da die Tests vom Computer durchgeführt werden können, problematisch ist aber, dass man bei jedem Test separate Alpha- und Betafehler errechnet. Daher ist die Fehlerwahrscheinlichkeit wesentlich höher!

Für die Analyse der Varianz (engl.: Analysis of Variance , kurz ANOVA ) gibt es eine klassische Tafel, an der man die Varianz und andere relevante Werte ablesen kann.

So sieht die Anova Tafel dann aus:

ANOVA

 

 

Quadratsumme

df

Mittel der Quadrate

F

Sig.

Zwischen Gruppen  (SQE)

 

 

 

 

 

Innerhalb der Gruppen (SQR)

 

 

 

 

 

Gesamtsumme (SQT)

 

 

 

 

 

Folgende Fragestellungen könnte man z.B. mit einer Varianzanalyse beantworten:

  • Hat die Art der Schule einen Einfluss auf die Note im Abitur?
  • Hat die Größe eines Baumarkts einen Einfluss auf den Umsatz?

In SPSS führt man die Varianzanalyse wie folgt durch:

Analysieren  - Mittelwerte vergleichen - Einfaktorielle Varianzanalyse

Einfaktorielle Varianzanalyse
Einfaktorielle Varianzanalyse

Unter „Post hoc“ wählen wir den „Turkey Test“  (für angenommene Varianzgleichheit) und den „Games-Howell-Test“ (wenn die Varianzgleichheit nicht angenommen wird) aus.  Darüber hinaus lassen wir uns unter „Optionen“ noch den „Test auf Homogenität der Varianzen“ ausgeben.

Der Output sieht dann wie folgt aus:

Varianzhomogenitätstest

Preisklassen des hauptsächlich genutzten Autos 

Levene-Statistik

df1

df2

Sig.

6949,593

3

6396

,000

Zunächst betrachten wir den Test auf Varianzhomogenität nach Levene. Da wir hier einen Alphafehler von kleiner 5% (hier sogar kleiner 0,1%) vorliegt, müssen wir die Hypothese der Varianzgleichheit ablehnen und gehen von Varianzinhomogenität aus. Das wird später noch relevant werden.

ANOVA

Preisklassen des hauptsächlich genutzten Autos 

 

Quadratsumme

df

Mittel der Quadrate

F

Sig.

Zwischen Gruppen

3333,670

3

1111,223

9343,635

,000

Innerhalb der Gruppen

760,666

6396

,119

 

 

Gesamtsumme

4094,336

6399

 

 

 

 

Anhand der Anova-Tafel können wir sehen, dass ein Zusammenhang bei einem Alphafehler von weniger als 0,1% statistisch bewiesen ist. Der F-Wert spielt für uns hier keine große Rolle, wenn man aber von Hand rechnet dient dieser Wert zum Testen.

Ausgabe
Ausgabe

Wir haben bereits festgestellt, dass keine Varianzgleichheit angenommen werden kann, weshalb auch der Games-Howell-Test für uns hier der relevante ist. Wir können aufgrund der niedrigen Alphafehler sehen, dass definitiv ein Zusammenhang besteht und dass die Konfidenzintervalle für die entsprechenden Werte relativ klein sind.

Der restliche Output ist für uns nicht von Interesse.

 Bestimmtheitsmaß

Die Varianzanalyse ist ein Thema, welches wir hier leider nicht vollständig erklären können; einen wichtigen Aspekt wollen wir Ihnen aber noch nahebringen: das Bestimmtheitsmaß.

Das Bestimmtheitsmaß R², welches in der Literatur auch unter dem Begriff "Determinationskoeffizient" zu finden ist, gibt an, wie viel Varianz durch die vorliegenden Variablen erklärt werden können. Durch folgende Relation ist das Bestimmtheitsmaß definiert:

 $$R^2=\frac{SQE}{SQT}=\frac{Erklärte Varianz}{Totale Varianz}$$

Die Berechnungsvorschriften für die erklärte Varianz und die totale Varianz lauten:
$$SQE=\sum (\bar{Y}_{i+}-\bar{Y}_{++})^2$$
$$SQT=\sum (Y_{ij}-\bar{Y}_{++})^2$$


Darüber hinaus gibt es logischerweise noch die residuale Varianz SQR, für die gilt:

 $$SQR=\sum (Y_{ij}-\bar{Y}_{i+})^2$$

Darüber hinaus gilt natürlich auch noch die Beziehung.

$$SQT=SQE+SQT$$

Video: Varianzanalyse in SPSS