Die Varianzanalyse hat die Aufgabe, den Einfluss von qualitativen Variablen (Faktoren) auf beobachtbare Merkmale zu identifizieren. Im Modell der einfaktoriellen Varianzanalyse wird geprüft, wie groß der Einfluss eines Faktors auf die Merkmale ist.
Wollen wir vergleichen, ob die Mittelwerte von zwei Variablen gleich sind, können wir das über einen t-Test machen, den wir schon in einem früheren Kapitel kennengelernt haben. Wollen wir jetzt aber mehrere Gruppen eines Merkmals überprüfen, müssten wir wesentlich mehr Tests durchführen. Das alleine wäre ja noch kein Problem, da die Tests vom Computer durchgeführt werden können, problematisch ist aber, dass man bei jedem Test separate Alpha- und Betafehler errechnet. Daher ist die Fehlerwahrscheinlichkeit wesentlich höher!
Für die Analyse der Varianz (engl.: Analysis of Variance , kurz ANOVA ) gibt es eine klassische Tafel, an der man die Varianz und andere relevante Werte ablesen kann.
So sieht die Anova Tafel dann aus:
ANOVA | |||||
| |||||
| Quadratsumme | df | Mittel der Quadrate | F | Sig. |
Zwischen Gruppen (SQE) |
|
|
|
|
|
Innerhalb der Gruppen (SQR) |
|
|
|
|
|
Gesamtsumme (SQT) |
|
|
|
|
|
Folgende Fragestellungen könnte man z.B. mit einer Varianzanalyse beantworten:
- Hat die Art der Schule einen Einfluss auf die Note im Abitur?
- Hat die Größe eines Baumarkts einen Einfluss auf den Umsatz?
In SPSS führt man die Varianzanalyse wie folgt durch:
Analysieren - Mittelwerte vergleichen - Einfaktorielle Varianzanalyse
Unter „Post hoc“ wählen wir den „Turkey Test“ (für angenommene Varianzgleichheit) und den „Games-Howell-Test“ (wenn die Varianzgleichheit nicht angenommen wird) aus. Darüber hinaus lassen wir uns unter „Optionen“ noch den „Test auf Homogenität der Varianzen“ ausgeben.
Der Output sieht dann wie folgt aus:
Varianzhomogenitätstest | |||
Preisklassen des hauptsächlich genutzten Autos | |||
Levene-Statistik | df1 | df2 | Sig. |
6949,593 | 3 | 6396 | ,000 |
Zunächst betrachten wir den Test auf Varianzhomogenität nach Levene. Da wir hier einen Alphafehler von kleiner 5% (hier sogar kleiner 0,1%) vorliegt, müssen wir die Hypothese der Varianzgleichheit ablehnen und gehen von Varianzinhomogenität aus. Das wird später noch relevant werden.
ANOVA | |||||
Preisklassen des hauptsächlich genutzten Autos | |||||
| Quadratsumme | df | Mittel der Quadrate | F | Sig. |
Zwischen Gruppen | 3333,670 | 3 | 1111,223 | 9343,635 | ,000 |
Innerhalb der Gruppen | 760,666 | 6396 | ,119 |
|
|
Gesamtsumme | 4094,336 | 6399 |
|
|
|
Anhand der Anova-Tafel können wir sehen, dass ein Zusammenhang bei einem Alphafehler von weniger als 0,1% statistisch bewiesen ist. Der F-Wert spielt für uns hier keine große Rolle, wenn man aber von Hand rechnet dient dieser Wert zum Testen.
Wir haben bereits festgestellt, dass keine Varianzgleichheit angenommen werden kann, weshalb auch der Games-Howell-Test für uns hier der relevante ist. Wir können aufgrund der niedrigen Alphafehler sehen, dass definitiv ein Zusammenhang besteht und dass die Konfidenzintervalle für die entsprechenden Werte relativ klein sind.
Der restliche Output ist für uns nicht von Interesse.
Bestimmtheitsmaß
Die Varianzanalyse ist ein Thema, welches wir hier leider nicht vollständig erklären können; einen wichtigen Aspekt wollen wir Ihnen aber noch nahebringen: das Bestimmtheitsmaß.
Das Bestimmtheitsmaß R², welches in der Literatur auch unter dem Begriff "Determinationskoeffizient" zu finden ist, gibt an, wie viel Varianz durch die vorliegenden Variablen erklärt werden können. Durch folgende Relation ist das Bestimmtheitsmaß definiert:
$$R^2=\frac{SQE}{SQT}=\frac{Erklärte Varianz}{Totale Varianz}$$
Die Berechnungsvorschriften für die erklärte Varianz und die totale Varianz lauten:
$$SQE=\sum (\bar{Y}_{i+}-\bar{Y}_{++})^2$$
$$SQT=\sum (Y_{ij}-\bar{Y}_{++})^2$$
Darüber hinaus gibt es logischerweise noch die residuale Varianz SQR, für die gilt:
$$SQR=\sum (Y_{ij}-\bar{Y}_{i+})^2$$
Darüber hinaus gilt natürlich auch noch die Beziehung.
$$SQT=SQE+SQT$$
Weitere interessante Inhalte zum Thema
-
Funktionen mit zwei Variablen
Vielleicht ist für Sie auch das Thema Funktionen mit zwei Variablen (Grundlagen und Begriffe der Mikroökonomie) aus unserem Online-Kurs Mikroökonomie interessant.