Jetzt neu: Steuerrecht online lernen auf steuerkurse.de!
ZU DEN KURSEN!

SPSS Statistik-Software - Mathematische Grundlagen

Kursangebot | SPSS Statistik-Software | Mathematische Grundlagen

SPSS Statistik-Software

Mathematische Grundlagen

Inhaltsverzeichnis

Beispiel zur Varianzanalyse

Als Beispiel werden die Einkommensverteilungen in unterschiedlichen Gruppen A, B, und C betrachtet.

Die Einkommensverteilung der Gruppe A ist:

Gruppe

1

2

3

4

5

Einkommen

5000

5000

5000

5000

5000

Die Einkommensverteilung der Gruppe B lautet:

Gruppe

1

2

3

4

5

Einkommen

3000

4000

5000

6000

7000

und für die Gruppe C sind die Einkommen:

Gruppe

1

2

3

4

5

Einkommen

1000

2000

5000

8000

9000

Wie stark streuen die Einkommen in den einzelnen Gruppen?

Das Durchschnittseinkommen, hier als arithmetisches Mittel berechnet (wobei der Median das gleiche Ergebnis liefern würde), liegt in allen Gruppen bei 5.000 €. Man erkennt aber direkt, dass die Verteilung in Gruppe B ungleichmäßiger als in Gruppe A ist, denn dort ist das Einkommen gleichverteilt. Die sogenannte Streuung ist in B höher als in A. In Gruppe C streut das Einkommen sogar noch stärker als in B, die „Schere“ zwischen dem kleinsten und dem größten Einkommen ist noch größer.

Mittlere quadratische Abweichung (Varianz)

Die mittlere quadratische Abweichung $\ s^2 $ ist
$$\ s^2= {1 \over n} \sum_{i=1}^n (x_i- \overline x)^2 $$ bzw $$\ s^2= \sum_{j=1}^k (a_j- \overline x)^2 \cdot f(a_j) $$

bzw. $\ s^2={1 \over n} ( \sum_{i=1}^n x_i^2)- ( \overline x) ^2 $ (Steinerscher Verschiebungssatz), also das arithmetische Mittel der quadrierten Abstände aller Beobachtungswerte $\ x_i $ von $\ \overline x $. Man bildet die Differenzen der einzelnen $\ x_i $ speziell vom arithmetischen Mittel $\ \overline x $, da man weiß, dass die Summe $\ \sum_{i=1}^n (x_i- \lambda)^2 $ minimal wird, wenn man für $\ \lambda $ das arithmetische Mittel $\ \overline x $ einsetzt (sogenannte Optimalitätseigenschaft des arithmetischen Mittels).
Die zweite Formel für $\ s^2 $ , nämlich $\ \sum_{j=1}^n (a_j- \overline x)^2 \cdot j(a_j) $ gilt, wenn man die Häufigkeitsverteilung zugrunde legt.

Merke: Viele Autoren bevorzugen $\ s^2= {1 \over (n-1)} \sum_{i=1}^n (x_i- \overline x)^2 $ als mittlere quadratische Abweichung, d.h. mit dem Vorfaktor $\ {1 \over (n-1)} $ statt $\ {1 \over n} $. Dies hat Gründe, die wir erst in der Stichprobentheorie verstehen werden. In der deskriptiven Statistik rechnen wir deshalb ausschließlich mit dem Vorfaktor $\ {1 \over n} $ und mit der oben erwähnten Definition der mittleren quadratischen Abweichung.

Für die mittlere quadratische Abweichungen rechnet man
$$\ s_B^2={1 \over 5} \cdot [(3.000-5.000)^2+...+(7.000-5.000)^2] = 2.000.000 €^2 $$
Mit dem Verschiebungssatz kommt man auf das gleiche Ergebnis:
$$\ s_B^2= {1 \over 5} \cdot [(3.000)^2+(4.000)^2+...+(7.000)^2]-(5.000)^2=27.000.000-25.000.000 = 2.000.000 €^2 $$

Standardabweichung

Die Standardabweichung s berechnet man als Wurzel aus der mittleren quadratischen Abweichung, also
$$\ s= \sqrt {s^2} $$
Sie hat (im Gegensatz zur mittleren quadratischen Abweichung) die gleiche Dimension wie die Beobachtungswerte.
Die Standardabweichung ist also $\ s_B= \sqrt {2.000.000} = 2.236,07€ $.

Interpretation der Varianz

  • Die Abweichungen als Maß dafür, wie schlecht die Schätzung des Mittelwertes ist, werden bei der mittleren quadratischen Abweichung $\ s^2 $ stark gewichtet, nämlich quadriert. Von Nachteil ist allerdings, dass die Dimension (hier $\ €^2 $) nicht mit der Dimension der Beobachtungswerte übereinstimmt. Dieser Nachteil wird durch die Standardabweichung aufgehoben $\ s $.