Inhaltsverzeichnis
Beispiel zur Varianzanalyse
Als Beispiel werden die Einkommensverteilungen in unterschiedlichen Gruppen A, B, und C betrachtet.
Die Einkommensverteilung der Gruppe A ist:
Gruppe | 1 | 2 | 3 | 4 | 5 |
Einkommen | 5000 | 5000 | 5000 | 5000 | 5000 |
Die Einkommensverteilung der Gruppe B lautet:
Gruppe | 1 | 2 | 3 | 4 | 5 |
Einkommen | 3000 | 4000 | 5000 | 6000 | 7000 |
und für die Gruppe C sind die Einkommen:
Gruppe | 1 | 2 | 3 | 4 | 5 |
Einkommen | 1000 | 2000 | 5000 | 8000 | 9000 |
Wie stark streuen die Einkommen in den einzelnen Gruppen?
Das Durchschnittseinkommen, hier als arithmetisches Mittel berechnet (wobei der Median das gleiche Ergebnis liefern würde), liegt in allen Gruppen bei 5.000 €. Man erkennt aber direkt, dass die Verteilung in Gruppe B ungleichmäßiger als in Gruppe A ist, denn dort ist das Einkommen gleichverteilt. Die sogenannte Streuung ist in B höher als in A. In Gruppe C streut das Einkommen sogar noch stärker als in B, die „Schere“ zwischen dem kleinsten und dem größten Einkommen ist noch größer.
Mittlere quadratische Abweichung (Varianz)
Die mittlere quadratische Abweichung $\ s^2 $ ist
$$\ s^2= {1 \over n} \sum_{i=1}^n (x_i- \overline x)^2 $$ bzw $$\ s^2= \sum_{j=1}^k (a_j- \overline x)^2 \cdot f(a_j) $$
bzw. $\ s^2={1 \over n} ( \sum_{i=1}^n x_i^2)- ( \overline x) ^2 $ (Steinerscher Verschiebungssatz), also das arithmetische Mittel der quadrierten Abstände aller Beobachtungswerte $\ x_i $ von $\ \overline x $. Man bildet die Differenzen der einzelnen $\ x_i $ speziell vom arithmetischen Mittel $\ \overline x $, da man weiß, dass die Summe $\ \sum_{i=1}^n (x_i- \lambda)^2 $ minimal wird, wenn man für $\ \lambda $ das arithmetische Mittel $\ \overline x $ einsetzt (sogenannte Optimalitätseigenschaft des arithmetischen Mittels).
Die zweite Formel für $\ s^2 $ , nämlich $\ \sum_{j=1}^n (a_j- \overline x)^2 \cdot j(a_j) $ gilt, wenn man die Häufigkeitsverteilung zugrunde legt.
Merke: Viele Autoren bevorzugen $\ s^2= {1 \over (n-1)} \sum_{i=1}^n (x_i- \overline x)^2 $ als mittlere quadratische Abweichung, d.h. mit dem Vorfaktor $\ {1 \over (n-1)} $ statt $\ {1 \over n} $. Dies hat Gründe, die wir erst in der Stichprobentheorie verstehen werden. In der deskriptiven Statistik rechnen wir deshalb ausschließlich mit dem Vorfaktor $\ {1 \over n} $ und mit der oben erwähnten Definition der mittleren quadratischen Abweichung.
Für die mittlere quadratische Abweichungen rechnet man
$$\ s_B^2={1 \over 5} \cdot [(3.000-5.000)^2+...+(7.000-5.000)^2] = 2.000.000 €^2 $$
Mit dem Verschiebungssatz kommt man auf das gleiche Ergebnis:
$$\ s_B^2= {1 \over 5} \cdot [(3.000)^2+(4.000)^2+...+(7.000)^2]-(5.000)^2=27.000.000-25.000.000 = 2.000.000 €^2 $$
Standardabweichung
Die Standardabweichung s berechnet man als Wurzel aus der mittleren quadratischen Abweichung, also
$$\ s= \sqrt {s^2} $$
Sie hat (im Gegensatz zur mittleren quadratischen Abweichung) die gleiche Dimension wie die Beobachtungswerte.
Die Standardabweichung ist also $\ s_B= \sqrt {2.000.000} = 2.236,07€ $.
Interpretation der Varianz
- Die Abweichungen als Maß dafür, wie schlecht die Schätzung des Mittelwertes ist, werden bei der mittleren quadratischen Abweichung $\ s^2 $ stark gewichtet, nämlich quadriert. Von Nachteil ist allerdings, dass die Dimension (hier $\ €^2 $) nicht mit der Dimension der Beobachtungswerte übereinstimmt. Dieser Nachteil wird durch die Standardabweichung aufgehoben $\ s $.
Weitere interessante Inhalte zum Thema
-
Einkommensänderungen und Preisänderungen
Vielleicht ist für Sie auch das Thema Einkommensänderungen und Preisänderungen (Theorie der Haushaltsnachfrage) aus unserem Online-Kurs Mikroökonomie interessant.