Inhaltsverzeichnis
Wenn man lediglich einen Lageparameter einer Verteilung angibt, so ist hiermit noch keine Aussage darüber gemacht, ob die anderen Werte „nahe dran” oder „weit weg” liegen. Dafür gibt es in der deskriptiven Statistik unterschiedliche Streuungsmaße.
Beispiel
Beispiel 42:
Die Einkommensverteilung drei verschiedener Gruppen 1, 2, und 3 werden betrachtet:
Die Einkommensverteilung der Gruppe 1 ist:
Person | A | B | C | D | E |
Einkommen | 3.000 | 3.000 | 3.000 | 3.000 | 3.000 |
Die Einkommensverteilung der Gruppe 2 ist:
Person | A | B | C | D | E |
Einkommen | 2.000 | 2.500 | 3.000 | 3.500 | 4.000 |
Die Einkommensverteilung der Gruppe 3 ist:
Person | A | B | C | D | E |
Einkommen | 500 | 1.500 | 3.000 | 4.500 | 5.500 |
Wie stark streuen die Einkommen in den einzelnen Gruppen?
Das durchschnittliche Einkommen, also das arithmetische Mittel aller Gruppen, liegt bei 3.000€. Der Median würde in diesem Fall sogar dasselbe Ergebnis liefern. Sofort ist zu erkennen, dass die Einkommensverteilung in der Gruppe 2 ungleichmäßiger ist als in Gruppe 1. In Gruppe 3 sind die Unterschiede zwischen geringstem und höchstem Einkommen innerhalb einer Gruppe noch größer als in Gruppe 2.
Das Streuungsmaß in der Statistik
Die Ungleichheit in der Verteilung wird durch den Streuungsparameter (= Streuungsmaß) oder Dispersionsmaß angegeben.
Man kennt unterschiedliche Streuungen für kardinalskalierte Beobachtungswerte
- absolute Streuungsmaße
- Spannweite
- durchschnittliche absolute Abweichung
- mittlere quadratische Abweichung
- Standardabweichung
- Quartilsabstand
- relatives Streuungsmaß
- Variationskoeffizient.
1. absolute Streuungsmaße
1.1 Spannweite
Die Spannweite SP (= engl. Range) wird durch die Formel
Sie zeigt den absoluten Unterschied zwischen dem niedrigsten und dem höchsten Beobachtungswert an. Dieses Maß ist äußerst anfällig für Ausreißer, da sie abhängig von den äußersten Werten der geordneten Urliste ist. Die Spannweite der Einkommensverteilung aus unserem Beispiel:
Für Gruppe 2:
Für Gruppe 3:
1.2 Durchschnittliche absolute Abweichung
Die durchschnittliche absolute Abweichung
Die durchschnittliche absolute Abweichung, ist demnach das arithmetische Mittel der Abstände aller Beobachtungswerte von
So ist die durchschnittliche Abweichung vom arithmetischen Mittel
Gruppe 2:
Gruppe 3:
1.3 Mittlere quadratische Abweichung
Die Formel für die mittlere quadratische Abweichung
Die mittlere quadratische Abweichung ist also die Summe der quadrierten Differenzen der einzelnen
Hinweis
Viele Autoren präferieren
Für die mittlere quadratische Abweichung rechnet man:
Mit dem Verschiebungssatz kommt man auf das gleiche Ergebnis:
This browser does not support the video element.
1.4 Standardabweichung
Die Standardabweichung s berechnet man als Wurzel aus der mittleren quadratischen Abweichung:
Im Vergleich zur mittleren quadratischen Abweichung, hat die Standardabweichung die gleiche Dimension wie die Beobachtungswerte.
Die Standardabweichung:
1.3 Quartilsabstand
Der Quartilsabstand QA ist definiert als Differenz zwischen dem oberen
Die Quartilabstände der Gruppen zwei und drei aus unserem Beispiel sind:
Merke
Das Streuungsmaß kann ab ordinalskalierten Merkmalen verwendet werden. Gleichwohl sollte man es erst bei metrisch skalierten Daten verwenden, auch wenn die Berechnung der Quartile selbst möglich ist, denn erst dann ist auch eine Differenz sinnvoll interpretierbar.
2. relatives Streuungsmaß
2.1 Variationskoeffizient
Unter dem Variationskoeffizienten v versteht man den Quotienten aus Standardabweichung s und arithmetischem Mittel
Dabei sollte man sinnvollerweise nur positive
Der Variationskoeffizient im erwähnten Beispiel ist
Der Variationskoeffizient
This browser does not support the video element.
Interpretation der Streuungsmaße
Die Spannweite SP sagt aus, in welcher Range jeder Wert liegt, also der Abstand zwischen dem kleinsten und dem Größten Wert. In unserem Beispiel sind es 2.000€ bzw. 5.000€. Dieses Streuungsmaß ist allerdings recht grob, weil man lediglich weiß, dass alle Werte innerhalb dieser Range liegen. Wo jedoch die meisten? Dies wird halbwegs gut durch die Standardabweichung
Die mittleren quadratischen Abweichung
Durch die durchschnittliche Abweichung vom arithmetischen Mittel
Zum Vergleich der Verteilungen seien die Streuungsmaße für alle Gruppen aufgelistet.
Streuungsmaß | | | | | | |
1 | 0 | 0 | 0 | 0 | 0 | 0 |
2 | 2.000 | 600 | 500.000 | 707,11 | 0,2357 | 1.000 |
3 | 5.000 | 1.600 | 3.400.000 | 1.843,91 | 0,6146 | 3.000 |
Man erkennt deutlich, dass die Werte in C stärker streuen als in B, die Verteilung ist damit ungleichmäßiger. Verteilung A streut gar nicht, weil die Werte alle gleich sind. Die Abweichungen vom Mittelwert sind also alle gleich null.
Merke
Es gilt für Lineartransformationen aus den Werten
d.h.
bzw.
Zur letzten Bemerkung weitere Beispiele:
Beispiel
Beispiel 43:
Jeder Teilnehmer aus den Gruppen 1,2,3 aus dem obigen Beispiel 42 möge nun das zweifache Gehalt beziehen und noch einen Bonus von 1.000 € extra erhalten.
Inwiefern handelt es sich um eine Lineartransformation?
Gib die Parameter a und b an. a = 1.000 € und b = 2, demnach rechnet man
A | B | C | D | E | |
1 | 7.000 | 7.000 | 7.000 | 7.000 | 7.000 |
2 | 5.000 | 6.000 | 7.000 | 8.000 | 9.000 |
3 | 2.000 | 4.000 | 7.000 | 10.000 | 12.000 |
Die mittleren quadratischen Abweichungen
Gruppe | | |
1 | 0 | 0 |
2 | 8.000.000 | 2828,43 |
3 | 40.000.000 | 6324,56 |
Man sieht, dass sich die Werte für
Merke
Für den Vergleich zwischen jenen Streuungsmaßen, die dieselbe Streuung besitzen, gilt
Dies gilt auch für unser Beispiel 42 bspw. für Gruppe 2:
Weitere interessante Inhalte zum Thema
-
Streuungsparameter
Vielleicht ist für Sie auch das Thema Streuungsparameter (Eindimensionale Verteilungen (ohne Namen)) aus unserem Online-Kurs Wahrscheinlichkeitsrechnung interessant.
-
Verbrauchsverlaufanalyse (RSU-Analyse)
Vielleicht ist für Sie auch das Thema Verbrauchsverlaufanalyse (RSU-Analyse) (Materialbedarfsplanung) aus unserem Online-Kurs Produktion interessant.