Inhaltsverzeichnis
Ein weiteres Lagemaße sind die Fraktile bzw. Quantile, die in der Statistik eine große Rolle spielen.
Ein $\alpha $–Fraktil (= $\alpha$–Quantil = $\alpha$–Punkt )$x_\alpha $ gibt an, dass $\alpha $ Prozent der Werte einer geordneten Urliste bis zu dem $\alpha– $ Fraktil erreicht oder gerade eben überschritten sind. Die Formel für das $\alpha - $ Fraktil bei Vorliegen einer geordneten Urliste aus n Werten ist
$x_\alpha = x_{\alpha \cdot n}$
Dabei ist $\lceil {\alpha \cdot n} \rceil $ die obere Gaußklammerfunktion, die einer reellen Zahl die nächstgrößere ganze Zahl zuordnet. So ist
$\lceil 1,7 \rceil $ = 2; $\lceil 2,34 \rceil = 3 $; $\lceil 4,1 \rceil = 5 $; $\lceil 7 \rceil = 7 $; etc.
Beispiel
Für das Beispiel aus der Aufgabe Fußballprofis des Median-City FC etwa liegt folgende geordnete Urliste vor:
1 | 2 | 2 | 2 | 3 | 5 | 8 | 8 | 8 | 9 | 9 | 9 | 10 | 10 | 12 |
Es handelt sich um n = 15 Werte. Für das 0,2 - Fraktil rechnet man ${n \cdot \alpha} = {15 \cdot 0,2} = 3 $, demnach der dritte Wert dieser Liste ist das 0,2 - Fraktil: $\ x_{0,2} = 2 $. Für das 0,6 - Fraktil rechnet man $\ {15 \cdot 0,6} = 9 $, also $x_{0,6} = x_{\lceil 15\cdot 0,6 \rceil } = x9 = 8 $.
Was ist aber das 32% Fraktil?
Man rechnet $\ {0,32\cdot 15} = 4,8 $ und die obere Gaußklammer von 4,8 ist $\ \lceil 4,8 \rceil = 5 $. Also ist das 32%-Fraktil der fünfte Wert, also $\ x_{0,32} = x5 = 3 $. Es ist der fünfte Wert, weil beim vierten Wert erst $\ {4 \over 15} = 0,267 $ = 26,7% aller Werte erreicht sind, beim fünften Wert aber schon $\ {5 \over 15} = 0,33 $ = 33,3%, also beim 5. Wert sind 32% der Werte erreicht oder gerade eben überschritten.
Spezialfall Quartile
Besondere Fraktile sind die sogenannten Quartile. Dabei unterscheidet man das obere und das untere Quantil.
- Das untere Quantil $x_{0,25} $ gibt an, wann 25 % der Werte erreicht oder gerade eben überschritten sind.
- Das obere Quartil $x_{0,75} $ gibt an, wann 75 % der Werte erreicht oder gerade eben überschritten sind.
Fraktile berechnen und graphisch bestimmen
Für klassierte Daten existiert noch ein gesonderter Weg, ein $\alpha $-Fraktil auszurechnen, nämlich über eine lineare Interpolation. Zunächst die Formel für den Feinberechneten Median (= Lineare Interpolation):
Merke
$\ x_{\alpha} = x_{k-1}^\rightarrow + {{x_{k}^\rightarrow - x_{k-1}^\rightarrow} \over f(x_k)} \cdot (\alpha-F(x_{k-1}^*))$
Graphisch kann man Fraktile auch sehr gut durch die empirischer Verteilungsfunktionen bestimmen. Zur Verdeutlichung zeigen wir die zugehörige empirische Verteilungsfunktion unseres Beispiels der Fußballer des Median-City FC und deren Extratrainingszeiten:
Wollen wir jetzt bspw. den Median bestimmen, ziehen wir eine Linie bei 0,5 auf der Ordinatenachse bis zur empirischen Verteilungsfunktion. An dem Punkt geht man orthogonal bis zur Abszisse und kann dort den Median ablesen. Genauso kann man bei allen anderen zur bestimmenden Fraktilen verfahren.
Expertentipp
Ermittlung $\alpha$-Fraktil bei klassierten Daten:
- Bestimme die Einfallsklasse, also jene, in die der Wert $x_\alpha $ fällt. Berechne dafür die relative Häufigkeit f und die kumulierte relative Häufigkeit F (bspw. über eine Tabelle). Anschließend gucke bei welcher in welcher Klasse der Wert $x_\alpha $ die kumulierte relative Häufigkeit F erreicht oder gerade eben übersteigt. Jede weitere Berechnung spielt sich innerhalb dieser Einfallsklasse ab.
- $x_{k-1}^*$ ist die untere Grenze dieser Klasse, $x_k^* $ ist die obere Grenze. Die unkumulierte relative Häufigkeit der Einfallsklasse ist $f(x_k) $, die kumulierte relative Häufigkeit bis vor die Einfallsklasse wird durch $Fx_{k-1}^* $ angegeben.
- Setze alle Werte ein in die Formel: $$ x = x_{k-1}^*+{x_k^* -x_{k-1}^* \over fx_k} \ * x- Fx_{k-1}^* $$
Hinweis
Der Wert $\ x_\alpha $ muss selbstverständlich innerhalb der Einfallsklasse liegen. Prüfe ob $\ x_{k-1}^* \leq x_\alpha \leq x_k^* $ gilt.
Rechnen wir die Methode an einem Beispiel nach.
Berechnung der Quantile bei klassierten Daten
Beispiel
Beispiel 32:
In der Profiliga, in der unser Median-City FC spielt, sind auch noch 19 weiter Mannschaften mit dabei, mit unterschiedlicher Dauer der Ligazugehörigkeit:
$\\$
Zugehörigkeit in Jahren | Anzahl der Vereine |
bis unter zwei Jahr | 2 |
zwischen zwei und fünf Jahren | 1 |
zwischen fünf und zehn Jahren | 4 |
zwischen zehn und zwanzig Jahren | 6 |
zwischen zwanzig und fünfzig Jahren | 7 |
Bestimme sowohl das untere als auch das obere Quartil und den Median. Das Schema werden wir Schritt für Schritt erläutern. Als erstes erstellen wir allerdings die Häufigkeitstabelle.
Zugehörigkeit | Index k | Anzahl der Vereine | relative Häufigkeit f | kumulierte relative Häufigkeit F |
[0;2) | 1 | 2 | 0,1 | 0,1 |
[2;5) | 2 | 1 | 0,05 | 0,15 |
[5;10) | 3 | 4 | 0,2 | 0,35 |
[10;20) | 4 | 6 | 0,3 | 0,65 |
[20;50) | 5 | 7 | 0,35 | 1 |
$\sum $ | - | 20 | 1 | - |
Da die 25% der kumulierten relativen Häufigkeit das erste Mal in der Klasse drei überschritten werden, liegt folglich auch hier das untere Quantil $x_{0,25} $. Also ist der Index k = 3.
Damit ist die untere Klassengrenze $\ x_{k-1}^* = x_{3-1}^* = x_2^*= 5 $,
die obere $\ x_k^* = x_3^*=10 $.
Es ist $\ f(x_k) = f(x_3) = 0,2 $ und $\ Fx_{k-1}^* =F x_{3-1}^* =F x_2^* =F(2) = 0,15$ die kumulierte relative Häufigkeit bis vor die Einfallsklasse.
Demnach wird gerechnet:
$\begin{align} \ x_{0,25} & = x_2^*+ {x_3^*-x_2^*\over{fx_3}} \cdot 0,25 - Fx_2^*
\\ & = 5 + {{10-5} \over {0,2}} \cdot (0,25-0,15)
\\ & = 7,5 \end{align} $.
Das untere Quartil ist daher $\ x_{0,25} = 7,5 $. Der Median wird genau auf dieselbe Art und Weise berechnet, bei klassierten Daten wird er auch als feinberechneter Median bzw. Zentralwert bezeichnet.
$\ x_{0,5} = 10 + {20 - 10 \over 0,3} \cdot (0,5 – 0,35) = 10 + 5 = 15 $.
Für das obere Quartil gilt
$\ x_{0,75} = 20 + {50 - 20\over 0,35} \cdot (0,75 – 0,65) = 28,57 $.
Weitere interessante Inhalte zum Thema
-
Schiefe
Vielleicht ist für Sie auch das Thema Schiefe (Verteilungsmaße) aus unserem Online-Kurs Deskriptive Statistik interessant.