Kursangebot | Deskriptive Statistik | Fraktile

Deskriptive Statistik

Fraktile

Ein weiteres Lagemaße sind die Fraktile bzw.  Quantile, die in der Statistik eine große Rolle spielen.

Ein $\alpha $–Fraktil (= $\alpha$–Quantil = $\alpha$–Punkt )$x_\alpha $ gibt an, dass $\alpha $ Prozent der Werte einer geordneten Urliste bis zu dem $\alpha– $ Fraktil erreicht oder gerade eben überschritten sind. Die Formel für das $\alpha - $ Fraktil bei Vorliegen einer geordneten Urliste aus n Werten ist

$x_\alpha = x_{\alpha \cdot n}$

Dabei ist $\lceil {\alpha \cdot n} \rceil $ die obere Gaußklammerfunktion, die einer reellen Zahl die nächstgrößere ganze Zahl zuordnet. So ist

$\lceil 1,7 \rceil $ = 2; $\lceil 2,34 \rceil = 3 $; $\lceil 4,1 \rceil = 5 $; $\lceil 7 \rceil = 7 $; etc.

Beispiel

Hier klicken zum Ausklappen

Für das Beispiel aus der Aufgabe Fußballprofis des Median-City FC etwa liegt folgende geordnete Urliste vor:

122235888999101012

Es handelt sich um n = 15 Werte. Für das 0,2 - Fraktil rechnet man ${n \cdot \alpha} = {15 \cdot 0,2} = 3 $, demnach der dritte Wert dieser Liste ist das 0,2 - Fraktil: $\ x_{0,2} = 2 $. Für das 0,6 - Fraktil rechnet man $\ {15 \cdot 0,6} = 9 $, also $x_{0,6} = x_{\lceil 15\cdot 0,6 \rceil } = x9 = 8 $.

Was ist aber das 32% Fraktil?

Man rechnet $\ {0,32\cdot 15} = 4,8 $ und die obere Gaußklammer von 4,8 ist $\ \lceil 4,8 \rceil = 5 $. Also ist das 32%-Fraktil der fünfte Wert, also $\ x_{0,32} = x5 = 3 $. Es ist der fünfte Wert, weil beim vierten Wert erst $\ {4 \over 15} = 0,267 $ = 26,7% aller Werte erreicht sind, beim fünften Wert aber schon $\ {5 \over 15} = 0,33 $ = 33,3%, also beim 5. Wert sind 32% der Werte erreicht oder gerade eben überschritten.

Spezialfall Quartile 

Besondere Fraktile sind die sogenannten Quartile. Dabei unterscheidet man das obere und das untere Quantil.

  • Das untere Quantil $x_{0,25} $ gibt an, wann 25 % der Werte erreicht oder gerade eben überschritten sind.
  • Das obere Quartil $x_{0,75} $ gibt an, wann 75 % der Werte erreicht oder gerade eben überschritten sind.

Fraktile berechnen und graphisch bestimmen

Für klassierte Daten existiert noch ein gesonderter Weg, ein $\alpha $-Fraktil auszurechnen, nämlich über eine lineare Interpolation. Zunächst die Formel für den Feinberechneten Median (= Lineare Interpolation):

Merke

Hier klicken zum Ausklappen

$\ x_{\alpha} = x_{k-1}^\rightarrow + {{x_{k}^\rightarrow - x_{k-1}^\rightarrow} \over f(x_k)} \cdot (\alpha-F(x_{k-1}^*))$

Graphisch kann man Fraktile auch sehr gut durch die empirischer Verteilungsfunktionen bestimmen. Zur Verdeutlichung zeigen wir die zugehörige empirische Verteilungsfunktion unseres Beispiels der Fußballer des Median-City FC und deren Extratrainingszeiten:

Fraktile mit Hilfe der empirischen Verteilungsfunktion
Abb.17: Fraktile mit Hilfe der empirischen Verteilungsfunktion

Wollen wir jetzt bspw. den Median bestimmen, ziehen wir eine Linie bei 0,5 auf der Ordinatenachse bis zur empirischen Verteilungsfunktion. An dem Punkt geht man orthogonal bis zur Abszisse und kann dort den Median ablesen. Genauso kann man bei allen anderen zur bestimmenden Fraktilen verfahren.

Expertentipp

Hier klicken zum Ausklappen

Ermittlung $\alpha$-Fraktil bei klassierten Daten:

  1. Bestimme die Einfallsklasse, also jene, in die der Wert $x_\alpha $ fällt. Berechne dafür die relative Häufigkeit f und die kumulierte relative Häufigkeit F (bspw. über eine Tabelle). Anschließend gucke bei welcher in welcher Klasse der Wert $x_\alpha $ die kumulierte relative Häufigkeit F erreicht oder gerade eben übersteigt. Jede weitere Berechnung spielt sich innerhalb dieser Einfallsklasse ab.

  2. $x_{k-1}^*$ ist die untere Grenze dieser Klasse, $x_k^* $ ist die obere Grenze. Die unkumulierte relative Häufigkeit der Einfallsklasse ist $f(x_k) $, die kumulierte relative Häufigkeit bis vor die Einfallsklasse wird durch $Fx_{k-1}^* $ angegeben.

  3. Setze alle Werte ein in die Formel: $$ x = x_{k-1}^*+{x_k^* -x_{k-1}^* \over fx_k} \ * x- Fx_{k-1}^* $$

Hinweis

Hier klicken zum Ausklappen

Der Wert $\ x_\alpha $ muss selbstverständlich innerhalb der Einfallsklasse liegen. Prüfe ob $\ x_{k-1}^* \leq x_\alpha \leq x_k^* $ gilt.

Rechnen wir die Methode an einem Beispiel nach.

Berechnung der Quantile bei klassierten Daten

Beispiel

Hier klicken zum Ausklappen

Beispiel 32:

In der Profiliga, in der unser Median-City FC spielt, sind auch noch 19 weiter Mannschaften mit dabei, mit unterschiedlicher Dauer der Ligazugehörigkeit:

$\\$

Zugehörigkeit in Jahren Anzahl der Vereine
bis unter zwei Jahr2
zwischen zwei und fünf Jahren1
zwischen fünf und zehn Jahren4
zwischen zehn und zwanzig Jahren6
zwischen zwanzig und fünfzig Jahren7

Bestimme sowohl das untere als auch das obere Quartil und den Median. Das Schema werden wir Schritt für Schritt erläutern. Als erstes erstellen wir allerdings die Häufigkeitstabelle.

Zugehörigkeit Index k Anzahl der Vereine relative Häufigkeit f kumulierte relative Häufigkeit F
[0;2)120,10,1
[2;5)210,050,15
[5;10)340,20,35
[10;20)460,30,65
[20;50)570,351
$\sum $-201-

Da die 25% der kumulierten relativen Häufigkeit das erste Mal in der Klasse drei überschritten werden, liegt folglich auch hier das untere Quantil $x_{0,25} $. Also ist der Index k = 3.

Damit ist die untere Klassengrenze $\ x_{k-1}^* = x_{3-1}^* = x_2^*= 5 $,
die obere $\ x_k^* = x_3^*=10 $.

Es ist $\ f(x_k) = f(x_3) = 0,2 $ und $\ Fx_{k-1}^* =F x_{3-1}^* =F x_2^* =F(2) = 0,15$ die kumulierte relative Häufigkeit bis vor die Einfallsklasse.

Demnach wird gerechnet:

$\begin{align} \ x_{0,25} & = x_2^*+ {x_3^*-x_2^*\over{fx_3}} \cdot 0,25 - Fx_2^*
\\ & = 5 + {{10-5} \over {0,2}} \cdot (0,25-0,15)
\\ & = 7,5 \end{align} $.

Das untere Quartil ist daher $\ x_{0,25} = 7,5 $. Der Median wird genau auf dieselbe Art und Weise berechnet, bei klassierten Daten wird er auch als feinberechneter Median bzw. Zentralwert bezeichnet.

$\ x_{0,5} = 10 + {20 - 10 \over 0,3} \cdot (0,5 – 0,35) = 10 + 5 = 15 $.

Für das obere Quartil gilt

$\ x_{0,75} = 20 + {50 - 20\over 0,35} \cdot (0,75 – 0,65) = 28,57 $.