Kursangebot | Deskriptive Statistik | Fraktile

Deskriptive Statistik

Fraktile

Ein weiteres Lagemaße sind sind die Fraktile bzw.  Quantile, die in der Statistik eine große Rolle spielen.

Ein $\ \alpha $–Fraktil (= $\ \alpha$–Quantil = $\ \alpha$–Punkt )$\ x_\alpha $ gibt an, dass $\ \alpha $ Prozent der Werte einer geordneten Urliste bis zu dem $\ \alpha– $ Fraktil erreicht oder gerade eben überschritten sind. Die Formel für das $\ \alpha - $ Fraktil bei Vorliegen einer geordneten Urliste aus n Werten ist $\ x_\alpha = x_{\alpha \cdot n}$.
Hierbei ist $\ \lceil {\alpha \cdot n} \rceil $ die obere Gaußklammerfunktion, die einer reellen Zahl die nächst größere ganze Zahl zuordnet.
So ist $\ \lceil 0,8 \rceil $ = 1,$\ \lceil 1,23 \rceil = 2 $, $\ \lceil 3,9 \rceil = 4 $, $\ \lceil 6 \rceil = 6 $ etc.

Beispiel

Hier klicken zum Ausklappen

Für das Beispiel aus der Aufgabe der Statistik-Schüler der Kreisstadt Poisson-City etwa liegt folgende geordnete Urliste vor:
1 2 2 2 3 4 5 7 8 8 8 8 9 9 9 10 10 11 12 12.

Es handelt sich um n = 20 Werte. Für das 0,1 - Fraktil rechnet man $\ {n \cdot \alpha} = {20 \cdot 0,1} = 2 $, d.h. der zweite Wert dieser Liste ist das 0,1 - Fraktil: $\ x_{0,1} = 2 $. Für das 0,4 - Fraktil rechnet man $\ {20 \cdot 0,4} = 8 $, d.h.$\ x_{0,4} = x_{\lceil 20 \cdot 0,4 \rceil } = x8 = 7 $.

Was ist aber das 18 % Fraktil?
Man rechnet $\ {0,18 \cdot 20} = 3,6 $ und die obere Gaußklammer von 3,6 ist $\ \lceil 3,6 \rceil = 4 $. Also ist das 18 %-Fraktil der vierte Wert, d.h. $\ x_{0,18} = x4 = 2 $. Es ist der vierte Wert, weil beim dritten Wert erst $\ {3 \over 20} = 0,15 $ = 15 % aller Werte erreicht sind, beim vierten Wert aber schon $\ {4 \over 20} = 0,2 $ = 20 %, d.h. beim 4. Wert sind 18 % der Werte erreicht oder gerade eben überschritten.

Quartile als Spezialfall

Spezielle Fraktile sind die sogenannten Quartile:

  • $\ x_{0,25} $ ist das untere Quartil, hier sind 25 % der Werte erreicht oder gerade eben überschritten,
  • $\ x_{0,75} $ ist das obere Quartil, hier sind 75 % der Werte erreicht oder gerade eben überschritten.

Fraktile berechnen und graphisch bestimmen

Für klassierte Daten existiert noch ein gesonderter Weg, ein $\ \alpha $-Fraktil auszurechnen, nämlich über eine lineare Interpolation. Zunächst die Formel für den Feinberechneten Median (= Lineare Interpolation): $$\ x_{\alpha} = x_{k-1}^\rightarrow + {{x_{k}^\rightarrow - x_{k-1}^\rightarrow} \over f(x_k)} \cdot (\alpha-F(x_{k-1}^*))$$

Es gibt eine graphisch sehr schöne Möglichkeit, Fraktile mit Hilfe empirischer Verteilungsfunktionen zu ermitteln. Hierzu wieder das Beispiel der 20 Studenten aus Poisson-City und ihrer Klausurvorbereitungszeit sowie die zugehörige empirische Verteilungsfunktion:

Fraktile mit Hilfe der empirischen Verteilungsfunktion
Fraktile mit Hilfe der empirischen Verteilungsfunktion

Möchten wir nun z.B. den Median bestimmen, so zeichnen wir eine gestrichelte Linie durch die Stelle 0,5 auf der Ordinate. An der Stelle, wo diese Linie die empirische Verteilungsfunktion trifft, fällt man das Lot auf die Abzisse und erhält den Median. Dasselbe analoge Vorgehen liefert alle anderen Fraktile.

Expertentipp

Hier klicken zum Ausklappen

Ermittlung $\ \alpha $-Fraktil bei klassierten Daten:

  1. Berechne die Klasse, in die der Wert $\ x_\alpha $ fällt (Einfallsklasse). Bilde hierzu die relative Häufigkeit f und die kumulierte relative Häufigkeit F und schaue, bei welcher Klasse die kumulierte relative Häufigkeit F den Wert $\ \alpha $ erreicht oder gerade eben übersteigt. Alle weiteren Berechnungen finden innerhalb der Einfallsklasse statt.
  2. Es ist $\ x_{k-1}^* $ die untere Grenze dieser Klasse, $\ x_k^* $ die obere Grenze. Die relative Häufigkeit (unkumuliert) der Einfallsklasse ist $\ f(x_k) $, die kumulierte relative Häufigkeit bis vor die Einfallsklasse wird durch $\ Fx_{k-1}^* $ angegeben.
  3. Setze ein in die Formel $$\ x = x_{k-1}^*+{x_k^* -x_{k-1}^* \over fx_k} \ * x- Fx_{k-1}^* $$

Achtung:
Der Wert $\ x_\alpha $ muss selbstverständlich innerhalb der Einfallsklasse liegen. Schaue also nach, ob $\ x_{k-1}^* \leq x_\alpha \leq x_k^* $ gilt. Rechnen wir die Methode an einem Beispiel nach.

Beispiel Berechnung der Quantile bei klassierten Daten

Beispiel

Hier klicken zum Ausklappen

Beispiel 32:
Die Zugehörigkeit von Lehrern an der Gauss-Schule in der sonnigen Kreisstadt Poisson-City werde durch folgende Tabelle wiedergegeben:

Zugehörigkeit in Jahren Anzahl der Lehrer
bis unter einem Jahr6
zwischen einem und zwei Jahren5
zwischen zwei und fünf Jahren8
zwischen fünf und zehn Jahren13
zwischen zehn und zwanzig Jahren18

Berechne das untere sowie das obere Quartil als auch den Median. Wir gehen das Kochrezept jeweils Schritt für Schritt durch. Zunächst jedoch müssen wir die Häufigkeitstabelle erstellen.

Zugehörigkeit Index k Anzahl der Lehrer relative Häufigkeit f kumulierte relative Häufigkeit F
[0;1)160,120,12
[1;2)250,10,22
[2;5)380,160,38
[5;10)4130,260,64
[10;20)5180,361
$\ \sum $-501-

Das untere Quartil $\ x_{0,25} $ liegt offenbar in der dritten Klasse, weil hier die kumulierte relative Häufigkeit zum ersten Mal 25 % überschreitet. Der Index ist daher k = 3. Damit ist die untere Klassengrenze $\ x_{k-1}^* = x_{3-1}^* = x_2^*=2 $, die obere $\ x_k^* = x_3^*=5 $. Es ist $\ f(x_k) = f(x_3) = 0,16 $ und $\ Fx_{k-1}^* =F x_{3-1}^* =F x_2^* =F(2) = 0,22 $ die kumulierte relative Häufigkeit bis vor die Einfallsklasse.
Also rechnet man
$\ x_{0,25} =x_2^*+{x_3^*-x_2^*\over(fx_3} \cdot 0,25 - Fx_2^*=2 + {5-2 \over 0,16} \cdot (0,25-0,22) =2,5625 $.
Das untere Quartil ist daher $\ x_{0,25} = 2,5625 $. Den Median rechnet man genauso aus. Man nennt den Median bei klassierten Daten auch feinberechneten Median bzw. Zentralwert. Medianklasse ist die vierte Klasse, man rechnet
$\ x_{0,5} = 5 + {10-5 \over 0,26} \cdot (0,5 – 0,38) = 5 + 2,308 = 7,308 $.
Für das obere Quartil gilt
$\ x_{0,75} = 10 + {20-10 \over 0,36} \cdot (0,75 – 0,64) = 13,056 $.