ZU DEN KURSEN!

Deskriptive Statistik - Median

Kursangebot | Deskriptive Statistik | Median

Deskriptive Statistik

Median

Inhaltsverzeichnis

Der Median (= Zentralwert) ist, wie schon angedeutet, ein spezielles Fraktil, nämlich der 0,5–Wert, in Zeichen $\ x_{0,5} $. Wegen seiner großen Bedeutung widmen wir ihm trotzdem ein spezielles Kapitel und lassen es nicht bei der Erwähnung im Abschnitt über Fraktile. Man muss für den Zentralwert zunächst die Urliste in eine geordnete Urliste verwandeln, um dann den Wert in der Mitte zu erkennen.

Beispiel 33:
Gegeben seien die Schulnoten gut, gut, befriedigend, sehr gut, mangelhaft, ausreichend, ungenügend. Gib einen geeigneten Mittelwert an. Die geordnete Urliste ist:
sehr gut, gut, gut, befriedigend, ausreichend, mangelhaft, ungenügend.
Der Wert in der Mitte, also der Median, lautet „befriedigend“.

In der Mitte bedeutet, dass genau so viele Werte links liegen wie rechts (hier jeweils genau drei Stück). Problematisch wird diese Definition, wenn keine ungerade Anzahl von Werten vorliegt (wie hier n = 7), sondern eine gerade Anzahl.

Beispiel 34:
Ein achter Schüler habe die Note ausreichend, ansonsten gelten die Zahlen aus dem vorherigen Beispiel.
Angeordnet erhält man die n = 8 Werte: sehr gut, gut, gut, befriedigend, ausreichend, ausreichend, mangelhaft, ungenügend. Nun liegen zwei Werte in der Mitte, denn es sind drei Noten links von befriedigend und drei Noten rechts von der ersten ausreichend-Note vorhanden.

Als Median sieht man dann meistens das arithmetische Mittel der beiden Werte der Mitte an.

Definition Median

Der Median wird wie folgt definiert:

  • $\ x_{0,5} = x_{(n+1)\over 2} $, wenn n ungerade ist, und
  • $\ x_{0,5}= {1 \over 2} \cdot (x_{n \over 2} + x_{{n\over 2}+1}) $, wenn n gerade ist.

Problematisch hierbei:

  • Man muss eine Skalentransformation durchführen, d.h. befriedigend = 3, ausreichend = 4 usw.
  • Man setzt sich über das Verbot hinweg, auf der Ordinalskala zu rechnen. Wer würde schon „befriedigend + ausreichend“ rechnen wollen? Erst mit den transformierten Werten 3 und 4 lässt sich etwas addieren, was aber nicht sinnvoll ist: $\ 3 + 4 = 7 $ , und 7 ist keine Note.

Also bezogen auf das Beispiel 34: bei n = 7 ist n ungerade, d.h. $\ x_{0,5} = x_{(n+1) \over 2}= x_{(7+1) \over 2}= x_{4} $ = befriedigend, denn der vierte Wert der geordneten Urliste ist befriedigend.
Bei n = 8 ist n gerade, d.h., $\ x_{0,5} = {1 \over 2} \cdot (x_{n \over 2} + x_{{n\over 2}+1}) = {1 \over 2} \cdot (x_{8 \over 2} + x_{{8\over 2}+1}) ={1 \over 2} \cdot (x_{4} + x_{5})=3,5 $, denn in der geordneten Urliste ist befriedigend (= 3) der vierte Wert, also $\ x_4 = 3 $, und ausreichend (= 4) der fünfte, d.h. $\ x_5 = 4 $.
Zusammenfassend einige Hilfestellungen zur Bestimmung des Median

Bestimmung des Median $\ x_{0,5} $:

1. Ist das Merkmal mindestens ordinalskaliert?

2. Bilde die Urliste.

3. Bilde die geordnete Urliste.

4. Ist der Umfang n gerade oder ungerade?

  • n ungerade: $\ x_{0,5}= x_{(n+1)\over 2} $,
  • n gerade: $\ x_{0,5} ={1 \over 2} \cdot (x_{n \over 2} +x_{{n\over 2}+1})$.

Merke

Merke: Der Unterschied zwischen folgenden Fraktilen = Quantilen ist:

spezielle Fraktile:   
  • Dezile (10 % - Werte),    
  • Pentile (20 % - Werte),   
  • Quartile,

spezielle Quartile, nämlich die jeweiligen 25 % - Werte:    
  • das 25 % - Quantil (= erste Quartil = unteres Quartil),  
  • das 50 % - Quantil (= zweite Quartil = der Median),   
  • das 75 % - Quantil (= drittes Quartil = oberes Quartil).

Der Median zeichnet sich aus durch eine gewisse Optimalitätseigenschaft: Wenn man kardinalskalierte Merkmale wählt und hiervon den Median berechnet, so ist die Summe der absoluten Abweichungen der Beobachtungswerte von einem Punkt m dann minimal, wenn m der Median ist, d.h. $\ \sum_{i=1}^{m} |x_i - m| $ min! $\ \leftrightarrow m =x_{0,5} $.

Beispiel 35:
Gegeben seien die Zahlen 8, 3, 3, 5, 2, 1, 3, 4.
Die geordnete Urliste ist 1 2 3 3 3 4 5 8 Median ist $\ x_{0,5} = 3 $. Die Beträge der Differenzen der Beobachtungswerte z.B. von der Zahl m = 2 sind $\ |1 – 2| + |2 - 2| + ... + |8 – 2| = 1 + 0 + ... + 6 = 14 $, bei m = 0,5 erhält man $\ |1 – 0,5| + |2 – 0,5| + ... + |8 – 0,5| = 0,5 + 1,5 + ... + 7,5 = 22,5 $, beim Median hingegen lediglich $\ |1 – 3| + |2 – 3| + ... + |8 – 3| = 11 $. Diese Zahl 11 wird nicht unterschritten! Es gibt kein m, das eine kleinere Summe von absoluten Abweichungen der Beobachtungswerte von sich selbst liefert als der Median.