Für die Darstellung klassierter Daten betrachten wir nochmal folgendes Beispiel:
Beispiel
Dr. M. Median ist über die Klausurergebnisse nicht sehr erfreut. Um so mehr wurmt es ihn, dass bei seiner Kollegin Dipl.-Stat. Verena Varianza in ihrem Seminar „Darf man nur der Statistik trauen, die man selber bezahlt hat” von den 25 Studenten etwa die Hälfte mit gut oder sehr gut abgeschnitten haben und nur 10% durchgefallen sind.
Er stellt uns deshalb die Punkteverteilung zur Verfügung:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
Punkte $\ x_i $ | 33 | 78 | 63 | 0 | 98 | 95 | 60 | 5 | 66 | 64 | 90 | 7 | 50 | 61 | 52 | 48 | 19 | 80 | 49 | 87 |
Note | 5 | 3 | 4 | 5 | 1 | 1 | 4 | 5 | 3 | 4 | 2 | 5 | 4 | 4 | 4 | 5 | 5 | 2 | 5 | 2 |
und beauftragt uns, diese darzustellen, in der Hoffnung, durch eine andere Einteilung eine bessere „Verteilung” zu erreichen. Stellen wir zunächst die Punkteverteilung mit einem Stabdiagramm dar. Wir sehen nun lediglich, dass keine Punktzahl mehr als einmal erreicht wurde und u.U. Bereiche innerhalb der Daten gehäuft vorkommen. In unserem Beispiel ist dies bei 50 und 60 Punkten der Fall. Diese Häufung muss jedoch nicht bei jeder Verteilung eintreten, es hätte auch eine gleichmäßigere Punkteverteilung der Fall sein können. I.d.R. werden wir aber durch die Darstellung des Stabdiagramms (oder der Häufigkeitstabelle) keinen nennenswerten Informationsgewinn erhalten:
Zur besseren Visualisierung sollten wir die Daten klassieren (= gruppieren). Zunächst muss man hierzu die Merkmalswerte in Klassen einteilen, diese Einteilung ist jedoch oft recht willkürlich. Hierzu teilen wir das Punktespektrum bspw. in fünf gleich breite (= äquidistante) Klassen à 20 Punkte ein und ermitteln die jeweilige Klassenbesetzung bzw. Klassenhäufigkeit, wobei wir für die absolute Klassenhäufigkeit die Notation $\ h_k $ und für die relative $\ f_k $ verwenden (k steht für die Klasse):
Klasse | $\ h_k $ absolute Klassenhäufigkeit | $\ f_k $ relative Klassenhäufigkeit |
[0;20) | 4 | 4/20 = 0,20 |
[20;40) | 1 | 1/20 = 0,05 |
[40;60) | 4 | 4/20 = 0,20 |
[60;80) | 6 | 6/20 = 0,30 |
[80;100) | 5 | 5/20 = 0,25 |
$\ \sum $ | 20 | 1 |
Bei der Klassierung müssen wir die Einteilung der Klassengrenzen beachten. Üblicherweise wählt man die untere Klassengrenze geschlossen und die obere Klassengrenze offen. Dass heißt, die Schreibweise [0;20) bedeutet in der obigen Tabelle, dass die Zahl 0 eingeschlossen ist, die Zahl 20 hingegen nicht. Wir sehen nun, dass z.B. in der ersten Klasse vier Studenten liegen, d.h. zwischen null und zwanzig Punkten geschrieben haben oder sechs Seminarteilnehmer zwischen 60 und 80 Punkte.
Merke
Alternative Schreibweisen für offene und geschlossene Klassengrenzen / Intervalle sind:
- unten geschlossene und oben offene Klassengrenze / Intervall [...;...) = [...;...[ = (von ... bis unter ...)
- unten offene und oben geschlossene Klassengrenze / Intervall (...;...] = ]...;...] = (von über ... bis ...)
Weiterhin ist für eine sinnvolle Klassierung wichtig, welche Randwerte man wählt, d.h. wie weit man nach oben (mit der obersten Klasse) und wie weit man nach unten (mit der untersten Klasse) geht.
Weitere Interessante Inhalte zum Thema
-
Bestimmung des Konfidenzintervalls. Welches Schema ist wann anwendbar?
Vielleicht ist für Sie auch das Thema Bestimmung des Konfidenzintervalls. Welches Schema ist wann anwendbar? (Schätzen) aus unserem Online-Kurs Stichprobentheorie interessant.
-
Die Nachfragekurve
Vielleicht ist für Sie auch das Thema Die Nachfragekurve (Grundlagen und Begriffe der Mikroökonomie) aus unserem Online-Kurs Mikroökonomie interessant.
-
Stabdiagramm oder Säulendiagramm
Vielleicht ist für Sie auch das Thema Stabdiagramm oder Säulendiagramm (Häufigkeitsverteilungen) aus unserem Online-Kurs Deskriptive Statistik interessant.
-
Aufgabe: Darstellung der Finanzlage
Vielleicht ist für Sie auch das Thema Aufgabe: Darstellung der Finanzlage (Weitere Bestandteile des Konzernabschlusses) aus unserem Online-Kurs Konzernabschluss IFRS interessant.