Inhaltsverzeichnis
Klassierte Daten werden in Histogrammen dargestellt. Diese sind vergleichbar mit den Säulendiagrammen, mit dem entscheidenen Unterschied, dass die Fläche der Balken die Häufigkeiten (sowohl die absoluten als auch die relativen) darstellent und nicht die Höhe. Bei gleich großen Klassenbreiten werden häufig an der Ordinate auch Häufigkeiten abgetragen. Dies dient zu r besseren Übersicht, ist allerdings nicht ganz korrekt. Sind die Klassenbreiten nicht gleich groß, wäre diese Beschriftung allerding völlig falsch.
Merke
Die Ordinatenwerte, also die Höhe der Rechtecke eines Histogramms, sind unerheblich für das Verständnis. Sie werden lediglich so konstruiert, dass sie, multipliziert mit der Klassenbreite, gleich der Häufigkeit sind.
Erstellung eines Histogramms
Warum aber nutzt man jetzt den Flächeninhalt als Zuordnung für die Häufigkeiten? Das wollen wir anhand eines fiktiven Beispiels der Einkommensverteilung von Fußballprofis verdeutlichen.
Beispiel
Beispiel 27:
Name | Nettoeinkommen in € |
Toni Torlos | 55.000 |
Bernd Bollwerk | 35.000 |
Samuel Striker | 25.000 |
Luis Libero | 9.500 |
Julian Dribbler | 7.500 |
Max Medina | 4.500 |
Wir wollen nun die Gehälter der Jugendspieler Luis Libero, Julian Dribbler und Max Medina von den erstklassigen Spielern trennen und klassieren deshalb von 0 – 10.000 € und von 10.000 - 60.000 € Nettoeinkommen pro Woche. Wir erhalten nachfolgende Häufigkeitstabelle sowie Histogramm, wenn wir die Häufigkeiten an der Ordinate abtragen würden:
Klasse | absolute Klassenhäufigkeit | relative Klassenhäufigkeit |
[0;10.000) | 3 | 3/6 = 0,5 |
[10.000;60.000) | 3 | 3/6 = 0,5 |
$\ \sum $ | 6 | 1 |
Wir können nun relativ einfach die Häufigkeit an der Ordinate ablesen, jedoch täuscht uns diese Darstellung eine „stärker” besetzte zweite Klasse vor. Die Balken sind unterschiedlich breit, der erste „passt” fünfmal in den zweiten hinein und wir erhalten somit den Eindruck, dass die zweite Klasse fünfmal so stark besetzt ist wie die erste.
Um solche Fehleindrücke zu vermeiden, nutzen wir den Flächeninhalt zur Darstellung der Häufigkeiten, der Ordinatenwert nützt uns nur zu deren Ermittlung.
Wie berechnet man Breite und Höhe der Balken des Histogramms?
- Die Abszissenwerte (die Werte der Achse, die von links nach rechts verläuft), demnach die Breiten der Rechtecke, sind bestimmt durch die jeweilige Klassenbreite $\ (b_k)$.
- Für die Ordinatenwerte (die Werte der Achse, die von oben nach unten verläuft), ergo die Höhe der Rechtecke, muss man die (relativen oder absoluten) Häufigkeiten der jeweiligen Klasse dividieren durch die Klassenbreite:
Ordinatenwert = Häufigkeit : Klassenbreite
Also ist z.B. für die Höhe der ersten Klasse zu rechnen: $\ {3 \over 10000} = 0,0003 $ bzw. $\ {0,5 \over 10000} = 0,00005 $ bei absoluten bzw. relativen Häufigkeiten. Analog erhalten wir für die zweite Klasse: $\ {3 \over 60000-10000}= {3 \over 50000}= 0,00006 $ bzw. $\ {0,5 \over 50000 } = 0,00001 $ und erhalten folgendes korrektes Histogramm:
Merke
Bei gleichgroßer Einteilung ist das höchste Rechteck auch das mit der größten Häufigkeit. Bei ungleicher Einteilung allerdings ist der Flächeninhalt entscheidend, nicht die Rechteckhöhe! Der Balken mit der größten Häufigkeit, besitzt auch größte Fläche.
#
Weitere interessante Inhalte zum Thema
-
Relative Häufigkeit
Vielleicht ist für Sie auch das Thema Relative Häufigkeit (Häufigkeitsverteilungen) aus unserem Online-Kurs Deskriptive Statistik interessant.
-
Modus
Vielleicht ist für Sie auch das Thema Modus (Verteilungsmaße) aus unserem Online-Kurs Deskriptive Statistik interessant.