ZU DEN KURSEN!

Deskriptive Statistik - Histogramm

Kursangebot | Deskriptive Statistik | Histogramm

Deskriptive Statistik

Histogramm

Inhaltsverzeichnis

Klassierte Daten werden in Histogrammen dargestellt. Diese sind vergleichbar mit den Säulendiagrammen, mit dem entscheidenen Unterschied, dass die Fläche der Balken die Häufigkeiten (sowohl die absoluten als auch die relativen) darstellent und nicht die Höhe. Bei gleich großen Klassenbreiten werden häufig an der Ordinate auch Häufigkeiten abgetragen. Dies dient zu r besseren Übersicht, ist allerdings nicht ganz korrekt. Sind die Klassenbreiten nicht gleich groß, wäre diese Beschriftung allerding völlig falsch.

Merke

Hier klicken zum Ausklappen

Die Ordinatenwerte, also die Höhe der Rechtecke eines Histogramms, sind unerheblich für das Verständnis. Sie werden lediglich so konstruiert, dass sie, multipliziert mit der Klassenbreite, gleich der Häufigkeit sind.

Histogramm
Abb.10: Histogramm

Erstellung eines Histogramms

Warum aber nutzt man jetzt den Flächeninhalt als Zuordnung für die Häufigkeiten? Das wollen wir anhand eines fiktiven Beispiels der Einkommensverteilung von Fußballprofis verdeutlichen.

Beispiel

Hier klicken zum Ausklappen

Beispiel 27:

Name Nettoeinkommen in €
Toni Torlos55.000
Bernd Bollwerk35.000
Samuel Striker25.000
Luis Libero9.500
Julian Dribbler7.500
Max Medina4.500

Wir wollen nun die Gehälter der Jugendspieler Luis Libero, Julian Dribbler und Max Medina von den erstklassigen Spielern trennen und klassieren deshalb von 0 – 10.000 € und von 10.000 - 60.000 € Nettoeinkommen pro Woche. Wir erhalten nachfolgende Häufigkeitstabelle sowie Histogramm, wenn wir die Häufigkeiten an der Ordinate abtragen würden:

Klasse absolute Klassenhäufigkeit relative Klassenhäufigkeit
[0;10.000)33/6 = 0,5
[10.000;60.000)33/6 = 0,5
$\ \sum $61
Histogramm Beispiel
Abb.11: Histogramm Beispiel

Wir können nun relativ einfach die Häufigkeit an der Ordinate ablesen, jedoch täuscht uns diese Darstellung eine „stärker” besetzte zweite Klasse vor. Die Balken sind unterschiedlich breit, der erste „passt” fünfmal in den zweiten hinein und wir erhalten somit den Eindruck, dass die zweite Klasse fünfmal so stark besetzt ist wie die erste.
Um solche Fehleindrücke zu vermeiden, nutzen wir den Flächeninhalt zur Darstellung der Häufigkeiten, der Ordinatenwert nützt uns nur zu deren Ermittlung.

Wie berechnet man Breite und Höhe der Balken des Histogramms?

  • Die Abszissenwerte (die Werte der Achse, die von links nach rechts verläuft), demnach die Breiten der Rechtecke, sind bestimmt durch die jeweilige Klassenbreite $\ (b_k)$.

  • Für die Ordinatenwerte (die Werte der Achse, die von oben nach unten verläuft), ergo die Höhe der Rechtecke, muss man die (relativen oder absoluten) Häufigkeiten der jeweiligen Klasse dividieren durch die Klassenbreite:
    Ordinatenwert = Häufigkeit : Klassenbreite

Also ist z.B. für die Höhe der ersten Klasse zu rechnen: $\ {3 \over 10000} = 0,0003 $ bzw. $\ {0,5 \over 10000} = 0,00005 $ bei absoluten bzw. relativen Häufigkeiten. Analog erhalten wir für die zweite Klasse: $\ {3 \over 60000-10000}= {3 \over 50000}= 0,00006 $ bzw. $\ {0,5 \over 50000 } = 0,00001 $ und erhalten folgendes korrektes Histogramm:

Beispiel Histogramm mit optimaler Breite /Höhe
Abb.12: Histogramm Beispiel Histogramm mit optimaler Breite /Höhe

Merke

Hier klicken zum Ausklappen

Bei gleichgroßer Einteilung ist das höchste Rechteck auch das mit der größten Häufigkeit. Bei ungleicher Einteilung allerdings ist der Flächeninhalt entscheidend, nicht die Rechteckhöhe! Der Balken mit der größten Häufigkeit, besitzt auch größte Fläche.

#