ZU DEN KURSEN!

Deskriptive Statistik - Histogramm

Kursangebot | Deskriptive Statistik | Histogramm

Deskriptive Statistik

Histogramm

Zur graphischen Darstellung klassierter Daten verwendet man das Histogramm. Ein Histogramm ist nun analog zu einem Säulendiagramm zu sehen, mit dem wesentlichen Unterschied, dass die Flächen der Säulen hier die (absoluten oder relativen) Häufigkeiten widergeben und nicht ihre Höhen. Bei äquidistanten Klassenbreiten werden häufig an der Ordinate auch Häufigkeiten abgetragen. Dies ist zwar nicht ganz korrekt, kann zur übersichtlicheren Darstellung aber getan werden. Bei nicht-äquidistanten Klassenbreiten wäre diese Vorgehensweise aber nicht mehr korrekt.

Merke

Merke: Die Ordinatenwerte, d.h. die Höhe der Rechtecke eines Histogramms, sind unerheblich für das Verständnis. Sie werden lediglich so konstruiert, dass sie, multipliziert mit der Klassenbreite, gleich der Häufigkeit sind.
Histogramme mit äquidistanter Klassenbreite
Histogramme mit äquidistanter Klassenbreite

Beispiel zur Erstellung eines Histogramm

Warum wird nun aber der Flächeninhalt und nicht der Ordinatenwert als Zuordnung der Häufigkeiten benutzt? Machen wir uns das an einem einfachen Beispiel der Einkommensverteilung unseres Statistiklehrstuhls klar, welches wie folgt aussehen soll:

Beispiel

Beispiel 27:

Name Nettoeinkommen in €
Prof. Dr. Rainer Streuung 4.500
Dr. Matthias Median 3.000
Dipl.-Stat. Verena Varianza 2.000
Lorenzo Fusioni 900
Patrik Pärson 800
Lars Pärsle 500

Wir wollen nun die Einkünfte der studentischen Hilfskräfte L. Fusioni, P. Pärson sowie L. Pärsle von den normalen Mitarbeitern trennen und klassieren deshalb von 0 – 1.000 € und von 1.000 - 5.000 € Nettoeinkommen. Wir erhalten nachfolgende Häufigkeitstabelle sowie Histogramm, wenn wir die Häufigkeiten an der Ordinate abtragen würden:

Klasse absolute Klassenhäufigkeit relative Klassenhäufigkeit
[0;1000) 3 3/6 = 0,5
[1000;5000) 3 3/6 = 0,5
$\ \sum $ 6 1
Histogramm Beispiel
Histogramm Beispiel

Wir können nun relativ einfach die Häufigkeit an der Ordinate ablesen, allerdings täuscht uns diese Darstellung eine „stärker” besetzte zweite Klasse vor. Die Balken sind unterschiedlich mächtig, der erste „passt” viermal in den zweiten hinein und wir erhalten somit den Eindruck, dass die zweite Klasse viermal so stark besetzt ist wie die erste.
Um diesen Fehleindruck zu vermeiden, benutzen wir den Flächeninhalt zur Darstellung der Häufigkeiten,der Ordinatenwert dient uns lediglich zu deren Ermittlung. Wie errechnet man Breite und Höhe der Balken des Histogramms?

  • Die Abszissenwerte (Werte auf derjenigen Achse, die nach rechts zeigt), also die Breiten der Rechtecke, sind bestimmt durch die jeweilige Klassenbreite $\ (b_k)$.
  • Für die Ordinatenwerte (Werte auf derjenigen Achse, die nach oben zeigt), also die Höhe der Rechtecke, muss man die (relativen oder absoluten) Häufigkeiten der jeweiligen Klasse dividieren durch die Klassenbreite:
    Ordinatenwert = Häufigkeit : Klassenbreite

Also ist z.B. für die Höhe der ersten Klasse zu rechnen: $\ {3 \over 1000} = 0,003 $ bzw. $\ {0,5 \over 1000} = 0,0005 $ bei absoluten bzw. relativen Häufigkeiten. Analog erhalten wir für die zweite Klasse: $\ {3 \over 5000-1000}= {3 \over 4000}= 0,00075 $ bzw. $\ {0,5 \over 4000 } = 0,000125 $ und erhalten folgendes korrektes Histogramm:

Beispiel Histogramm mit optimaler Breite /Höhe der Balken
Beispiel Histogramm mit optimaler Breite /Höhe der Balken

Merke

Merke: Bei äquidistanter Einteilung ist das höchste Rechteck jenes mit der größten Häufigkeit. Bei nicht-äquidistanter Einteilung hingegen kommt es auf den Flächeninhalt an, nicht auf die Rechteckhöhe! Hier vertritt jener Balken die größte Häufigkeit, der die größte Fläche hat.