ZU DEN KURSEN!

Deskriptive Statistik - Regeln zur Klassenbildung in der Statistik

Kursangebot | Deskriptive Statistik | Regeln zur Klassenbildung in der Statistik

Deskriptive Statistik

Regeln zur Klassenbildung in der Statistik

Abschließend müssen wir zum wichtigen Thema der Klassenbildung noch einen kleinen Exkurs einlegen. Wir werden einige Hinweise und Regeln kennenlernen, die es bei einer Klassenbildung zu berücksichtigen gilt. Denn bei der Klassenbildung stehen wir vor unterschiedlichsten Problemen, die wir beachten sollten. Eine einfache Formel gibt es hierfür nicht, denn im Grunde kann man die Klassen relativ beliebig festlegen. Trotzdem sollten, wenn umsetzbar, folgende Regeln beachtet werden:

Methode

Hier klicken zum Ausklappen
  1. Falls möglich bilde gleichgroße Klassenbreiten.

  2. Dabei sollten nicht zu viele (gewünschte Informationsverdichtung wird nicht erreicht) aber auch nicht zu wenige Klassen (Struktur der ursprünglichen Daten geht evtl. verloren) gebildet werden.

    Dabei haben sich für die Bestimmung der möglichen Klassenanzahl k bei n unterschiedlichen Beobachtungswerten folgende Regeln bewährt:

    • $k = \sqrt n $ für n ≤ 100 (Faustregel)
    • $k = 1 + 3,3 · log_{10}$ oder $k = 1 + { {3,3 · ln(n)} \over {ln(10)}}$ (Sturges-Regel)
    • $k = 10$ bei $n ≈ 100$, $k = 11 $ bei $n ≈ 1.000$ und $k = 14$ bei $n ≈ 10.000$

  3. Es sollte vermieden werden, dass sich gehäufte Merkmalsausprägungen durch Klassengrenze geteilt werden oder sich diese an Klassenrändern zu sehr häufen. Für diesen Fall kann es sinnvoll sein, nicht-äquidistante Klassenbreiten zu wählen. Man kann nicht immer alle Regeln umsetzten und in manchen Fällen werden die Klassengrenzen sogar im Vorhinein festgelegt, wenn die Beobachtungen noch gar nicht vorliegen.

  4. Versuche die Klassen homogen (= gleichmäßig) zu besetzen bzw. Häufungen in die Klassenmitte zu bringen.

  5. Bereiche mit sehr wenigen Merkmalsausprägungen sollten zu einer Klasse zusammengefasst werden.

  6. Offene Randklassen (für untere Klassen eine Einteilung „weniger als ...” oder bei oberen Randklassen „mehr als ...”) sollten nicht verwendet werden. Sollte das nicht umsetzbar sein, sind Histogramme streng genommen nicht darstellbar und keine statistischen Maßzahlen berechenbar. Hilfsweise kann man für die offenen Klassen
    • die sonst übliche Klassenbreite,
    • die benachbarte Klassenbreite oder
    • einen objektiv sinnvollen Wert
    verwenden.

    Offene Randklassen werden zumeist bei der Einkommensverteilung gebraucht, die Angabe einer Einkommenshöchstgrenze ist hier nicht möglich oder aus Datenschutzgründen sogar verboten.