ZU DEN KURSEN!

Deskriptive Statistik - Regeln zur Klassenbildung in der Statistik

Kursangebot | Deskriptive Statistik | Regeln zur Klassenbildung in der Statistik

Deskriptive Statistik

Regeln zur Klassenbildung in der Statistik

Um nochmals auf das wichtige Thema der Klassenbildung zurück zu kommen, gibt es dazu an dieser Stelle einen kleinen Exkurs. Hier werden Regeln und Hinweise gegeben, die bei einer Klassenbildung zu beachten sind.

Bei der Klassenbildung stehen wir vor diversen Problemen, die wir beachten sollten. Ein Patentrezept gibt es hierzu nicht, grundsätzlich kann hier relativ willkürlich vorgegangen werden. Einige Regeln sollten wir aber – wenn möglich – beachten:

  1. Bilde, wenn möglich, sinnvoll äquidistante Klassenbreiten.

  2. Bilde nicht zu viele (gewünschte Informationsverdichtung wird nicht erreicht) aber auch nicht zu wenige Klassen (Struktur der ursprünglichen Daten geht evtl. verloren).

    Als Regeln für die Anzahl der Klassen k bei n voneinander verschiedenen Beobachtungswerten haben sich hierzu u.a. herausgebildet:
    • $\ k = \sqrt n $ für n ≤ 100 (Faustregel)
    • $\ k = 1 + 3,3 log_{10}$ n =$\ 1 + 3,3 ln(n)/ln 10 $ (Sturges-Regel)
    • k = 10 bei n ≈ 100, k = 13 bei n ≈ 1.000 und k = 16 bei n ≈ 10.000 (DIN 55302, Blatt 1)

  3. Vermeide es, Bereiche, in denen Merkmalsausprägungen gehäuft auftauchen, durch eine Klassengrenze zu zerschneiden oder sie am Rand einer Klasse gehäuft auftreten zu lassen. Hier kann es dann sinnvoll sein, nicht-äquidistante Klassenbreiten zu verwenden.
    Der aufmerksame Leser wird nun feststellen, dass wir in einer Aufgabe genau gegen diese Regel verstoßen haben. Wir haben im ersten Fall den gehäuft auftretenden Bereich um 50 Punkte „zerschnitten” und im anderen Fall die Klassengrenze an den linken Rand des gehäuft auftretenden Bereichs von 60 - 66 Punkte gelegt. Wir haben die Klassengrenzen somit eigentlich schlecht gewählt; es ist aber nicht immer möglich, sich an alle Regeln zu halten und in einigen Fällen (z.B. bei der Notenzuordnung) werden die Klassengrenzen auch im Vorhinein festgelegt, d.h. die Beobachtungen liegen noch gar nicht vor.

  4. Versuche die Klassen homogen (= gleichmäßig) zu besetzen bzw. gehäufte Bereiche in die Klassenmitte zu bringen.

  5. Fasse Bereiche mit sehr wenigen Merkmalsausprägungen zu einer einzigen Klasse zusammen.

  6. Vermeide offene Randklassen, d.h. als untere Klasse eine Einteilung „weniger als ...” bzw. als obere Randklasse „mehr als ...” zu verwenden. Ist dies nicht möglich, sind streng genommen keine Histogramme darstellbar und keine statistischen Maßzahlen berechenbar. Hilfsweise kann man für die offenen Klassen
    • die sonst übliche Klassenbreite,
    • die benachbarte Klassenbreite oder
    • einen objektiv sinnvollen Wert
    verwenden. Offene Randklassen werden zumeist bei der Einkommensverteilung gebraucht, die Angabe einer Einkommenshöchstgrenze ist hier nicht möglich oder aus Datenschutzgründen sogar verboten.