ZU DEN KURSEN!

Deskriptive Statistik - Klassierung

Kursangebot | Deskriptive Statistik | Klassierung

Deskriptive Statistik

Klassierung

Auch die umgekehrte Vorgehensweise, ein stetiges (bzw. quasistetiges) als diskretes Merkmal zu behandeln bzw. wie schon erwähnt ein kardinal in ein ordinal skaliertes Merkmal zu transformieren kann u.U. zweckmäßig sein.

Hierbei werden Merkmalsausprägungen, z.B. weil jede Ausprägung zu selten vorkommt, zu Gruppen oder Klassen zusammengefasst. Diesen Vorgang nennt man auch Gruppierung (= Klassierung) von Daten.
Im Beispiel 14 wurde bereits eine Klassierung des metrisch skalierten Merkmals des Gewichts von Eiern in die Gewichtsklassen S, M, L und XL beschrieben. Hierbei hatten wir festgestellt, dass mit der Klassierung ein Informationsverlust einhergeht. Dieser wird jedoch in Kauf genommen, da es zweckmäßiger erscheint, die Eier nach Gewichtsklassen einzuteilen und zu verpacken, als von jedem Ei getrennt und einzeln das Gewicht auszuweisen.

Beispiel

Hier klicken zum Ausklappen Beispiel 23:
Bei der statistischen Erfassung der Einkommenshöhen von Haushalten und bei der Ausgabe der Einkommensverteilung z.B. im Statistischen Jahrbuch werden die Einkommen in Klassen bspw. von je 1.000 € eingeteilt.

Dies hat zum einen bei der Datenerhebung den Grund, dass viele Haushalte überhaupt nicht wissen, wie hoch ihr konkretes Einkommen ist und des Weiteren die Akzeptanz zur Angabe des Haushaltseinkommens steigt, wenn dieses nur innerhalb bestimmter Grenzen angegeben werden muss. Zum anderen macht die Klassierung auch bei der Auswertung und Ausgabe der Daten dahingehend Sinn, dass die Darstellung aber v.a. die Übersichtlichkeit und damit der „visuelle Informationsgehalt” der Daten wesentlich verbessert werden kann. Wir werden hierauf im nächsten Kapitel bei der Darstellung der Daten zurückkommen.

Überführung/Transformation von Merkmalen
Überführung/Transformation von Merkmalen

Merke

Hier klicken zum Ausklappen Merke: Bei jeder Transformation, egal ob in die eine oder andere Richtung, sollten wir beachten, dass wir die Daten anders behandeln, als sie tatsächlich vorliegen:
  • Eine Gruppierung / Klassierung geht i.d.R. mit einem Informationsverlust einher, da die Messgenauigkeit (künstlich) erheblich reduziert wird. Jedoch vereinfacht sich gegebenenfalls die Darstellung und u.U. auch die statistische Weiterverarbeitung.
  • Jede Klassierung entspricht im Grunde einer Transformation mindestens auf die Ordinalskala zurück. Die Eigenschaft der Kardinalskala, nämlich dass die Abstände messbar und sinnvoll interpretierbar sind, geht eigentlich verloren. Wenn wir nur noch wissen, dass Dr. Matthias Median in die Gehaltsklasse zwischen 2.000 und 3.000 € fällt, können wir nicht mehr angeben, wie viel weniger er verdient als Professor Rainer Streuung, welcher der Gehaltsklasse zwischen 5.000 und 6.000 € angehört, sondern nur noch, dass er weniger bzw. in einem Rahmen von 2.000 bis 4.000 € weniger verdient. Genauso ist es nun nicht mehr möglich, einen Gehaltsunterschied mit anderen Mitarbeitern festzustellen, die in dieselbe Gehaltsklasse wie Dr. Median fallen.
  • Eine „Verstetigung” dient der einfacheren Bearbeitung der statistischen Daten, jedoch können hierbei „unsinnige” (bspw. 1,2 Kinder) bzw. nicht nachweisbare (z.B. Angabe eines mittleren Einkommens bei Klassierung) Ergebnisse ermittelt werden. Man sollte sich also bei der Interpretation der Ergebnisse dieser Tatsache bewusst sein. V.a. auf letzteres werden wir an geeigneter Stelle noch einmal zurückkommen.