ZU DEN KURSEN!

Deskriptive Statistik - Klassierung

Kursangebot | Deskriptive Statistik | Klassierung

Deskriptive Statistik

Klassierung

Der umgekehrte Weg  ein stetiges (oder quasistetiges) Merkmal als diskretes Merkmal zu behandeln, ist natürlich auch möglich. Wie schon gesagt, ein kardinal in ein ordinal skaliertes Merkmal zu transformieren kann durchaus zweckmäßig sein. Dabei werden Merkmalsausprägungen, die bspw. selten vorkommen einfach zusammengefasst, also gruppiert oder klassifiziert. Daher wird dieser Vorgang  auch als Gruppierung (= Klassierung) von Daten bezeichnet.

In unserem Beispiel mit den Hühnereiern haben wir bereits eine solche Klassifizierung durchgeführt. Dabei wurde das skalierte Merkmal "Gewicht" der Eier in die Klassen S, M, L und XL aufgeteilt. Der dabei entstehende Informationsverlust wird allerdings akzeptiert, da es praktikabler ist, die Eier in diese Gewichtsklassen einzuteilen und zu verkaufen, als das Gewicht jedes einzelnen Eis auszuweisen.

Beispiel

Hier klicken zum Ausklappen

Beispiel 23:

Wird das jährliche Brutto- Haushaltseinkommen aller Haushalte in einer Region statistisch erfasst, so werden die Angaben bspw. in 2.500€ Schritten angegeben.

Das hat auch praktische Gründe für die Datenerhebung, denn viele Haushalte kennen ihr genaues Haushaltseinkommen auch gar nicht. Außerdem steigt die Bereitwilligkeit diese Angaben zu machen, wenn diese lediglich innerhalb bestimmter Bereiche gemacht werden soll. Ebenso ergeben sich Vorteile bei der Ausgabe und Auswertung der Daten, denn die Klassifizierung trägt zu einer gewissen Übersichtlichkeit bei, sodass der Informationsgehalt dieser Daten schneller erfasst werden kann. Im Kapitel zur Darstellung von Daten werden wir auf diesen Aspekt noch etwas genauer eingehen.

Überführung/Transformation von Merkmalen
Abb.3: Überführung/Transformation von Merkmalen

Merke

Hier klicken zum Ausklappen

Bei jeder Transformation, egal ob in die eine oder andere Richtung, sollten wir beachten, dass wir die Daten anders behandeln, als sie tatsächlich vorliegen:

  • Eine Gruppierung oder Klassierung führt für gewöhnlich zu einem Informationsverlust, weil die Messgenauigkeit deutlich verringert wird. Die kann aber die Darstellung und ggf. die statistische Weiterverarbeitung erleichtern.
  • Eine Klassifizierung ist gewissermaßen eine Transformation wenigstens zurück auf die Ordinalskala. Denn die Eigenschaften der Kardinalskala, sinnvoll interpretierbare und messbare Abstände zu haben, fallen i.d.R. weg. Teilen wir zum Beispiel die Spielergehälter von Fußballspieler in Klassen ein und Spieler A zwischen 50.000€ - 100.000€ verdient und Spieler B 250.000€ - 300.000€, so können wir keine konkrete Aussage mehr darüber treffen, wie viel genau Spieler A weniger verdient als Spieler B. Maximal könnte man die Aussage treffen zwischen 150.000€ - 250.000€ weniger. Auch fällt die Möglichkeit weg innerhalb einer Gehaltsstufe Vergleiche anzustellen.
  • Eine „Verstetigung” steht die einfachere Bearbeitung der statistischen Daten im Vordergrund, allerdings können hierbei „unsinnige” (bspw. 1,53 Kinder) bzw. nicht nachweisbare (z.B. Angabe eines mittleren Einkommens bei Klassierung) Ergebnisse ermittelt werden. Man sollte sich bei der Interpretation der Ergebnisse dieser Tatsache bewusst sein. V.a. auf letzteres werden wir an geeigneter Stelle noch einmal zurückkommen.