wiwiweb
online lernen

Besser lernen mit Online-Kursen

NEU! Jetzt online lernen:
Deskriptive Statistik
Den Kurs kaufen für:
einmalig 29,00 €
Zur Kasse
Häufigkeitsverteilungen > Klassierte Daten und ihre Darstellung:

Klassierung und ihre Darstellung

WebinarTerminankündigung:
 Am 19.01.2017 (ab 18:00 Uhr) findet unser nächstes Webinar statt.
Gratis-Webinar Statistik: Konfidenzintervalle und Testtheorie
- In diesem 60-minütigen Gratis-Webinar gibt Daniel Lambert einen Überblick über die Stichprobentheorie: was sind Konfidenzintervalle, wie testet man?
[weitere Informationen] [Terminübersicht]

Für die Darstellung klassierter Daten betrachten wir nochmal folgendes Beispiel:

Beispiel 26:
Dr. M. Median ist über die Klausurergebnisse nicht sehr erfreut. Um so mehr wurmt es ihn, dass bei seiner Kollegin Dipl.-Stat. Verena Varianza in ihrem Seminar „Darf man nur der Statistik trauen, die man selber bezahlt hat” von den 25 Studenten etwa die Hälfte mit gut oder sehr gut abgeschnitten haben und nur 10% durchgefallen sind.

Er stellt uns deshalb die Punkteverteilung zur Verfügung:

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Punkte $\ x_i $ 33 78 63 0 98 95 60 5 66 64 90 7 50 61 52 48 19 80 49 87
Note 5 3 4 5 1 1 4 5 3 4 2 5 4 4 4 5 5 2 5 2

und beauftragt uns, diese darzustellen, in der Hoffnung, durch eine andere Einteilung eine bessere „Verteilung” zu erreichen. Stellen wir zunächst die Punkteverteilung mit einem Stabdiagramm dar. Wir sehen nun lediglich, dass keine Punktzahl mehr als einmal erreicht wurde und u.U. Bereiche innerhalb der Daten gehäuft vorkommen. In unserem Beispiel ist dies bei 50 und 60 Punkten der Fall. Diese Häufung muss jedoch nicht bei jeder Verteilung eintreten, es hätte auch eine gleichmäßigere Punkteverteilung der Fall sein können. I.d.R. werden wir aber durch die Darstellung des Stabdiagramms (oder der Häufigkeitstabelle) keinen nennenswerten Informationsgewinn erhalten:

Stabdiagramm der Punkteverteilung
Stabdiagramm der Punkteverteilung

Zur besseren Visualisierung sollten wir die Daten klassieren (= gruppieren). Zunächst muss man hierzu die Merkmalswerte in Klassen einteilen, diese Einteilung ist jedoch oft recht willkürlich. Hierzu teilen wir das Punktespektrum bspw. in fünf gleich breite (= äquidistante) Klassen à 20 Punkte ein und ermitteln die jeweilige Klassenbesetzung bzw. Klassenhäufigkeit, wobei wir für die absolute Klassenhäufigkeit die Notation $\ h_k $ und für die relative $\ f_k $ verwenden (k steht für die Klasse):

Klasse $\ h_k $ absolute Klassenhäufigkeit $\ f_k $ relative Klassenhäufigkeit
[0;20) 4 4/20 = 0,20
[20;40) 1 1/20 = 0,05
[40;60) 4 4/20 = 0,20
[60;80) 6 6/20 = 0,30
[80;100) 5 5/20 = 0,25
$\ \sum $ 20 1

Bei der Klassierung müssen wir die Einteilung der Klassengrenzen beachten. Üblicherweise wählt man die untere Klassengrenze geschlossen und die obere Klassengrenze offen. Dass heißt, die Schreibweise [0;20) bedeutet in der obigen Tabelle, dass die Zahl 0 eingeschlossen ist, die Zahl 20 hingegen nicht. Wir sehen nun, dass z.B. in der ersten Klasse vier Studenten liegen, d.h. zwischen null und zwanzig Punkten geschrieben haben oder sechs Seminarteilnehmer zwischen 60 und 80 Punkte.

Merke

Merke: Es ist auch möglich, die untere Klassengrenze offen und die obere geschlossen zu wählen. Bei stetigen Variablen (z.B. Einkommen) ändert sich hierdurch in den weiteren Berechnungen nichts. Vorsicht ist jedoch, wie im vorliegenden Fall, bei diskreten Variablen geboten. Wenn wir hier nicht aufpassen, welche Klassengrenze offen oder geschlossen ist, verändern sich möglicherweise unsere Ergebnisse. In unserem Beispiel würden jene Personen mit exakt 60 bzw. exakt 80 Punkten in die nächsthöhere Klasse „rutschen” und damit würde sich auch die Klassenbesetzung ändern.

Alternative Schreibweisen für offene und geschlossene Klassengrenzen / Intervalle sind:

  • unten geschlossene und oben offene Klassengrenze / Intervall [...;...) = [...;...[ = (von ... bis unter ...)
  • unten offene und oben geschlossene Klassengrenze / Intervall (...;...] = ]...;...] = (von über ... bis ...)

Weiterhin ist für eine sinnvolle Klassierung wichtig, welche Randwerte man wählt, d.h. wie weit man nach oben (mit der obersten Klasse) und wie weit man nach unten (mit der untersten Klasse) geht.

Lückentext
Ergänzen Sie bitte "rechts", "links" oder "mittleren"
Wenn man als Rohdaten die Zahlen 3,2,3,5,4,3,1,3 hat und diese klassiert ausdrücken möchte mit den Klassen [1,2), [2,3) und [3,6), dann liegen sechs Elemente in der  liegenden Klasse.
0/0
Lösen

Hinweis:

Bitte füllen Sie alle Lücken im Text aus. Möglicherweise sind mehrere Lösungen für eine Lücke möglich. In diesem Fall tragen Sie bitte nur eine Lösung ein.

Kommentare zum Thema: Klassierung und ihre Darstellung

  • Maren Nebeling schrieb am 21.07.2014 um 12:01 Uhr
    Hallo, vielen Dank für den Hinweis. Ich habe die Frage nun überarbeitet. Schöne Grüße.
  • Eugen Fritzler schrieb am 19.07.2014 um 15:26 Uhr
    Schlecht gestellte Frage. Es wäre sinnvoller zu fragen wieviele in der am weitesten rechts liegenden Klasse sind. Stattdessen muss man raten ob da jetzt Zahlen, Elemente, Werte, ... hinkommt.
Bild von Autor Daniel Lambert

Autor: Daniel Lambert

Dieses Dokument Klassierung und ihre Darstellung ist Teil eines interaktiven Online-Kurses zum Thema Deskriptive Statistik.

Dipl.-Math. Dipl.-Kfm. Daniel Lambert gibt seit vielen Jahren Kurse zur Prüfungsvorbereitung. Er unterrichtet stets orientiert an alten Prüfungen und weiß aus langjähriger Erfahrung, wie sich komplexe Sachverhalte am besten aufbereiten und vermitteln lassen. Daniel Lambert ist Repetitor aus Leidenschaft seit nunmehr 20 Jahren.
Vorstellung des Online-Kurses Deskriptive StatistikDeskriptive Statistik
Dieser Inhalt ist Bestandteil des Online-Kurses

Deskriptive Statistik

wiwiweb - Interaktive Online-Kurse (wiwiweb.de)
Diese Themen werden im Kurs behandelt:

[Bitte auf Kapitelüberschriften klicken, um Unterthemen anzuzeigen]

  • Grundbegriffe der deskriptiven Statistik
    • Einleitung
      • Statistische Datenauswertung
      • Merkmal, Merkmalsausprägung und Merkmalsträger
    • Masse und Merkmal
      • Statistische Masse
      • Statistisches Merkmal
    • Skalierungen
      • Grundlagen Skalierung
      • Nominalskala
      • Ordinalskala
      • Metrische Skalen
      • Metrische Skalen - Intervallskala
      • Metrische Skalen - Verhältnisskala
      • Metrische Skalen - Absolutskala
      • Skalenniveau bestimmen
      • Aufgabe Skalierung
      • Lösung Aufgabe Skalierung
    • Skalentransformation
      • Grundlagen Skalentransformation
      • Skalentransformation auf der Nominalskala
      • Skalentransformation auf der Ordinalskala
      • Skalentransformation auf der Kardinalskala
    • Abzählbarkeit
      • Diskrete Merkmale
      • Stetige Merkmale
    • Quasistetige Merkmale und Klassierung
      • Gründe für quasistetige Merkmale
      • Quasistetige Merkmale
      • Klassierung
    • Selbstkontrollaufgabe zu den Grundbegriffen der deskriptiven Statistik
      • Aufgabe Merkmale
      • Lösung Aufgabe Merkmale
  • Häufigkeitsverteilungen
    • Unklassierte Daten und ihre Darstellung
      • Grundlagen der Häufigkeitsverteilung
      • Häufigkeiten
      • Absolute Häufigkeiten
      • Relative Häufigkeit
      • Graphische Darstellung
      • Stabdiagramm oder Säulendiagramm
      • Kreisdiagramm
    • Klassierte Daten und ihre Darstellung
      • Grundlagen Klassierung
      • Klassierung und ihre Darstellung
      • Histogramm
      • Aufgabe Histogramm
      • Lösung Aufgabe Histogramm
      • Häufigkeitspolygon
      • Regeln zur Klassenbildung in der Statistik
    • Empirische Verteilungsfunktion
      • Beispiel und Eigenschaften der Verteilungsfunktion
      • Beispielaufgabe empirische Verteilungsfunktion
    • Selbstkontrollaufgaben zu den Häufigkeitsverteilungen
      • Aufgabe Urliste und Median
      • Lösung Aufgabe Urliste und Median
  • Verteilungsmaße
    • Lagemaße
      • Modus
      • Fraktile
      • Median
      • Boxplot
      • Arithmetisches Mittel
      • Geometrisches Mittel
      • Harmonisches Mittel
      • Zusammenfassung Lagemaße
    • Streuungsmaße
      • Unterschiedliche Streuungsmaße
      • Streuungszerlegung
      • Mittlere quadratische Abweichung berechnen
    • Formmaße
      • Unterschiedliche Formmaße
      • Schiefe
      • Wölbung
  • Konzentrationsmessung
    • Einleitung
      • Konzentrationsmaße
    • Relative Konzentration
      • Übersicht relative Konzentration
      • Lorenzkurve
      • Gini-Koeffizient
      • Länge der Lorenzkurve
      • Concentration-Ratio
    • Absolute Konzentration
      • Übersicht absolute Konzentration
      • Absolute Konzentrationskurve
      • Herfindahl-Index
      • Exponentialindex
      • Rosenbluth-Index
  • Mehrdimensionale Verteilungen
    • Mehrdimensionale Verteilung - Einführung
    • Gemeinsame Verteilung
    • Randverteilungen
    • Bedingte Verteilungen
    • Unabhängigkeit
    • Beispiel mehrdimensionale Verteilung
  • Zusammenhangsmaße
    • Zusammenhangsmaße auf Nominal- und Ordinalskala
      • Korrelationsanalyse
      • Zusammenhangsmaße auf der Nominalskala
      • Zusammenhangsmaße auf der Ordinalskala
    • Zusammenhangsmaße auf metrischen Skalen
      • Übersicht Zusammenhangsmaße auf metrischen Skalen
      • Bravais-Pearsonscher Korrelationskoeffizient
      • Korrelationskoeffizient von Fechner
  • Zeitreihenanalyse
    • Einleitung
      • Längsschnittdaten und Querschnittdaten
    • Zeitreihenverfahren
      • Verfahren der Zeitreihenanalyse
      • Methode der gleitenden Durchschnitte
      • Exponentielle Glättung
      • Beispiel Methode der Kleinsten Quadrate
      • Methode der Kleinsten Quadrate
      • Exkurs: Linearisierung
      • Methode der Reihenhälften
    • Zeitreihenzerlegung
      • Zeitreihenzerlegung
  • Indexrechnung
    • Grundbegriffe
      • Verhältniszahlen
    • Preisindizes
      • Definition Preisindizes
      • Preisindizes nach Laspeyres und Paasche
      • Indexrechnung mit Preisindizes
    • Mengenindizes
      • Definition Mengenindizes
      • Mengenindizes nach Laspeyres und Paasche
    • Wertindizes
      • Der Wertindex
    • Weitere Indizes
      • Übersicht weitere Indizes
      • Index nach Lowe
      • Fisherscher Idealindex
      • Marshall-Edgeworth-Preisindex
    • Umbasierung und Verkettung von Indizes
      • Die Rundprobe
      • Umbasierung
      • Verkettung
  • 103
  • 27
  • 181
  • 37
einmalig 29,00
umsatzsteuerbefreit gem. § 4 Nr. 21 a bb) UStG
Online-Kurs Top AngebotTrusted Shop

Unsere Nutzer sagen:

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 22.07.2015:
    "gut aufgebaut, gut verständlich"

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 18.10.2014:
    "Man super. Mein Professor hat mich total mit seinen Ausführungen verwirrt, wo doch die Antwort so einfach ist. Vielen Dank Herr Lambert. Ich finde sowieso, dass Sie der Beste sind :o)"

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 01.09.2014:
    "sehr gut erklärt, schnell verständlich. Gute Beispiele!"

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 06.07.2014:
    "Locker flockig an anschaulichen Beispielen ausführlich erklärt."

  • Gute Bewertung für Deskriptive Statistik

    Ein Kursnutzer am 14.06.2014:
    "Perfekt erklärt, danke!!!"

NEU! Sichere dir jetzt die perfekte Prüfungsvorbereitung und spare 10% bei deiner Kursbuchung!

10% Coupon: lernen10

Zu den Online-Kursen