ZU DEN KURSEN!

Deskriptive Statistik - Beispiel und Eigenschaften der Verteilungsfunktion

Kursangebot | Deskriptive Statistik | Beispiel und Eigenschaften der Verteilungsfunktion

Deskriptive Statistik

Beispiel und Eigenschaften der Verteilungsfunktion

wiwiweb JETZT WEITER LERNEN!

Weitere Lernvideos sowie zahlreiche Materialien erwarten dich:
Komplettpaket für wiwi-Studenten


1715 Lerntexte mit den besten Erklärungen

399 weitere Lernvideos von unseren erfahrenen Dozenten

3836 Übungen zum Trainieren der Inhalte

2242 informative und einprägsame Abbildungen

Oftmals möchte man aber gar nicht wissen wie viele Beobachtungswerte eine gewisse Merkmalsausprägung hat, vielmehr wie viele Beobachtungen oberhalb oder unterhalb einer bestimmten Merkmalsausprägung liegen. Dazu müssen die absoluten oder relativen Häufigkeiten bis zum gesuchten Beobachtungswert aufaddiert werden. Es ergibt sich die absolute Häufigkeitsverteilungen H(x) sowie die empirische Verteilungsfunktion F(x).

 

Betrachten wir erneut die Spielerbewertung aus unserem Beispiel 24. Dort war die Frage bislang, wie viele Spieler wurden bspw. mit einer drei bewertet, allerdings könnten wir auch fragen:

Beispiel

Hier klicken zum Ausklappen

Beispiel 28:

Wie viele Spieler wurden mindestens mit einer Drei benotet? Gib den relativen Anteil an.

Dies führt uns auf die absolute bzw. relative kumulierte Häufigkeitsverteilung. Hierbei werden die absoluten oder relativen Häufigkeiten bis zum gesuchten Beobachtungswert aufsummiert. Formal stellt sich dies wie folgt dar:

$\ H(x)= \sum\nolimits_{a_j \leq x} ha_j $  absolute Häufigkeitsverteilung

sowie

$\ F(x)= \sum\nolimits_{a_j \leq x} fa_j $ empirische Verteilungsfunktion (=relative Häufigkeitsverteilung)

Bezogen auf unser Beispiel, der Anzahl der bestandenen Klausuren, bedeutet dies:

-

Hier klicken zum Ausklappen

Beispiel 29:

Berechne den Wert der empirischen Verteilungsfunktion an der Stelle 3 und interpretiere ihn.

$\ F(3)=\sum\nolimits_{a_j \leq 3} f(a_j)=f(a_1)+f(a_2)+f(a_3)= 0,133 + 0,2 + 0,267 = 0,6 $

Somit wurden 9 Fußballprofis bzw. 60 % der Fußballprofis mindesten mit einer drei bewertet. Zusammengefasst lassen sich die Häufigkeiten auch darstellen:

Note $\ a_j $ $\ h(a_j)   $ $\ H(a_j)   $ $\ f(a_j)   $ $\ F(a_j)   $
1220,1330,133
2350,20,333
3490,2670,6
43120,20,8
52140,1330,933
61150,0671
$ \sum $15 / 1 /

Stellt man dies grafisch dar, so erhält man eine monoton steigende Treppenfunktion, die an den realisierten Merkmalsausprägungen ja gerade um ihre absolute bzw. relative Häufigkeit springt. Das liegt darin begründet, dass die Werte zwischen den Ausprägungen nicht existieren bzw. nicht realisiert wurden. Z.B. die Anzahl der Spieler, die mindestens mit einer 2,5 bewertet wurden, genau gleich ist mit denen, die genau mit 2 bewertet wurden. Die Note 2,5 gibt es in unserem Beispiel nicht.

Kumulierte Häufigkeitsverteilungen
Abb.16: Kumulierte Häufigkeitsverteilungen

Eigenschaften der Verteilungsfunktion und der Häufigkeitsverteilung

Man beachte folgende Eigenschaften der Häufigkeitsverteilungen H(x) bzw. Verteilungsfunktion F(x):

Hinweis

Hier klicken zum Ausklappen
  1. Sie sind rechtsseitig stetig.

  2. F oder  H verlaufen x gegen „minus unendlich” gegen Null. Mit anderen Worten, unterhalb der kleinsten (realisierten) Ausprägung ist die Häufigkeitsverteilung immer gleich Null:

    $ \lim_{x \to - \infty} F(x) = 0 $ bzw. $\lim_{x \to - \infty} H(x) = 0 $

  3. F (oder H) verläuft x gegen unendlich gegen 1 (gegen n), also ab der größtmöglichen (realisierten) Ausprägung entspricht die Häufigkeitsverteilung immer 100 % bzw. dem Stichprobenumfang n

    $\lim_{x \to \infty} F(x) = 1 $ bzw. $\lim_{x \to \infty} H(x) = n $

  4. F oder H sind monoton steigend, also aus $x_1$