ZU DEN KURSEN!

SPSS Statistik-Software - Häufigkeiten

Kursangebot | SPSS Statistik-Software | Häufigkeiten

SPSS Statistik-Software

Häufigkeiten

Eine sehr wichtige Funktion in SPSS ist die Berechnung von Häufigkeiten. Bei nahezu jeder statistischen Auswertung kommt diese Funktion zum Tragen und bietet in der Regel schon einen guten Überblick über die Kennziffern des Datensatzes.

Kennzahlen

Fälle zusammenfassen

Deskriptive Statistiken

Häufigkeiten

Explorative Datenanalyse

Mittelwert

X

X

X

X

Summe

X

X

X

 

Median

X

 

X

X

Gruppierter Median

X

 

X

 

Quartile

 

 

X

 

Perzentile

 

 

X

X

Modus

 

 

X

 

Standardabweichung

X

X

X

X

Varianz

X

X

X

X

Standardfehler

X

X

X

X

Minimum

X

X

X

X

Maximum

X

X

X

X

Spannweite

X

X

X

X

Quartilsabstand

 

 

 

X

Kurtosis

X

X

X

X

Standardfehler  der Kurtosis

X

X

X

X

Schiefe

X

X

X

X

Standardfehler  der Schiefe

X

X

X

X

Konfidenzintervall

 

 

 

X

Harmonisches Mittel

X

 

 

 

Geometrisches Mittel

X

 

 

 

M-Schätzer

 

 

 

X

Ausreißer

 

 

 

X

Gestutzter Mittelwert

 

 

 

X

(Die rot und dick markierten Kennzahlen schauen wir uns in diesem Kapitel an)

Häufigkeiten
Einstellungen
Einstellungen

Zur Auffrischung Ihres Wissens hier ein paar Erklärungen und Formeln:

Perzentilwerte

  • Quartile

Bei den Quartilen handelt es sich um 4 gleich große Gruppen, in die die Daten eingeteilt werden.

Die Quartile sagen hierbei folgendes aus:

Merke

Hier klicken zum Ausklappen
  • $\ x_{0,25} $ ist das untere Quartil, hier sind 25 % der Werte erreicht oder gerade eben überschritten,
  • $\ x_{0,75} $ ist das obere Quartil, hier sind 75 % der Werte erreicht oder gerade eben überschritten.
  • Trennwerte für x gleiche Gruppen

Bei dieser Funktion werden die Daten in die entsprechenden „x“ Gruppen eingeteilt.

  • Perzentile

Hier kann man beliebige Prozentwerte angeben, in welche SPSS dann einteilt.

Bei klassierten Daten gibt es darüber hinaus eine Möglichkeit, Fraktile zu berechnen. Durch lineare Interpolation ergibt sich dabei folgendes:

$$\ x_{\alpha} = x_{k-1}^\rightarrow + {{x_{k}^\rightarrow - x_{k-1}^\rightarrow} \over f(x_k)} \cdot (\alpha-F(x_{k-1}^*))$$

Für eine genauere Erläuterung hierzu verweisen wir auf unseren Kurs zur deskriptiven Statistik.

Lagemaße

Auch die Lagemaße sollten Ihnen bekannt sein. Dennoch auch hierzu noch einmal eine kurze Zusammenfassung:

  • Mittelwert

Merke

Hier klicken zum Ausklappen

Der Mittelwert (oder auch arithmetisches Mittel) ist wie folgt definiert:
 $$\ \overline x={1 \over n} \sum_{i=1}^n x_i $$

 

  • Median

Der Median ist ein spezielles Fraktil und wie folgt definiert:

Merke

Hier klicken zum Ausklappen

$\ x_{0,5} = x_{(n+1)\over 2} $, wenn n ungerade ist, und
$\ x_{0,5}= {1 \over 2} \cdot x_{n \over 2} + x_{{n\over 2}+1} $, wenn n gerade ist.

  • Modalwert

Merke

Hier klicken zum Ausklappen

Der Modus bzw. Modalwert ist der häufigste Wert einer gegebenen Verteilung.

  • Summe

$$ Summe= \sum_{i=1}^n x_i $$

Streuungsmaße

  • Minimum

Das Minimum ist die kleinste Ausprägung einer Variablen aller Fälle.

  • Maximum

Das Maximum ist die  größte Ausprägung einer Variablen aller Fälle.

  • Bereich

Der Bereich ist definiert als Differenz zwischen der größten und der kleinsten Ausprägung.

  • Standardfehler Mittelwert

Der Standardfehler des Mittelwerts beträgt $$\ \Sigma (\overline x)= {\Sigma \over n} x_i $$

  • Varianz

Die Varianz ist die mittlere quadratische Abweichung

$$\ s^2= {1 \over n} \sum_{i=1}^n (x_i- \overline x)^2 $$

  • Standardabweichung

Die Standardabweichung ist die Wurzel der Varianz
$$\ s= \sqrt {s^2} $$

Verteilungsmaße

  • Schiefe

Die Schiefe sieht man sehr gut an einem Stabdiagramm, das zwar ein Maximum hat, welches aber nicht in der Mitte liegt. Man spricht von rechtsschiefen (= linkssteilen) Verteilungen,wenn sie nach rechts weiter auslaufen als nach links. Wenn die Verteilung hingegen weiter nach links ausläuft als nach rechts, redet man von linksschiefen (= rechtssteilen) Verteilungen.

Momente in der Statistik

Um ein Schiefemaß zu entwickeln, benötigen wir zunächst den Begriff der Momente. Unter dem k-ten Moment der Verteilung x um den Wert a versteht man die Zahl $$\ m_k(a)={1 \over n} \sum_{i=1}^n (x_i-a)^k $$

Es gilt:

  • Momente mit $\ a = 0 $ bezeichnet man als gewöhnliche Momente
  • Momente mit $\ a= \overline x $, also in Bezug auf das arithmetische Mittel, werden zentrale Momente genannt.
  • Das arithmetische Mittel $\ \overline x={1 \over n} \sum_{i=1}^n x_i={1 \over n} \sum_{i=1}^n (x_i-0)^1 $ ist wegen $\ a = 0 $ und $\ k = 1 $ das 1. gewöhnliche Moment.
  • Die mittlere quadratische Abweichung $\ s^2={1 \over n} \sum_{i=1}^n (x_i-\overline x)^2 $ ist wegen $\ a= \overline x $ und $\ k = 2 $ das 2.zentrale Moment.

Es existieren unterschiedliche Maße bzw. Regeln für die Schiefe einer Verteilung, nämlich

  • die Momentschiefe,
  • die Quartilsschiefe und
  • die Fechnersche Lageregel

Momentschiefe

Die Momentschiefe $\ u_M $ ist
$$\ u_M = {m_3(0) \over s^3} = {\sum_{i=1}^n (x_i - \overline x)^3 \over {n \cdot s^3 }}= {{\sum_{j=1}^k (a_j- \overline x)^3 \cdot h(a_j)} \over {n \cdot s^3}} $$
Man dividiert also das 3. gewöhnliche Moment durch die dritte Potenz der Standardabweichung.

  • $\ u_M > 0 $ heißt, dass die Verteilung rechtsschief ist,
  • $\ u_M < 0 $ heißt, dass die Verteilung linksschief ist

Quartilsschiefe

Die Quartilsschiefe $\ u_Q $ liest sich als $$\ u_Q={(x_{0,75}-x_{0,5})-(x_{0,5}-x_{0,25}) \over (x_{0,75}-x_{0,25})} $$

Man berechnet die Differenz aus dem Abstand zwischen dem oberen Quartil und dem Median, d.h. $\ x_{0,75} – x_{0,5} $, sowie aus dem Median und dem unteren Quartil, also $\ x_{0,5} – x_{0,25} $. Diesen Abstand dividiert man durch den Quartilsabstand $\ x_{0,75} – x_{0,25} $. Bei rechtsschiefen Verteilungen liegt das erste Quartil $\ x_{0,25} $ näher am Median $\ x_{0,5} $ als das obere Quartil $\ x_{0,75} $. Dies bedeutet, dass die Differenz $\ x_{0,5} – x_{0,25} $ kleiner sein wird als die Differenz $\ x_{0,75} – x_{0,5} $. Daher ist die Differenz dieser beiden Differenzen dann positiv. Also

  • $\ u_Q > 0 $ bedeutet, dass die Verteilung rechtsschief ist
  • $\ u_Q < 0 $ bedeutet, dass die Verteilung linksschief ist

Merke: Die Quartilsschiefe $\ u_Q $ liegt stets zwischen –1 und 1, also $\ -1 \leq u_Q \leq 1 $

Fechnersche Lageregel

Nach der Fechnerschen Lageregel ist eine Verteilung rechtsschief, wenn gilt, dass der Modus kleiner als der Median ist und dieser wiederum kleiner als das arithmetische Mittel ist: $\ x_{Modus} < x_{0,5} < \overline x $. Andernfalls ist sie linksschief, d.h. wenn gilt $\ x_{Modus} > x_{0,5} > \overline x $.

Beispiel Schiefekennzahlen

Beispiel: Um die Schiefekennzahlen besser zu verstehen, gehen wir auf die Bearbeitungszeiten der Statistik-Klausur aus einer vorherigen Aufgabe zurück.

Zunächst berechnet man – für die Quartilsschiefe – den Median $\ x_{0,5} = 8 $, das untere Quartil $\ x_{0,25} = 3 $ und das obere Quartil $\ x_{0,75} = 9 $. Damit ist die Quartilsschiefe $$\ u_Q={(x_{0,75}-x_{0,5})-(x_{0,5}-x_{0,25}) \over (x_{0,75}-x_{0,25})}={(9-8)-(8-3) \over (9-3)}=-0,67 <0 $$

Die Momentschiefe ist hingegen etwas mühsamer zu berechnen: $$\ u_m={{\sum_{j=1}^k (a_j- \overline x)^3 \cdot h(a_j)} \over {n \cdot s^3}} ={(1-7)^3+(2-7)^3 \cdot 3+...+(12-7)^3 \over {20 \cdot \sqrt {12^3}}} =-0,3536 <0 $$

Beide Kennzahlen deuten also auf eine linksschiefe Verteilung hin.

Merke: Die Schiefekennzahlen $\ u_Q $ und $\ u_M $ sind nicht frei von Fehlern. Es kann durchaus vorkommen, dass $\ u_Q 0 $ ist und man daher meint, die selbe Verteilung sei doch rechtsschief.

Berechnung der Wölbung (Kurtosis)

Maßzahlen für die Wölbung sind das

  • Momentenwölbungsmaß und das
  • Quartilswölbungsmaß.

Das Momentenwölbungsmaß $\ w_M $ ist definiert als
$$\ w_M = {m_4 \overline x \over {n \cdot s^4}}- 3 = {\sum_{i=1}^n (x_i- \overline x)^4 \over (\sum_{i=1}^n (x_i- \overline x)^2)^2} -3 $$
Hier ist für eine Beispielberechnung: $\ w_M = {(1-7)^4+(2-7)^4+...+(12-7)^4) \over [(1-7)^2+(2-7)^2+...+(12-7)^2 ]^2} -3= - 2,909 $.

Es gilt die Regel:

  •  $\ w_M < 0 $ bedeutet, dass die Verteilung flacher ist als die der Glockenkurve der Normalverteilung
  • $\ w_M > 0 $ heißt, dass die Verteilung spitzer ist als jene der Glockenkurve der Normalverteilung

Merke: Die Kennzahl $\ w_M $ liegt im Bereich zwischen –2 und +  $\ \infty $, also $\ –2 < w_M < + \infty $.

Das Quartilswölbungsmaß $\ w_Q $ bezeichnet man durch $$\ w_Q= {1-(x_{0,75}-x_{0,25}) \over x_{0,8}-x_{0,2}} $$ Für das vorliegende Beispiel erhält man $\ w_Q = {1 -(9-3) \over (10-2)}= 0,25 $.

Merke:

  • Das Quartilswölbungsmaß liegt zwischen 0 und 1: $\ 0 \leq w_q \leq 1 $
  • Für die Normalverteilung ist $\ w_Q $ ca. bei 0,2, diese Zahl wird als Referenzwert benutzt.

Damit entwickelt man als Regel: Wenn $\ w_Q $ größer als 0,2 ausfällt, dann ist die zugrunde liegende Verteilung stärker gewölbt als jene der Normalverteilung – andernfalls ist sie flacher. Der Quartilsabstand $\ x_{0,75} – x_{0,25} $ und der Quintilsabstand $\ x_{0,8} – x_{0,2} $ liegen enger beieinander, wenn die Enden der Verteilung stärker besetzt sind.