Eine sehr wichtige Funktion in SPSS ist die Berechnung von Häufigkeiten. Bei nahezu jeder statistischen Auswertung kommt diese Funktion zum Tragen und bietet in der Regel schon einen guten Überblick über die Kennziffern des Datensatzes.
Kennzahlen | Fälle zusammenfassen | Deskriptive Statistiken | Häufigkeiten | Explorative Datenanalyse |
Mittelwert | X | X | X | X |
Summe | X | X | X |
|
Median | X |
| X | X |
Gruppierter Median | X |
| X |
|
Quartile |
|
| X |
|
Perzentile |
|
| X | X |
Modus |
|
| X |
|
Standardabweichung | X | X | X | X |
Varianz | X | X | X | X |
Standardfehler | X | X | X | X |
Minimum | X | X | X | X |
Maximum | X | X | X | X |
Spannweite | X | X | X | X |
Quartilsabstand |
|
|
| X |
Kurtosis | X | X | X | X |
Standardfehler der Kurtosis | X | X | X | X |
Schiefe | X | X | X | X |
Standardfehler der Schiefe | X | X | X | X |
Konfidenzintervall |
|
|
| X |
Harmonisches Mittel | X |
|
|
|
Geometrisches Mittel | X |
|
|
|
M-Schätzer |
|
|
| X |
Ausreißer |
|
|
| X |
Gestutzter Mittelwert |
|
|
| X |
(Die rot und dick markierten Kennzahlen schauen wir uns in diesem Kapitel an)
Zur Auffrischung Ihres Wissens hier ein paar Erklärungen und Formeln:
Perzentilwerte
- Quartile
Bei den Quartilen handelt es sich um 4 gleich große Gruppen, in die die Daten eingeteilt werden.
Die Quartile sagen hierbei folgendes aus:
Merke
- $\ x_{0,25} $ ist das untere Quartil, hier sind 25 % der Werte erreicht oder gerade eben überschritten,
- $\ x_{0,75} $ ist das obere Quartil, hier sind 75 % der Werte erreicht oder gerade eben überschritten.
- Trennwerte für x gleiche Gruppen
Bei dieser Funktion werden die Daten in die entsprechenden „x“ Gruppen eingeteilt.
- Perzentile
Hier kann man beliebige Prozentwerte angeben, in welche SPSS dann einteilt.
Bei klassierten Daten gibt es darüber hinaus eine Möglichkeit, Fraktile zu berechnen. Durch lineare Interpolation ergibt sich dabei folgendes:
$$\ x_{\alpha} = x_{k-1}^\rightarrow + {{x_{k}^\rightarrow - x_{k-1}^\rightarrow} \over f(x_k)} \cdot (\alpha-F(x_{k-1}^*))$$
Für eine genauere Erläuterung hierzu verweisen wir auf unseren Kurs zur deskriptiven Statistik.
Lagemaße
Auch die Lagemaße sollten Ihnen bekannt sein. Dennoch auch hierzu noch einmal eine kurze Zusammenfassung:
- Mittelwert
Merke
Der Mittelwert (oder auch arithmetisches Mittel) ist wie folgt definiert:
$$\ \overline x={1 \over n} \sum_{i=1}^n x_i $$
- Median
Der Median ist ein spezielles Fraktil und wie folgt definiert:
Merke
$\ x_{0,5} = x_{(n+1)\over 2} $, wenn n ungerade ist, und
$\ x_{0,5}= {1 \over 2} \cdot x_{n \over 2} + x_{{n\over 2}+1} $, wenn n gerade ist.
- Modalwert
Merke
Der Modus bzw. Modalwert ist der häufigste Wert einer gegebenen Verteilung.
- Summe
$$ Summe= \sum_{i=1}^n x_i $$
Streuungsmaße
- Minimum
Das Minimum ist die kleinste Ausprägung einer Variablen aller Fälle.
- Maximum
Das Maximum ist die größte Ausprägung einer Variablen aller Fälle.
- Bereich
Der Bereich ist definiert als Differenz zwischen der größten und der kleinsten Ausprägung.
- Standardfehler Mittelwert
Der Standardfehler des Mittelwerts beträgt $$\ \Sigma (\overline x)= {\Sigma \over n} x_i $$
- Varianz
Die Varianz ist die mittlere quadratische Abweichung
$$\ s^2= {1 \over n} \sum_{i=1}^n (x_i- \overline x)^2 $$
- Standardabweichung
Die Standardabweichung ist die Wurzel der Varianz
$$\ s= \sqrt {s^2} $$
Verteilungsmaße
- Schiefe
Die Schiefe sieht man sehr gut an einem Stabdiagramm, das zwar ein Maximum hat, welches aber nicht in der Mitte liegt. Man spricht von rechtsschiefen (= linkssteilen) Verteilungen,wenn sie nach rechts weiter auslaufen als nach links. Wenn die Verteilung hingegen weiter nach links ausläuft als nach rechts, redet man von linksschiefen (= rechtssteilen) Verteilungen.
Momente in der Statistik
Um ein Schiefemaß zu entwickeln, benötigen wir zunächst den Begriff der Momente. Unter dem k-ten Moment der Verteilung x um den Wert a versteht man die Zahl $$\ m_k(a)={1 \over n} \sum_{i=1}^n (x_i-a)^k $$
Es gilt:
- Momente mit $\ a = 0 $ bezeichnet man als gewöhnliche Momente
- Momente mit $\ a= \overline x $, also in Bezug auf das arithmetische Mittel, werden zentrale Momente genannt.
- Das arithmetische Mittel $\ \overline x={1 \over n} \sum_{i=1}^n x_i={1 \over n} \sum_{i=1}^n (x_i-0)^1 $ ist wegen $\ a = 0 $ und $\ k = 1 $ das 1. gewöhnliche Moment.
- Die mittlere quadratische Abweichung $\ s^2={1 \over n} \sum_{i=1}^n (x_i-\overline x)^2 $ ist wegen $\ a= \overline x $ und $\ k = 2 $ das 2.zentrale Moment.
Es existieren unterschiedliche Maße bzw. Regeln für die Schiefe einer Verteilung, nämlich
- die Momentschiefe,
- die Quartilsschiefe und
- die Fechnersche Lageregel
Momentschiefe
Die Momentschiefe $\ u_M $ ist
$$\ u_M = {m_3(0) \over s^3} = {\sum_{i=1}^n (x_i - \overline x)^3 \over {n \cdot s^3 }}= {{\sum_{j=1}^k (a_j- \overline x)^3 \cdot h(a_j)} \over {n \cdot s^3}} $$
Man dividiert also das 3. gewöhnliche Moment durch die dritte Potenz der Standardabweichung.
- $\ u_M > 0 $ heißt, dass die Verteilung rechtsschief ist,
- $\ u_M < 0 $ heißt, dass die Verteilung linksschief ist
Quartilsschiefe
Die Quartilsschiefe $\ u_Q $ liest sich als $$\ u_Q={(x_{0,75}-x_{0,5})-(x_{0,5}-x_{0,25}) \over (x_{0,75}-x_{0,25})} $$
Man berechnet die Differenz aus dem Abstand zwischen dem oberen Quartil und dem Median, d.h. $\ x_{0,75} – x_{0,5} $, sowie aus dem Median und dem unteren Quartil, also $\ x_{0,5} – x_{0,25} $. Diesen Abstand dividiert man durch den Quartilsabstand $\ x_{0,75} – x_{0,25} $. Bei rechtsschiefen Verteilungen liegt das erste Quartil $\ x_{0,25} $ näher am Median $\ x_{0,5} $ als das obere Quartil $\ x_{0,75} $. Dies bedeutet, dass die Differenz $\ x_{0,5} – x_{0,25} $ kleiner sein wird als die Differenz $\ x_{0,75} – x_{0,5} $. Daher ist die Differenz dieser beiden Differenzen dann positiv. Also
- $\ u_Q > 0 $ bedeutet, dass die Verteilung rechtsschief ist
- $\ u_Q < 0 $ bedeutet, dass die Verteilung linksschief ist
Merke: Die Quartilsschiefe $\ u_Q $ liegt stets zwischen –1 und 1, also $\ -1 \leq u_Q \leq 1 $
Fechnersche Lageregel
Nach der Fechnerschen Lageregel ist eine Verteilung rechtsschief, wenn gilt, dass der Modus kleiner als der Median ist und dieser wiederum kleiner als das arithmetische Mittel ist: $\ x_{Modus} < x_{0,5} < \overline x $. Andernfalls ist sie linksschief, d.h. wenn gilt $\ x_{Modus} > x_{0,5} > \overline x $.
Beispiel Schiefekennzahlen
Beispiel: Um die Schiefekennzahlen besser zu verstehen, gehen wir auf die Bearbeitungszeiten der Statistik-Klausur aus einer vorherigen Aufgabe zurück.
Zunächst berechnet man – für die Quartilsschiefe – den Median $\ x_{0,5} = 8 $, das untere Quartil $\ x_{0,25} = 3 $ und das obere Quartil $\ x_{0,75} = 9 $. Damit ist die Quartilsschiefe $$\ u_Q={(x_{0,75}-x_{0,5})-(x_{0,5}-x_{0,25}) \over (x_{0,75}-x_{0,25})}={(9-8)-(8-3) \over (9-3)}=-0,67 <0 $$
Die Momentschiefe ist hingegen etwas mühsamer zu berechnen: $$\ u_m={{\sum_{j=1}^k (a_j- \overline x)^3 \cdot h(a_j)} \over {n \cdot s^3}} ={(1-7)^3+(2-7)^3 \cdot 3+...+(12-7)^3 \over {20 \cdot \sqrt {12^3}}} =-0,3536 <0 $$
Beide Kennzahlen deuten also auf eine linksschiefe Verteilung hin.
Merke: Die Schiefekennzahlen $\ u_Q $ und $\ u_M $ sind nicht frei von Fehlern. Es kann durchaus vorkommen, dass $\ u_Q 0 $ ist und man daher meint, die selbe Verteilung sei doch rechtsschief.
Berechnung der Wölbung (Kurtosis)
Maßzahlen für die Wölbung sind das
- Momentenwölbungsmaß und das
- Quartilswölbungsmaß.
Das Momentenwölbungsmaß $\ w_M $ ist definiert als
$$\ w_M = {m_4 \overline x \over {n \cdot s^4}}- 3 = {\sum_{i=1}^n (x_i- \overline x)^4 \over (\sum_{i=1}^n (x_i- \overline x)^2)^2} -3 $$
Hier ist für eine Beispielberechnung: $\ w_M = {(1-7)^4+(2-7)^4+...+(12-7)^4) \over [(1-7)^2+(2-7)^2+...+(12-7)^2 ]^2} -3= - 2,909 $.
Es gilt die Regel:
- $\ w_M < 0 $ bedeutet, dass die Verteilung flacher ist als die der Glockenkurve der Normalverteilung
- $\ w_M > 0 $ heißt, dass die Verteilung spitzer ist als jene der Glockenkurve der Normalverteilung
Merke: Die Kennzahl $\ w_M $ liegt im Bereich zwischen –2 und + $\ \infty $, also $\ –2 < w_M < + \infty $.
Das Quartilswölbungsmaß $\ w_Q $ bezeichnet man durch $$\ w_Q= {1-(x_{0,75}-x_{0,25}) \over x_{0,8}-x_{0,2}} $$ Für das vorliegende Beispiel erhält man $\ w_Q = {1 -(9-3) \over (10-2)}= 0,25 $.
Merke:
- Das Quartilswölbungsmaß liegt zwischen 0 und 1: $\ 0 \leq w_q \leq 1 $
- Für die Normalverteilung ist $\ w_Q $ ca. bei 0,2, diese Zahl wird als Referenzwert benutzt.
Damit entwickelt man als Regel: Wenn $\ w_Q $ größer als 0,2 ausfällt, dann ist die zugrunde liegende Verteilung stärker gewölbt als jene der Normalverteilung – andernfalls ist sie flacher. Der Quartilsabstand $\ x_{0,75} – x_{0,25} $ und der Quintilsabstand $\ x_{0,8} – x_{0,2} $ liegen enger beieinander, wenn die Enden der Verteilung stärker besetzt sind.
Weitere interessante Inhalte zum Thema
-
Schiefe
Vielleicht ist für Sie auch das Thema Schiefe (Verteilungsmaße) aus unserem Online-Kurs Deskriptive Statistik interessant.
-
Lageparameter
Vielleicht ist für Sie auch das Thema Lageparameter (Eindimensionale Verteilungen (ohne Namen)) aus unserem Online-Kurs Wahrscheinlichkeitsrechnung interessant.