ZU DEN KURSEN!

SPSS Statistik-Software - Fälle zusammenfassen

Kursangebot | SPSS Statistik-Software | Fälle zusammenfassen

SPSS Statistik-Software

Fälle zusammenfassen

Kennzahlen

Fälle zusammenfassen

Deskriptive Statistiken

Häufigkeiten

Explorative Datenanalyse

Mittelwert

X

X

X

X

Summe

X

X

X

 

Median

X

 

X

X

Gruppierter Median

X

 

X

 

Quartile

 

 

X

 

Perzentile

 

 

X

X

Modus

 

 

X

 

Standardabweichung

X

X

X

X

Varianz

X

X

X

X

Standardfehler

X

X

X

X

Minimum

X

X

X

X

Maximum

X

X

X

X

Spannweite

X

X

X

X

Quartilsabstand

 

 

 

X

Kurtosis

X

X

X

X

Standardfehler  der Kurtosis

X

X

X

X

Schiefe

X

X

X

X

Standardfehler  der Schiefe

X

X

X

X

Konfidenzintervall

 

 

 

X

Harmonisches Mittel

X

 

 

 

Geometrisches Mittel

X

 

 

 

M-Schätzer

 

 

 

X

Ausreißer

 

 

 

X

Gestutzter Mittelwert

 

 

 

X

(Die rot und dick markierten Kennzahlen schauen wir uns in diesem Kapitel an)

Die Funktion „Fallzusammenfassung“  ist eine weitere Möglichkeit von SPSS, sich Kennziffern anzeigen zu lassen. Hierbei gibt es die zusätzliche Option, sich die Fälle im Ausgabenviewer mit ausgeben zu lassen. Das kann vorteilhaft sein, wenn man diese Ergebnisse inklusive der Fälle exportieren möchte. Folgendermaßen würde das dann aussehen:

Fälle zusammenfassen
Fälle zusammenfassen

Es ist möglich, die Variablen zu gruppieren und z.B. nach männlich und weiblich zu differenzieren. Was genau das ist, lernen wir in einem späteren Kapitel. Behalten Sie nur im Hinterkopf, dass es durchaus auch möglich ist, über diese Funktion eine Gruppierung vorzunehmen.

Nachdem die zu analysierenden Variablen ausgewählt wurden, sollte man noch die Statistiken wählen:

Einstellungen
Einstellungen

Hier ist eine Vielzahl von statistischen Kennzahlen berechenbar, wir wollen uns aber nur jene anschauen, die für uns „neu“ sind.

Harmonisches Mittel

Bestehen die Merkmalswerte aus Brüchen, verwendet man das harmonische Mittel, wenn der Zähler oder der Nenner nicht gegeben sind.

Beispiel 1

Der Student D fährt mit seinem neuen Auto eines namhaften süddeutschen Autobauers die folgenden Strecken mit den gegebenen Geschwindigkeiten:

Strecke 1 2 3 4
Distanz100 km140 km50 km150 km
Geschwindigkeit50 km/h100 km/h80 km/h150 km/h

Wie lange hat er insgesamt gebraucht? Mit welcher Durchschnittsgeschwindigkeit ist er insgesamt gefahren?
Der Begriff Geschwindigkeit ist definiert als Weg s pro Zeit t, d.h. in Buchstaben $\ v = {s \over t} $ . Man errechnet, dass der Student D folgende Zeiten auf den einzelnen Strecken benötigt hat:

Strecke 1 2 3 4
Zeit2 h1,4 h0,625 h1 h

So ist er z.B. auf Strecke 2 die Distanz von 140 km mit 100 km/h gefahren, hat also
$\ {140km \over 100km/h} = 1,4kmh/km = 1,4h $
benötigt. Insgesamt war er also 5,025 h unterwegs. Bezogen auf eine Distanz von 440 km bedeutet dies, dass er eine Durchschnittsgeschwindigkeit von $\ {440km \over 5,025h} =87,55622 $ km/h hatte.

Beispiel 2

Besagter Student gibt nun lediglich an, wie lange er für die einzelnen Strecken brauchte und mit welcher Geschwindigkeit er fuhr, nicht aber, wie lange die Distanz war:

Strecke 5 6 7 8
Zeit1,5 h2 h1 h0,6 h
Geschwindigkeit120 km/h100 km/h80 km/h110 km/h

Welche Strecke ist er insgesamt gefahren? Mit welcher Durchschnittsgeschwindigkeit fuhr er?
Wir berechnen zunächst die Distanzen der einzelnen Strecken, so ist z.B. der Weg 8 insgesamt $\ {110 km/h \cdot 0,6h} = 66 $ km lang.

Strecke

5

6

7

8

Distanz

180 km

200 km

80 km

66 km

Insgesamt fuhr der Student also 526 km in einer Zeit von 5,1 Stunden. Das ergibt eine Durchschnittsgeschwindigkeit von $\ \overline v = {526 \over 5,1} = 103,137 $ km/h.

Formel harmonisches Mittel

Wenn man also das Mittel aus Brüchen $\ {a_i \over b_i} $ ausrechnen möchte, ist die direkte Methode, den gesamten Zähler und den gesamten Nenner zu berechnen, durch die Formel „Mittelwert bei direkter Methode“
$$\ \overline v ={\sum_{i=1}^n a_i \over \sum_{i=1}^n b_i} $$
gegeben. Genau dies haben wir gemacht. Im ersten Beispiel waren die Nenner $\ b_i $, also die Zeiten, nicht gegeben, im zweiten Beispiel waren die Zähler $\ a_i $ unbekannt, nämlich die Distanzen. Beide wurden zunächst berechnet, um dann den Mittelwert zu berechnen. Es gibt aber auch eine indirekte Methode, mit der nicht zunächst Zähler oder Nenner ausgerechnet werden müssen. Diese Methode nennen wir harmonisches Mittel $\ \overline x _h $.

Expertentipp

Hier klicken zum Ausklappen

Mittelwerte bei Brüchen:
Gegeben seien die Beziehungszahlen $\ x_i ={a_i \over b_i} $.
Wir berechnen das Mittel aus diesen Werten

  • wenn die einzelnen Nenner $\ b_i $ unbekannt sind durch: $$\ \overline x_h= { \sum_{i=1}^n a_i \over \sum_{i=1}^n {a_i \over x_i}} $$
  • wenn die einzelnen Zähler $\ a_i $ unbekannt sind durch: $$\ \overline x_h={\sum_{i=1}^n x_i \cdot b_i \over \sum_{i=1}^n b_i} $$

Angewendet auf die o.e. Beispiele errechnet man für das Beispiel 1:
$$\ \begin{align} \overline x_h & ={(100km+140km+50km+150km) \over {100km \over 50 km/h} + {140km \over 100 km/h} + {50km \over 80 km/h}+ {150km \over 150 km/h}} \\ & = {440km \over (2h+1,4h+0,625h+1h)} \\ & = {440km \over 5,025h} \\ & = 87,562 km/h \end{align} $$ und für das Beispiel 41:
$$\ \begin{align} \overline x_h & ={{120km/h \cdot 1,5h} + {100km/h \cdot 2h}+{80km/h \cdot 1h}+{110km/h \cdot 0,6h} \over (1,5h+2h+1h+0,6h)} \\ & = {180km+200km+80km+66km) \over 5,1h} \\ & ={526km \over 5,1h} =103,137 km/h \end{align} $$ Durch das ausführliche Aufschreiben sieht man, dass die indirekte Methode, also das Rechnen mit dem harmonischen Mittel, in Wahrheit nichts anderes ist als die direkte, nämlich das Ausrechnen entweder des Zählers oder des Nenners.
Oftmals schreibt man die Formel für das harmonische Mittel folgendermaßen: $$\ \overline x_H= {n \over \sum_{i=1}^k {m_i \over x_i}} $$ bzw. $$\ \overline x_H= {1 \over \sum_{i=1}^k {h_i \over x_i}} $$ Hierbei sind die xi die o.g. Beziehungszahlen, also z.B. die Geschwindigkeitsangaben. Die linke Formel entspricht exakt Methode 1, nämlich das Ausrechnen eines Mittelwertes bei bekanntem Zähler ai, aber unbekanntem Nenner $\ N_i $ . Wenn man hierbei durch n kürzt, erhält man den rechten Ausdruck. Der Parameter $\ h_i $ ist also $\ h_i = {n_i \over n} $ und gibt den jeweiligen Anteil an.
Im Beispiel 1 ist z.B. $\ n = n_1 + n_2 + n_3 + n_4 = 100 + 140 + 50 + 150 = 440 $ [km] und es gilt $\ h_1 = {100 \over 440}= 0,2273,\ h_2 = {140 \over 440}= 0,3182,\ h_3 = 0,1136,\ h_4=0,3409 $. Damit errechnet man das harmonische Mittel als $$\ \overline x_H= {1 \over \sum_{i=1}^k {h_i \over x_i}}= {1 \over {0,2273 \over 50}{0,3182 \over 100}{0,1136 \over 80}{0,3404 \over 150}}={1 \over 0,0114} =87,56km/h $$
also genau das gleiche Ergebnis wie oben.

Mittelwerte und Skalenniveau

Merke

Hier klicken zum AusklappenMerke: Für die Anwendbarkeit des richtigen Mittelwertes ist es entscheidend, wie die Merkmalswerte skaliert sind. Für die einzelnen Skalen listet die folgende Tabelle die passenden Mittelwerte auf.
Skala Lageparameter
NominalskalaModus
OrdinalskalaMedian
Intervallskalaarithmetisches Mittel
Verhältnisskalageometrisches Mittel

Geometrisches Mittel

Wenn Merkmalswerte aus Wachstums- oder Aufzinsungsfaktoren bestehen, die über unterschiedliche Perioden hinweg betrachtet werden, sollte man das geometrische Mittel verwenden.

Zwei Wege gibt es dieses zu berechnen.

Direkter Weg: Man erhält die mittlere Wachstumsrate auf direktem Wege durch die Formel $$\ \overline x_g ( \sqrt [n]{K_n \over K_0} -1 ) \cdot 100 $$

Den indirekten Weg entnehmen Sie bitte unseren weiteren Statistikkursen.

Output

Im Ausgabeviewer gibt SPSS an die beiden folgenden Tabellen aus:

Zusammenfassung der Fallverarbeitung

 

Fälle

Eingeschlossen

Ausgeschlossen

Gesamtsumme

H

Prozent

H

Prozent

H

Prozent

Alter in Jahren

6400

100,0%

0

0,0%

6400

100,0%

.....................

Internetanschluss

6145

96,0%

255

4,0%

6400

100,0%

.....................

Geschlecht

6400

100,0%

0

0,0%

6400

100,0%

 (Die Tabelle wurde gekürzt, um den Kurs besser zu gestalten)

In dieser Tabelle zeigt SPSS, welche Werte bei der Analyse ein- bzw. ausgeschlossen wurden. In der markierten Zeile hat SPSS die Fälle ausgeschlossen.

Zusammenfassung von Fällen

 

H

Geometrisches Mittel

Harmonisches Mittel

Alter in Jahren

6400

40,23

38,37

Verheiratet

6400

,00

.a

Jahre unter der aktuellen Adresse

6400

,00

.a

Haushaltseinkommen in Tausend

6400

49,1248

37,9211

Einkommensklassen in Tausend

6400

2,2774

2,0184

Preis des hauptsächlich genutzten Autos

6400

23,6062

18,7560

Preisklassen des hauptsächlich genutzten Autos

6400

1,8936

1,7113

Schulabschluss

6400

2,29

1,99

Jahre beim aktuellen Arbeitgeber

6400

,00

.a

Verrentung

6400

,00

.a

Jahre beim aktuellen Arbeitgeber in Klassen

6400

1,77

1,60

Zufriedenheit mit der Arbeit

6400

2,69

2,28

Haushaltsgröße

6400

1,95

1,65

Schnurloses Telefon

6400

,00

.a

ISDN-Anschluss

6400

,00

.a

Anrufbeantworter

6400

,00

.a

Funkrufempfangsservice

6400

,00

.a

Internetanschluss

6145

,00

.a

Anruferidentität bekannt

6400

,00

.a

Warteschleife

6400

,00

.a

Fernseher im Haushalt vorhanden

6400

,00

.a

Videorecorder im Haushalt vorhanden

6400

,00

.a

Stereoanlage im Haushalt vorhanden

6400

,00

.a

Palm Pilot im Haushalt vorhanden

6400

,00

.a

Computer im Haushalt vorhanden

6400

,00

.a

Faxgerät im Haushalt vorhanden

6400

,00

.a

Zeitungsabonnement

6400

,00

.a

Antwort

6400

,00

.a

Geschlecht

6400

 

 

a. Die Daten enthalten negative und positive Werte und möglicherweise Nullwerte.

Als Fallzusammenfassung gibt SPSS dann die obige Tabelle aus. Hierbei haben wir allerdings eine Änderung vorgenommen und die Tabelle gedreht.

 Zum besseren Verständnis hier nochmal die Definitionen von IBM:

Merke

Hier klicken zum Ausklappen

„Geometrisches Mittel. Die n-te Wurzel aus dem Produkt der Datenwerte, wobei n der Anzahl der Fälle entspricht.“

„Harmonisches Mittel. Wird verwendet, um die durchschnittliche Gruppengröße zu bestimmen, wenn der Stichprobenumfang in den einzelnen Gruppen unterschiedlich ist. Das harmonische Mittel ist gleich der Gesamtzahl der Stichproben geteilt durch die Summe der reziproken Werte der Stichprobengrößen.“

Wieder ist hier anzumerken, dass SPSS nahezu alles für einen rechnet. Man muss IMMER und bei ALLEM was man macht hinterfragen, wie richtig und sinnig diese Operationen bzw. Rechnungen sind!