ZU DEN KURSEN!

Deskriptive Statistik - Mehrdimensionale Verteilung - Einführung

Kursangebot | Deskriptive Statistik | Mehrdimensionale Verteilung - Einführung

Deskriptive Statistik

Mehrdimensionale Verteilung - Einführung

Das folgende Kapitel beschäftigt sich mit mehrdimensionalen Verteilungen.

Es werden nun zwei oder mehr Verteilungen gleichzeitig betrachtet. Wenn genau zwei Merkmale X und Y mit ihren jeweiligen Merkmalsausprägungen $\ a_i $ (für X) und $\ b_j $ (für Y) betrachtet werden, dann lässt sich dies zweidimensional, d.h. in einer Tabelle, darstellen. Bei zwei nominalskalierten Merkmalen spricht man hierbei von Kontingenztabellen, bei zwei ordinal- oder kardinalskalierten Merkmalen eher von Korrelationstabellen. Eine solche Tabelle sieht allgemein folgendermaßen aus:

Ausprägungen Merkmal X Ausprägungen Merkmal Y Randhäufigkeit
b1 b2 bl
$\ a_1 $ $\ h_{11} $ $\ h_{12} $ $\ h_{1l} $ $\ h_{1.} $
$\ a_2 $ $\ h_{21} $ $\ h_{22} $ $\ h_{2l} $ $\ h_{2.} $
$\ a_k $ $\ h_{k1} $ $\ h_{k2} $ $\ h_{kl} $ $\ h_{k.} $
Randhäufigkeit $\ h_{.1} $ $\ h_{.2} $ $\ h_{.l} $ $\ 1 $

Wir haben in diese Tabelle relative Häufigkeiten $\ h_{ij} $ eingetragen (man könnte aber auch, analog hierzu, genau so gut eine gesamte Tabelle mit absoluten Häufigkeiten $\ H_{ij} $ aufstellen). Der vordere Index $\ i $ in $\ h_{ij} $ mit $\ i = 1, …, k $ und $\ j = 1,…,l $ ist der Zeilenindex und damit die i. Ausprägung des Merkmals X. Entsprechend bezeichnet $\ j $ den Spaltenindex, also die Merkmalsausprägung von Y. Zur Spaltensumme ist zu sagen, dass z.B. $\ h_{2.} $ die Randhäufigkeit von $\ a_2 $ angibt – über alle Ausprägungen von Y aufsummiert.
Die Häufigkeit $\ „h_{2.}” $ gibt also lediglich an,

  • dass in der zweiten Zeile (denn der Zeilenindex, also die vorne stehende Zahl, ist gleich „2”)
  • aufsummiert wird (denn der Punkt „•” gibt gerade an, dass keine einzelne Spalte herausgegriffen wird, sondern vielmehr alle Spalten aufsummiert werden)

Zum besseren Verständnis betrachten wir konkretes Zahlenmaterial.

Beispiel mehrdimensionale Verteilung

Beispiel

Beispiel 49:
Eine Befragung unter 100 Studenten bzgl. der Religionszugehörigkeit und der Studienrichtung ergibt folgendes Ergebnis:

  BWL Jura Medizin Anglistik
katholisch 10 12 6 18
evangelisch 8 3 18 9
muslimisch 7 6 2 1

Stelle die Häufigkeitsverteilung dar. Gehe dabei ein auf die Begriffe

  • gemeinsame Verteilung,
  • Randverteilung,
  • bedingte Verteilung,
  • Unabhängigkeit.

Bei ein- und demselben Studenten wird also das Merkmal Studienrichtung X und Religionszugehörigkeit Y gemessen.