Jetzt neu: Steuerrecht online lernen auf steuerkurse.de!
ZU DEN KURSEN!

Stichprobentheorie - Regressionsrechnung (Regressionsschätzer)

Kursangebot | Stichprobentheorie | Regressionsrechnung (Regressionsschätzer)

Stichprobentheorie

Regressionsrechnung (Regressionsschätzer)

Inhaltsverzeichnis

 

Merke

Hier klicken zum Ausklappen

Da die Sekundärinformation für die Annäherung der Primärinformation nützlich sein kann, wurde diese auch gleichermaßen beim Differenzenschätzer, als auch beim Quotientenschätzer verwendet.

Zur Wiederholung: Beim Quotientenschätzer bedeutet es, dass sich die Größen X und Y annähernd proportional gegenüberstehen.

 

Merke

Hier klicken zum Ausklappen

Im Allgemeinen kann gesagt werden, dass die Sekundärinformation X einen Einfluss auf die für uns relevante Primärfunktion Y hat. Dieser wird durch eine Regression formuliert. Genauer gesagt bedeutetet es, dass anzunehmen sei, dass A + BX als Approximation für Y genutzt werden kann.

Ersichtlich wird das an einem Beispiel:

 

Beispiel

Hier klicken zum Ausklappen

Zur Entscheidung über die Einführung eines innovativen Produkts, soll eine Marktanalyse durchgeführt werden. Diese soll Informationen darüber liefern, inwiefern das innovative Produkt Akzeptanz gewinnen würde, ausgehen von der Betrachtung verschiedener Altersgruppen. Des Weiteren besteht die Annahme, dass das Produkt von Männern anders bewertet wird als von Frauen. Gegeben sind bereits Sekundärinformationen aus den vorliegenden Statistiken des Unternehmens bezüglich der Population. Demnach besteht ein Wissen über die Altersverteilung pro Geschlecht.

Im Rahmen der Umfrage wählt das Unternehmen mittels einer einfachen ZufallsStichprobe zufällig Einzelpersonen aus der Population aus, die in Bezug auf ihre Meinung zu dem Produkt befragt werden.

Im Falle dessen, dass es sich in der Stichprobe um eine andere Verteilung der Alters- und Geschlechtsstruktur handelt, als die in der Population, ist das Stichprobenergebnis dahingehend zu korrigieren. Andernfalls bestehe die Gefahr, dass der Männeranteil in der Stichprobe höher ausfallen könnte, als der Männeranteil in der Gesamtbevölkerung. Auch in diesem Fall wäre das Stichprobenergebnis zu korrigieren.

Zugunsten der Simplifizierung wird hier angenommen, dass eine eindimensionale Sekundärinformation X gegeben ist. Gleichermaßen gilt dies auch für den Quotientenschätzer und Differenzenschätzer.

Daraus würden sich die folgenden Gesetzmäßigkeiten ergeben:

Regressionsschätzer

 

Gegeben sind die Sekundärinformationen $x_1,...,x_n$ und die Primärinformationen $y_1,...,y_n$ zu einer einfachen Zufallsstichprobe.

Gegeben ist der der Mittelwert $\overline X$ des Sekundärmekmals in der Grundgesamtheit.

Es liegt für den Mittelwert der Regressionsschätzer vor durch:
$\hat{\overline Y}_{\mathit{REG}}=\overline y+\hat B(\overline X-\overline x),$

allerdings

$\hat B=\frac{\sum _{i=1}^n(x_i-\overline x)(y_i-\overline y)}{\sum _{i=1}^n(x_i-\overline x)^2}=\frac{S_{\mathit{XY}}}{S_X^2}.$

Für die Schätzung der Varianz von $\hat{\overline Y}_{\mathit{REG}}$ gilt:

$\hat{\mathit{VAR}\left(\hat{\overline Y}_{\mathit{REG}}\right)}=\frac{N-n} N\frac 1{n(n-2)}\sum _{i=1}^n\left[(y_i-\overline y)-\hat B(x_i-\overline x)\right]^2.$

Veranschaulicht wird dies anhand eines praktischen Beispiels:

 

Beispiel

Hier klicken zum Ausklappen

Im Rahmen des BWL Studium informiert ein Dozent in den Einführungskursen der Statistik die Studierenden darüber, worum es genau in dieser Veranstaltung geht. Um es möglichst praktisch zu veranschaulichen, fragt der Dozent die Studierenden, ob sie Auskunft darüber geben würden, wie viel Geld sie dabei haben. Nachdem alle die Frage bejahten, wird der Versuch gestartet. Im Fokus der Ermittlung steht, wie viel Geld die Studierenden im Durchschnitt bei sich haben.
Dazu werden zunächst einmal Sekundärinformationen gesammelt. Diese ergeben sich dadurch, dass die Studierenden dazu aufgefordert werden, die Geldmenge, die sie dabei haben, zu schätzen, ohne nachzuschauen. Notiert werden die gesammelten Daten mit $X_i$.

Daraus ergeben sich die folgenden Werte:

$X_i$

$\overline X=\frac 1{13}\sum _{i=1}^{13}X_i$

25

28,15

35

28,15

15

28,15

21

28,15

45

28,15

10

28,15

19

28,15

5

28,15

4

28,15

3

28,15

60

28,15

58

28,15

66

28,15

Im Anschluss erhält jeder der Studierenden eine Nummer zwischen eins und dreizehn. Diese dienen der Erstellung einer Populationsliste. Daraus werden zehn Studierende (Elemente) gezogen. Die zehn gezogenen Studierenden geben dann eine genaue Auskunft über die Geldmenge $y_i$ in ihrem eigenen Geldbeutel, das sie vorher zählen durften. Diese Angaben entsprechen der Primärinformation $y_i,i=1,…,10.$ , wodurch die Sekundärinformation von $x_i=1,…,10$ komplementiert wird.

$x_i$

$y_i$

$\overline x$

$\overline y$

25

10,48

25,10

36,36

35

50,54

25,1

36,36

15

30,12

25,1

36,36

21

25,1

25,1

36,36

58

58,55

25,1

36,36

66

70

25,1

36,36

19

60,23

25,1

36,36

5

20,54

25,1

36,36

4

28

25,1

36,36

3

10

25,1

36,36

Zu Berechnen ist nun der Regressionsschätzer:

Es ist $S_x^2=\frac 1{10-1}\sum _{i=1}^{10}(x_i-\overline x)^2=\frac 1 9\left((25-25,1)^2+(35-25,1)^2+...+(3-25,1)^2\right)=482,99$

und $S_{\mathit{xy}}=\frac 1 9\sum _{i=1}^{10}\left((x_i-\overline x)(y_i-\overline y)\right)=\frac 1 9\left((25-25,1)(50,54-36,36)+...+(3-25,1)(10-36,36)\right)=365,49.$

Demnach ist $\hat B=\frac{S_{\mathit{XY}}}{S_X^2}=\frac{365,49}{482,99}=0,757.$

Der Regressionsschätzer kann nun ermittelt werden:

$\hat{\overline Y}_{\mathit{REG}}=\overline y+\hat B(\overline X-\overline x)=36,36+0,7517(28,15-25,1)=38,67.$