Kursangebot | | Stichprobenverfahren und Darstellung der Messwerte

Stichprobenverfahren und Darstellung der Messwerte

01. Wie erfolgt die Aufbereitung von Messstichproben?

Mithilfe der Stichprobentheorie lässt sich von Teilgesamtheiten (z. B. einer Stichprobe) auf Grundgesamtheiten schließen. Die Verdichtung der Daten erfolgt durch die Berechnung von Maßzahlen. Entsprechend dem Rahmenplan werden hier folgende Parameter behandelt:

imported

Bei der nachfolgenden Darstellung und Berechnung werden folgende allgemein üblichen Symbole und Zeichen verwendet (im Allgemeinen benutzt man bei der Kennzeichnung von Maßzahlen der Grundgesamtheit griechische und bei der Kennzeichnung von Maßzahlen der Stichprobe lateinische Buchstaben):

xialle Messwerte/Merkmalsausprägungen der Urliste/Stichprobe (i = 1, …, n)
xjdie verschiedenen Messwerte/Merkmalsausprägungen der Urliste/Stichprobe (j = 1, …, r)
μMittelwert der Grundgesamtheit
NUmfang der Grundgesamtheit
σ2Varianz der Grundgesamtheit
σStandardabweichung der Grundgesamtheit
MzMedian (Zentralwert)
MoModalwert (Modus; häufigster Wert)
imported
Mittelwert der Stichprobe
nUmfang der Stichprobe
s2Varianz der Stichprobe
sStandardabweichung der Stichprobe
RSpannweite
Summenzeichen

Die Beispielrechnungen gehen von folgender Messwertreihe aus: (i = 1, … 30):

4,354,803,754,954,205,104,656,004,055,25
5,104,503,155,254,653,455,854,505,554,80
6,454,053,004,205,103,155,404,655,104,50

Zu berechnen sind folgende Parameter der Messreihe:

  • das arithmetische Mittel

  • der Median

  • der Modalwert

  • die Spannweite

  • die Varianz

  • die Standardabweichung.

A. Berechnung von Maßzahlen der Grundgesamtheit:

  1. Das arithmetische Mittel μ

    einer Häufigkeitsverteilung ist die Summe aller Merkmalsausprägungen dividiert durch die Anzahl der Beobachtungen:

    • μ, ungewogen:

      $$μ = \frac{Σ x_{i}}{N}$$

      i = 1, 2, …, N

    • μ, gewogen:

      $$μ = \frac{Σ N_{J}\; x_{j}}{N}$$

      j = 1, 2, …, r (r = Anzahl der verschiedenen Merkmalsausprägungen)

      Beispiel

      Hier klicken zum Ausklappen
      4,354,803,754,954,205,104,656,004,055,2547,10
      5,104,503,155,254,653,455,854,505,554,8046,80
      6,454,053,004,205,103,155,404,655,104,5045,60
        ∑ = 139,50

      $$μ = \frac{Summe\; der\; einzelnen\; Werte}{Anzahl\; der\; Werte}$$

      $$ = \frac{139,5}{30} = 4,65$$

  2. Median Mz (= Zentralwert):

    Ordnet man die Werte einer Urliste der Größe nach, so ist der Median dadurch gekennzeichnet, dass 50 % der Merkmalsausprägungen kleiner/gleich und 50 % der Merkmalsausprägungen größer/gleich dem Zentralwert Mz sind. Der Median teilt also die der Größe nach geordneten Werte in zwei gleiche Hälften:

    • bei N = gerade

      ist der Median das arithmetische Mittel der in der Mitte stehenden Werte:

      $$M_{z} = \frac{1}{2} – (x_{N/2} + x_{N/2+1})$$

      Beispiel

      Hier klicken zum Ausklappen

      Da N = 30 ist, wird das arithmetischen Mittel aus dem 15. und 16. Wert der (geordneten) Häufigkeitstabelle gebildet:

      imported

      $$M_{z} = \frac{1}{2} – (x_{15} + x_{16})$$

      $$= \frac{4,65 + 4,65}{2} = 4,65\; $$

    • bei N = ungerade

      ist der Median der in der Mitte stehende Wert der geordneten Urliste:

      $$M_{z} = x_{(n+1)/2}$$

      Beispiel

      Hier klicken zum Ausklappen

      Angenommen, man würde die vorliegende Messreihe von 30 Werten um den Wert x31 = 6,55 ergänzen, so erhält man als Median den Wert x16:

      $$M_{z}\; = * _{(31+1)/2} = x_{16} = 4,65$$

      Da es sich beim Median um einen relativ groben Lageparameter zur Charakterisierung einer Verteilung handelt, sollte er nur bei einer kleinen Messreihe ermittelt werden. Im vorliegenden Fall von 30 Urlistenwerten ist er eher nicht zu empfehlen.

    • Als Modalwert Mo (= dichtester Wert = Modus) bezeichnet man innerhalb einer Häufigkeitsverteilung die Merkmalsausprägung mit der größten Häufigkeit (soweit vorhanden):

      imported

      Beispiel

      Hier klicken zum Ausklappen

      Aus der vorliegenden Häufigkeitstabelle lässt sich der Modalwert direkt ablesen: Es ist die Merkmalsausprägung mit der maximalen Häufigkeit.

      Nj= 4
      Mo= 5,10

      Mittelwerte, die die Lage einer Verteilung beschreiben, reichen allein nicht aus, um eine Häufigkeitsverteilung zu charakterisieren. Es wird nicht die Frage beantwortet, wie weit oder wie eng sich die Merkmalsausprägungen um den Mittelwert gruppieren.

      Man berechnet daher so genannte Streuungsmaße, die kleine Werte annehmen, wenn die Merkmalsbeträge stark um den Mittelwert konzentriert sind bzw. große Werte bei weiter Streuung um den Mittelwert.

    • Die Spannweite R (= Range) ist das einfachste Streuungsmaß. Sie wird als die Differenz zwischen dem größten und dem kleinsten Wert definiert. Die Aussagekraft der Spannweite ist sehr gering und sollte daher nur für eine kleine Anzahl von Messwerten berechnet werden (im vorliegenden Beispiel also eher nicht geeignet).

      $$R = x_{max} – x_{min}$$

      oder bei geordneter Urliste:

      $$R = x_{N} – x_{1}$$

      Beispiel

      Hier klicken zum Ausklappen

      $$R = x_{30} – x_{1} = 6,45 – 3,00 = 3,45$$

    • Mittlere quadratische Abweichung σ2 (= Varianz):

      Bei der Varianz σ2 wird das jeweilige Quadrat der Abweichungen zwischen der Merkmalsausprägung xi und dem Mittelwert x berechnet. Durch den Vorgang des Quadrierens erreicht man, dass große Abweichungen stärker und kleine Abweichungen weniger berücksichtigt werden. Die Summe der Quadrate wird durch N dividiert.

      • σ2, ungewogen:

        $$σ_{2} = \frac{Σ (x_{i} – μ)^{2}}{N}$$

        i = 1, 2, …, N

      • σ2, gewogen:

        $$σ_{2} = \frac{Σ (x_{j} – μ)^{2} * N_{j}}{N}$$

        j = 1, 2, …, r

        Durch Umrechnung gelangt man zu folgender Formel; damit lässt sich die Varianz leichter berechnen:

        imported

        Bei einer hohen Zahl von Messwerten empfiehlt sich eine Arbeitstabelle zur Berechnung der Varianz:

        xjNj
        imported
        imported
        xj – μ(xj – μ)2(xj – μ)2Nj
        3,0019,009,00– 1,652,722,72
        3,1529,9219,84– 1,502,254,50
        3,45111,9011,90– 1,201,441,44
        3,75114,0614,06– 0,900,810,81
        4,05216,4032,80– 0,600,360,72
        4,20217,6435,28– 0,450,200,40
        4,35118,9218,92– 0,300,090,09
        4,50320,2560,75– 0,150,020,06
        4,65321,6264,870,000,000,00
        4,80223,0446,080,150,020,04
        4,95124,5024,500,300,090,09
        5,10426,01104,040,450,200,80
        5,25227,5655,120,600,360,72
        5,40129,1629,160,750,560,56
        5,55130,8030,800,900,810,81
        5,85134,2234,221,201,441,44
        6,00136,0036,001,351,821,82
        6,45141,6041,601,803,243,24
        39 668,97  20,26

        Beispiel

        Hier klicken zum Ausklappen

        $$σ_{2} = \frac{Σ (x_{j} – μ)^{2} * N_{j}}{N}$$

        $$ = \frac{20,26}{30} = 0,68\; (gerundet)$$

        bzw.

        imported
      • Die Standardabweichung σ (kurz: Streuung) bzw. s (Standardabweichung der Stichprobe) ist die positive Wurzel aus der Varianz; sie ist das wichtigste Streuungsmaß:

        imported

        $$σ = √ σ_{2}$$

        Beispiel

        Hier klicken zum Ausklappen

        $$σ = √\; 0,68 = 0,82$$

        Die Standardabweichung sagt aus, wie groß der Bereich ist, in dem die einzelnen Zahlen verteilt sind. Sie gibt an, wie weit die einzelnen Messwerte im Durchschnitt vom Mittelwert (Erwartungswert) entfernt sind:

        • Die Standardabweichung ist niemals negativ.

        • Sie kann sehr deutlich steigen, wenn Werte, die weiter von den übrigen entfernt sind, mit in die Berechnung einbezogen werden.

        • Die Einheit der Messwerte und der Standardabweichung ist identisch.

        Hinweis

        Hier klicken zum Ausklappen
        TIPP

        In den Prüfungsaufgaben der IHK müssen Sie häufig die Standardabweichung berechnen. Dies ist mithilfe eines modernen Taschenrechners problemlos möglich. Wichtig ist, dass Sie sich im Vorfeld mit der Eingabe der Werte und der Berechnungsfunktion Ihres Rechners vertraut machen. Da sich dies je nach Hersteller und Modell deutlich unterscheidet, ist hierzu ein Blick in die Bedienungsanleitung hilfreich.

      B. Berechnung von Maßzahlen der Stichprobe:

      Die oben dargestellten Formeln zur Berechnung der Maßzahlen sind – bis auf die Berechnung der Varianz analog; zur Kennzeichnung von Stichprobenparametern wird

      imported
      statt μ, n statt N, s2 statt σ2 und s statt σ verwendet; somit modifizieren sich die Formeln für den Mittelwert zu:
      imported

      bzw.

      imported

      Bei der Berechnung der Varianz einer Stichprobe wird – genau genommen – keine mittlere quadratische Abweichung berechnet, sondern man verwendet die Formel

      imported

      Man dividiert also die Summe der Quadrate durch den um Eins verminderten Stichprobenumfang (= so genannte empirische Varianz). Für die Standardabweichung s gilt Entsprechendes. Es lässt sich mathematisch zeigen, dass diese Berechnungsweise notwendig ist, wenn von der Varianz der Stichprobe auf die Varianz der Grundgesamtheit geschlossen werden soll.

      Hinweis

      Hier klicken zum Ausklappen
      TIPP

      … für die Praxis

      Funktionsrechner und Statistik-Software verwenden häufig den Faktor 1n – 1 anstatt 1n. Bitte beachten Sie dies bei der Berechnung von Varianzen, die nicht aus einer Stichprobe stammen.

      02. Welche Prüfmethoden werden im Rahmen der Qualitätskontrolle eingesetzt?

      Bei der Qualitätskontrolle bedient man sich vor allem der drei folgenden Methoden, die wiederum verschiedene Unterarten verzeichnen:

      • Statistische Qualitätskontrolle

      • (Einfache) Methoden der Betriebspraxis

      • Computergestützte Qualitätssicherung (CAQ).

      03. Wie erfolgt die statistische Qualitätskontrolle unter der Annahme der Normalverteilung?

      Untersucht man eine große Anzahl von Einheiten eines gefertigten Produktes hinsichtlich der geforderten Qualitätseigenschaften (Stichprobe aus einem Los), so lässt sich mathematisch zeigen, dass die „schlechten Werte“ in einer bestimmten Verteilungsform vom Mittelwert (dem Sollwert) abweichen: Es entsteht bei hinreichend großer Anzahl von Prüfungen das Bild einer Gauss’schen Normalverteilung (so genannte symmetrische Glockenkurve):

      imported

      Es lässt sich nun mathematisch zeigen, dass – bei Vorliegen einer Normalverteilung der Qualitätseigenschaften -

      • ungefähr 68,0 % (68,26 %)

        aller Ausprägungen im Bereich [Mittelwert +/- 1 • Standardabweichung] streuen

      • ungefähr 95,0 % (95,44 %)

        aller Ausprägungen im Bereich [Mittelwert +/- 2 • Standardabweichung] streuen

      • ungefähr 99,8 % (99,73 %)

        aller Ausprägungen im Bereich [Mittelwert +/- 3 • Standardabweichung] streuen.

      Diese Wahrscheinlichkeit nennt man

      • Vertrauenswahrscheinlichkeit oder

      • statistische Sicherheit.

      Das Intervall um den Stichprobenparameter nennt man Vertrauensbereich oder Konfidenzintervall.

      Die nachfolgende Abbildung zeigt den dargestellten Zusammenhang:

      imported

      Diese Erkenntnis der Gauss’schen Normalverteilung (bei einer großen Anzahl von Untersuchungseinheiten) macht man sich bei der statistischen Qualitätskontrolle zu Nutze: Man zieht eine zufällig entnommene Stichprobe aus der produzierten Losgröße und schließt (vereinfacht gesagt) von der Zahl der „schlechten Stücke in der Stichprobe auf die Zahl der schlechten Stücke in der Grundgesamtheit“ (gesamte Losgröße).

      Wahrscheinlichkeitsnetz

      Mit einem Wahrscheinlichkeitsnetz können die Daten eines statistischen Merkmals daraufhin untersucht werden, ob ihnen eine bestimmte Wahrscheinlichkeitsverteilung zugrunde liegt. Es ist mit einem Koordinatennetz versehen, in dem auf der y-Achse die Quantile (Lagemaße) der Verteilung in logarithmischer Form, dagegen auf der x-Achse die dazugehörigen Funktionswerte der Verteilung in linearisierter Form aufgetragen sind. Beim Eintragen der Wertepaare (Quantil, Verteilung) erhält man so eine Gerade.

      • Falls die eingetragenen Messwerte annähernd auf einer Geraden liegen (wie im nachfolgenden Beispiel), so kann davon ausgegangen werden, dass die Messwerte näherungsweise normalverteilt sind.

      • Es lässt sich aus dem Schnittpunkt der Ausgleichsgeraden mit der 50 %-Linie des Wahrscheinlichkeitsnetzes der Schätzwert für den arithmetischen Mittelwert

        imported
        ablesen. Im nachfolgenden Beispiel kann dieser Wert bei ca. 4,6 Jahren abgelesen werden. Dies bedeutet, dass die Hälfte der Bauteile vor oder bei 4,6 Jahren ausfällt, die andere Hälfte 4,6 Jahre oder länger hält.
      • Ebenso kann aus dem Abstand vom Schnittpunkt der Ausgleichsgeraden und der 50 %-Linie zum Schnittpunkt der Ausgleichsgeraden und einer eingezeichneten Linie bei 15,87 % (

        imported
         – 1 s) bzw. bei 84,13 % (
        imported
         + 1 s) der Schätzwert der Standardabweichung s abgelesen werden.

      Hinweis

      Hier klicken zum Ausklappen

      In Prüfungsaufgaben wird häufig verlangt, dass Sie aus einem Wahrscheinlichkeitsnetz Werte herauslesen können, z. B. den arithmetischen Mittelwert

      imported
      oder die Standardabweichung s. Ebenso könnte eine Frage z. B. lauten, wie viele Bauteile schon innerhalb der ersten vier Jahre ausfallen. Im Beispiel würde die Antwort ca. 17 % lauten. Denn der Schnittpunkt der Ausgleichsgeraden mit der 4-Jahres-Linie liegt bei ca. 17 % auf der vertikalen Achse, welche die Ausfallwahrscheinlichkeit angibt.

      Wahrscheinlichkeitsnetz Normalverteilung

      imported

      04. Welche (einfachen) Prüfmethoden werden außerdem in der Qualitätskontrolle eingesetzt?

      Neben dem Verfahren der „Statistischen Qualitätskontrolle“ gibt es in der Betriebspraxis noch einfache und doch sehr wirkungsvolle Prüfverfahren; drei dieser Methoden werden hier beispielhaft genauer behandelt:

      • Strichliste

      • Kontrollkarte (QRK)

      • Stichprobenpläne.

      • Bei der Strichliste werden die Ergebnisse einer Prüfstichprobe auf einem Auswertungsblatt festgehalten: Dazu bildet man Messwertklassen und trägt pro Klasse ein, wie häufig ein bestimmter Messwert beobachtet wurde. Die Anzahl der Klassen sollte i. d. R. zwischen 5 und 20 liegen; die Klassenbreite ist gleich groß zu wählen.

        Beispiel

        Hier klicken zum Ausklappen

        Angenommen, wir befinden uns in der Fertigung von Ritzeln für Kfz-Anlasser. Der Sollwert des Ritzeldurchmessers soll bei 250 mm liegen. Aus einer Losgröße von 1.000 Einheiten wird eine Stichprobe von 40 Einheiten gezogen, die folgendes Ergebnis zeigt:

        StrichlisteAufnahme am:

        10..

        Auftrag:47333Losgröße:1.000
        Werkstück:RitzelPrüfmenge:40
        Messwertklassen (in mm)Häufigkeiten, absolutHäufigkeiten, in %
        ≤ 248,0//25,0
        ≤ 248,5//25,0
        ≤ 249,0/////512,5
        ≤ 249,5///// //717,5
        ≤ 250,0///// ///// //1230,0
        ≤ 250,5///// /615,0
        ≤ 251,0///37,5
        ≤ 251,5//25,0
        ≤ 252,0/12,5
         40100,0

        Die Auswertung der Strichliste erfolgt dann wiederum mithilfe der „Statistischen Qualitätskontrolle“ (vgl. Frage 03.).

      • Kontrollkarten (auch: Qualitätsregelkarten QRK bzw. kurz: Regelkarten; auch: „Statistische Prozessregelung“) werden in der industriellen Fertigung dafür benutzt, die Ergebnisse aufeinander folgender Prüfstichproben festzuhalten. Durch die Verwendung von Kontrollkarten lassen sich Veränderungen des Qualitätsstandards im Zeitablauf beobachten; z. B. kann frühzeitig erkannt werden, ob Toleranzen bestimmte Grenzwerte über- oder unterschreiten. Es gibt eine Vielzahl unterschiedlicher Qualitätsregelkarten (je nach Prüfmerkmal, Qualitätsanforderung und Messtechnik). Häufige Verwendung finden sog. zweispurige QRK, die gleichzeitig einen Lageparameter (Mittelwert oder Median) und einen Streuungsparameter (z. B. Standardabweichung oder Range) anzeigen (sog.

        imported
        /s-Regelkarte bzw.
        imported
        /R-Regelkarte).

        Beispiel

        Hier klicken zum Ausklappen

        Die nachfolgende Abbildung zeigt den Ausschnitt einer Kontrollkarte:

        1. 1. Der Fertigungsprozess ist sicher, wenn die Prüfwerte innerhalb der oberen und unteren Warngrenze liegen.

        2. 2. Werden die Warngrenzen überschritten, ist der Prozess „nicht mehr sicher“, aber „fähig“.

        3. 3. Werden die Eingriffgrenzen erreicht, muss der Prozess wieder sicher gemacht werden (z. B. neues Werkzeug, Neujustierung, Fehlerquelle beheben).

        4. 4. Erfolgt beim Erreichen der Eingriffsgrenzen keine Korrekturmaßnahme, so ist damit zu rechnen, dass es zur Produktion von „Nicht-in-Ordnung-Teilen“ (NIO-Teile) kommt.

        imported

      05. Wie sind Regelkarten zu interpretieren?

      Prozessverlauf
      Grafische Darstellung
      Bezeichnung
      Erläuterung
      Bewertung
      Maßnahmen
      imported
      Natürlicher Verlauf 2/3 der Werte liegen innerhalb des Bereichs ± s; OEG bzw. UEG werden nicht überschritten.Prozess in Ordnung! Kein Eingriff erforderlich.
      imported
      Überschreiten der Grenzen
      Die obere und/oder untere Eingriffsgrenze ist überschritten.
      Prozess nicht in Ordnung!
      Eingriff erforderlich; Ursachen ermitteln.
      imported
      Run
      Mehr als sechs Werte liegen in Folge über/unter M.
      Prozess noch in Ordnung!
      Verschärfte Kontrolle; Verlauf deutet auf systematischen Fehler hin, z. B. Werkzeugverschleiß.
      imported
      Trend
      Mehr als sechs Werte in Folge zeigen eine fallende/steigende Tendenz.
      Prozess nicht in Ordnung!
      Eingriff erforderlich; Ursachen ermitteln, z. B. Verschleiß der Werkzeuge, Vorrichtungen, Messgeräte.
      imported
      Middle Third
      15 oder mehr Werte liegen in Folge innerhalb von ± s (= im mittleren Drittel).
      Prozess in Ordnung!
      Kein Eingriff erforderlich; aber: Ursachen für Prozessverbesserung ergründen bzw. Prüfergebnisse verstärkt kontrollieren.
      imported
      Perioden
      Die Werte wechseln periodisch um den Wert M; es liegen mehr als 2/3 der Werte außerhalb des mittleren Drittels zwischen OEG und UEG.
      Prozess nicht in Ordnung!
      Eingriff erforderlich; es ist ein systematischer Fehler zu vermuten.

      06. Wie wird der Fehleranteil im Prüflos und in der Grundgesamtheit berechnet?

      Aus einem Losumfang (Grundgesamtheit) von N wird eine hinreichend große Stichprobe mit dem Umfang n zufällig entnommen. Man erhält in der Stichprobe nf fehlerhafte Stücke (= Überschreitung des zulässigen Toleranzbereichs):

      • Der Anteil der fehlerhaften Stücke Δxfder Stichprobe ist

        $$\Delta\; x_{f} = \frac{n_{f}}{n}$$

        oder in Prozent: 

        $$= \frac{n_{f}}{n} * 100$$

        Beispiel

        Hier klicken zum Ausklappen

        Es werden aus einem Losumfang von 4.000 Wellen 10 % überprüft. Die Messung ergibt 20 unbrauchbare Teile.

        Es ergibt sich bei n = 400 und nf = 20

        $$\Delta\; x_{f} = \frac{n_{f}}{n} $$

        $$= \frac{20}{400} = 0,05\; bzw.\; 5 \%$$

        Bei hinreichend großem Stichprobenumfang und zufällig entnommenen Messwerten kann angenommen werden, dass der Anteil der fehlerhaften Stücke in der Grundgesamtheit Nf wahrscheinlich dem Anteil in der Stichprobe entspricht (Schluss von der Stichprobe auf die Grundgesamtheit); es wird also gleichgesetzt:

        $$\frac{n_{f}}{n} * 100 = \frac{N_{f}}{N} * 100$$

        Das heißt, es kann angenommen werden, dass die Zahl der fehlerhaften Wellen in der Grundgesamtheit 200 Stück beträgt (5 % von 4.000).

      • Bezeichnet man die Anzahl der fehlerhaften Stücke als „NIO-Teile“ (= „Nicht-in-Ordnung-Teile“) so lässt sich in Worten folgender Schluss von der Stichprobe auf die Grundgesamtheit formulieren:

        imported

        Beispiel

        Hier klicken zum Ausklappen
        imported
        imported