Konfidenzintervall

In der Statistik ist ein Konfidenzintervall eine spezielle Form der Schätzung eines bestimmten Parameters. Bei dieser Methode wird anstelle eines einzelnen Wertes ein ganzes Intervall akzeptabler Werte für den Parameter angegeben, zusammen mit einer Wahrscheinlichkeit, dass der tatsächliche (unbekannte) Wert des Parameters in dem Intervall liegt. Das Konfidenzintervall basiert auf den Beobachtungen aus einer Stichprobe und ist daher von Stichprobe zu Stichprobe unterschiedlich. Die Wahrscheinlichkeit, dass der Parameter in dem Intervall liegt, wird als Konfidenzniveau bezeichnet. Sehr oft wird dies als Prozentsatz angegeben. Das Konfidenzintervall wird immer zusammen mit dem Konfidenzniveau angegeben. Man spricht vielleicht vom "95%-Konfidenzintervall". Die Endpunkte des Konfidenzintervalls werden als Konfidenzgrenzen bezeichnet. Bei einem gegebenen Schätzverfahren in einer gegebenen Situation wird das Konfidenzintervall umso größer sein, je höher das Konfidenzniveau ist.

Die Berechnung eines Konfidenzintervalls erfordert im Allgemeinen Annahmen über die Art des Schätzprozesses - es handelt sich in erster Linie um eine parametrische Methode. Eine häufige Annahme ist, dass die Verteilung der Grundgesamtheit, aus der die Stichprobe stammt, normal ist. Daher sind Konfidenzintervalle, wie unten diskutiert, keine robusten Statistiken, obwohl Änderungen vorgenommen werden können, um die Robustheit zu erhöhen.

Bedeutung des Begriffs "Vertrauen

Der Begriff Vertrauen hat in der Statistik eine ähnliche Bedeutung wie im allgemeinen Sprachgebrauch. Im allgemeinen Sprachgebrauch wird ein Anspruch auf 95% Vertrauen in etwas als virtuelle Gewissheit angesehen. In der Statistik bedeutet ein Anspruch auf 95% Vertrauen einfach, dass der Forscher ein mögliches Intervall aus einer großen Anzahl möglicher Intervalle gesehen hat, von denen neunzehn von zwanzig Intervallen den wahren Wert des Parameters enthalten.

Praktisches Beispiel

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Eine Maschine füllt Becher mit Margarine. Für das Beispiel ist die Maschine so eingestellt, dass der Inhalt der Becher 250 g Margarine beträgt. Da die Maschine nicht jeden Becher mit genau 250 g füllen kann, weist der den einzelnen Bechern zugegebene Inhalt eine gewisse Variation auf und wird als Zufallsvariable X betrachtet. Diese Variation wird als normal um den gewünschten Mittelwert von 250 g verteilt angenommen, mit einer Standardabweichung von 2,5 g. Um festzustellen, ob die Maschine ausreichend kalibriert ist, wird eine Probe von n = 25 Bechern Margarine nach dem Zufallsprinzip ausgewählt und die Becher gewogen. Die Gewichte der Margarine sind X1, ..., X25, eine Zufallsstichprobe aus X.

Um einen Eindruck von der Erwartung μ zu bekommen, genügt es, eine Schätzung abzugeben. Der geeignete Schätzer ist der Stichprobenmittelwert:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } ${\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.$

Das Beispiel zeigt die tatsächlichen Gewichte x1, ...,x25, mit Mittelwert:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 Gramm . {\darstellungsstil {\bar {x}}={\frac {1}{25}}\summe _{i=1}^{{25}x_{i}=250.2\,{\text{gramme}}. } ${\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.$

Wenn wir eine weitere Probe von 25 Bechern nehmen, könnten wir leicht Werte wie 250,4 oder 251,1 Gramm erwarten. Ein Probenmittelwert von 280 Gramm wäre jedoch extrem selten, wenn der mittlere Gehalt der Becher tatsächlich nahe bei 250 g liegt. Es gibt ein ganzes Intervall um den beobachteten Wert 250,2 des Stichprobenmittelwertes, innerhalb dessen, wenn der Mittelwert der Gesamtpopulation tatsächlich einen Wert in diesem Bereich annimmt, die beobachteten Daten nicht als besonders ungewöhnlich angesehen würden. Ein solches Intervall wird als Konfidenzintervall für den Parameter μ bezeichnet. Wie berechnen wir ein solches Intervall? Die Endpunkte des Intervalls müssen aus der Stichprobe berechnet werden, sie sind also Statistiken, Funktionen der Stichprobe X1, ..., X25 und damit Zufallsvariablen selbst.

In unserem Fall können wir die Endpunkte bestimmen, indem wir berücksichtigen, dass der Stichprobenmittelwert X aus einer normalverteilten Stichprobe ebenfalls normalverteilt ist, mit der gleichen Erwartung μ, aber mit dem Standardfehler μ/σ = 0,5 (Gramm). Durch Standardisierung erhalten wir eine Zufallsvariable

Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}} $Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}$

abhängig vom zu schätzenden Parameter μ, aber mit einer Standardnormalverteilung, die unabhängig vom Parameter μ ist. Daher ist es möglich, Zahlen -z und z, unabhängig von μ, zu finden, wobei Z mit einer Wahrscheinlichkeit von 1 dazwischen liegt - α, ein Mass dafür, wie sicher wir sein wollen. Wir nehmen 1 - α = 0.95. Das haben wir also:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {\Anzeigestil P(-z\leq Z\leq z)=1-\alpha =0.95.\,} $P(-z\leq Z\leq z)=1-\alpha =0.95.\,$

Die Zahl z ergibt sich aus der kumulativen Verteilungsfunktion:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\Anzeigestil {\beginnt{ausgerichtet}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}}=0.975,\\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\endet{ausgerichtet}}} ${\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}$

und wir bekommen:

0,95 = 1 - α = P ( - z ≤ Z ≤ ≤ z ) = P ( - 1,96 ≤ X ¯ - μ σ / n ≤ 1,96 ) = P ( X ¯ - 1,96 σ n ≤ μ ≤ ≤ X ¯ + 1,96 σ n ) = P ( X ¯ - 1,96 × 0,5 ≤ μ ≤ ≤ X ¯ + 1,96 × 0,5 ) = P ( X ¯ - 0,98 ≤ μ ≤ ≤ X ¯ + 0,98 ) . {\Anzeigestil {\begin{ausgerichtet}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq {\mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}right)\\\[6pt]&=P\left({\bar {X}}-1.96\mal 0.5\leq \mu \leq {\leq {\bar {X}}+1.96\mal 0,5\rechts)\\[6pt]&=P\links({\Balken {X}}-0,98\links \mu \leq {\mu \leq {\bar {X}}+0,98\rechts).\end{ausgerichtet}}} ${\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}$

Dies könnte wie folgt interpretiert werden: Mit einer Wahrscheinlichkeit von 0,95 werden wir ein Konfidenzintervall finden, in dem wir den Parameter μ zwischen den stochastischen Endpunkten erfüllen

X ¯ - 0 . 98 {\Anzeigestil {\bar {X}}}-0{.}98\,} ${\bar {X}}-0{.}98\,$

und

X ¯ + 0.98. {\Anzeigestil {\bar {X}}+0.98.\,} ${\bar {X}}+0.98.\,$

Dies bedeutet nicht, dass eine Wahrscheinlichkeit von 0,95 besteht, den Parameter μ im berechneten Intervall zu treffen. Jedes Mal, wenn die Messungen wiederholt werden, gibt es einen anderen Wert für den Mittelwert X der Probe. In 95% der Fälle wird μ zwischen den aus diesem Mittelwert berechneten Endpunkten liegen, in 5% der Fälle jedoch nicht. Das tatsächliche Konfidenzintervall wird durch Eingabe der gemessenen Gewichte in die Formel berechnet. Unser 0,95 Konfidenzintervall wird:

( x ¯ - 0,98 ; x ¯ + 0,98 ) = ( 250,2 - 0,98 ; 250,2 + 0,98 ) = ( 249,22 ; 251,18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} $({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,$

Da der gewünschte Wert 250 von μ innerhalb des resultierenden Konfidenzintervalls liegt, gibt es keinen Grund zur Annahme, dass die Maschine falsch kalibriert ist.

Das berechnete Intervall hat feste Endpunkte, wobei μ dazwischen liegen kann (oder auch nicht). Somit hat dieses Ereignis entweder eine Wahrscheinlichkeit von 0 oder 1. Das können wir nicht sagen: "mit Wahrscheinlichkeit (1 - α) liegt der Parameter μ im Konfidenzintervall". Wir wissen nur, dass durch Wiederholung in 100(1 - α) % der Fälle μ im berechneten Intervall liegt. In 100α % der Fälle ist dies jedoch nicht der Fall. Und leider wissen wir nicht, in welchem der Fälle dies geschieht. Deshalb sagen wir: "Bei Konfidenzniveau 100(1 - α) % liegt μ im Konfidenzintervall. "

Die Abbildung auf der rechten Seite zeigt 50 Realisierungen eines Konfidenzintervalls für eine gegebene Population bedeuten μ. Wenn wir eine Realisation nach dem Zufallsprinzip auswählen, liegt die Wahrscheinlichkeit bei 95%, dass wir am Ende ein Intervall gewählt haben, das den Parameter enthält; es kann jedoch sein, dass wir Pech haben und das falsche gewählt haben. Wir werden es nie wissen; wir bleiben an unserem Intervall hängen.

Die vertikalen Liniensegmente repräsentieren 50 Realisierungen eines Konfidenzintervalls für μ.

Fragen und Antworten

F: Was ist ein Konfidenzintervall in der Statistik?

A: Ein Konfidenzintervall ist ein spezielles Intervall, das zur Schätzung eines Parameters, wie z.B. des Mittelwerts der Bevölkerung, verwendet wird und einen Bereich von akzeptablen Werten für den Parameter angibt, anstatt eines einzelnen Werts.

Q: Warum wird ein Konfidenzintervall anstelle eines Einzelwerts verwendet?

A: Ein Konfidenzintervall wird anstelle eines Einzelwerts verwendet, um die Unsicherheit bei der Schätzung eines Parameters auf der Grundlage einer Stichprobe zu berücksichtigen und um eine Wahrscheinlichkeit anzugeben, dass der tatsächliche Wert des Parameters innerhalb des Intervalls liegt.

F: Was ist ein Konfidenzniveau?

A: Ein Konfidenzniveau ist die Wahrscheinlichkeit, dass der geschätzte Parameter innerhalb des Konfidenzintervalls liegt, und wird oft als Prozentsatz angegeben (z.B. 95% Konfidenzintervall).

Q: Was sind Konfidenzgrenzen?

A: Konfidenzgrenzen sind die Endpunkte eines Konfidenzintervalls, die den Bereich der akzeptablen Werte für den zu schätzenden Parameter definieren.

Q: Wie wirkt sich das Konfidenzniveau auf das Konfidenzintervall aus?

A: Je höher das Konfidenzniveau bei einem bestimmten Schätzverfahren ist, desto breiter ist das Konfidenzintervall.

Q: Welche Annahmen sind für die Berechnung eines Konfidenzintervalls erforderlich?

A: Die Berechnung eines Konfidenzintervalls erfordert im Allgemeinen Annahmen über die Art des Schätzverfahrens, wie z. B. die Annahme, dass die Verteilung der Grundgesamtheit, aus der die Stichprobe stammt, normal ist.

F: Sind Konfidenzintervalle robuste Statistiken?

A: Konfidenzintervalle sind, wie unten erläutert, keine robusten Statistiken, obwohl Anpassungen vorgenommen werden können, um die Robustheit zu erhöhen.