Standardfehler
Der Standardfehler ist die Standardabweichung der Stichprobenverteilung einer Statistik. Der Begriff kann auch für eine Schätzung (gute Schätzung) dieser Standardabweichung aus einer Stichprobe der gesamten Gruppe verwendet werden.
Der Durchschnitt eines Teils einer Gruppe (Stichprobe genannt) ist die übliche Methode zur Schätzung des Durchschnitts für die gesamte Gruppe. Es ist oft zu schwierig oder zu teuer, die gesamte Gruppe zu messen. Wenn aber eine andere Stichprobe gemessen wird, wird sie einen Durchschnitt haben, der sich ein wenig von der ersten Stichprobe unterscheidet. Der Standardfehler des Mittelwertes ist ein Weg, um zu wissen, wie nahe der Durchschnitt der Stichprobe am Durchschnitt der gesamten Gruppe liegt. Er ist ein Weg, um zu wissen, wie sicher man sich über den Mittelwert aus der Stichprobe sein kann.
Bei realen Messungen ist der wahre Wert der Standardabweichung des Mittelwertes für die gesamte Gruppe in der Regel nicht bekannt. Daher wird der Begriff Standardfehler oft verwendet, um eine enge Schätzung des wahren Wertes für die gesamte Gruppe zu bezeichnen. Je mehr Messungen in einer Stichprobe vorhanden sind, desto näher liegt die Schätzung an der wahren Zahl für die gesamte Gruppe.
Für einen Wert, der mit einem unvoreingenommenen normalverteilten Fehler abgetastet wird, wird oben der Anteil der Abtastwerte dargestellt, der zwischen 0, 1, 2 und 3 Standardabweichungen über und unter dem tatsächlichen Wert liegen würde.
Wie findet man den Standardfehler des Mittelwertes
Eine Möglichkeit, den Standardfehler des Mittelwerts zu finden, besteht darin, viele Stichproben zu nehmen. Zunächst wird der Mittelwert für jede Stichprobe ermittelt. Dann wird der Mittelwert und die Standardabweichung dieser Stichprobenmittelwerte gefunden. Die Standardabweichung für alle Stichprobenmittelwerte ist der Standardfehler des Mittelwertes. Dies kann eine Menge Arbeit sein. Manchmal ist es zu schwierig oder kostet zu viel Geld, viele Stichproben zu haben.
Eine andere Möglichkeit, den Standardfehler des Mittelwerts zu finden, ist die Verwendung einer Gleichung, die nur eine Stichprobe benötigt. Der Standardfehler des Mittelwerts wird normalerweise durch die Standardabweichung für eine Stichprobe aus der gesamten Gruppe (Stichprobenstandardabweichung) geteilt durch die Quadratwurzel des Stichprobenumfangs geschätzt.
S E x ¯ = s n {\Anzeigestil SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}
wo
s ist die Stichprobenstandardabweichung (d. h. die stichprobenbasierte Schätzung der Standardabweichung der Grundgesamtheit), und
n ist die Anzahl der Messungen in der Probe.
Wie groß muss die Stichprobe sein, damit die Schätzung des Standardfehlers des Mittelwertes nahe am tatsächlichen Standardfehler des Mittelwertes für die gesamte Gruppe liegt? Eine Stichprobe sollte aus mindestens sechs Messungen bestehen. Dann wird der Standardfehler des Mittelwertes für die Stichprobe innerhalb von 5% des Standardfehlers des Mittelwertes liegen, wenn die gesamte Gruppe gemessen würde.
Korrekturen für einige Fälle
Es gibt eine weitere Gleichung, die zu verwenden ist, wenn die Anzahl der Messungen für 5% oder mehr der gesamten Gruppe gilt:
Es sind spezielle Gleichungen zu verwenden, wenn eine Probe weniger als 20 Messungen aufweist.
Manchmal kommt eine Probe von einem Ort, auch wenn die ganze Gruppe verteilt ist. Manchmal kann eine Stichprobe auch in einem kurzen Zeitraum gebildet werden, wenn die gesamte Gruppe einen längeren Zeitraum abdeckt. In diesem Fall sind die Zahlen in der Stichprobe nicht unabhängig. Dann wird mit speziellen Gleichungen versucht, dies zu korrigieren.
Nützlichkeit
Ein praktisches Ergebnis: Man kann sich eines Durchschnittswertes sicherer sein, wenn man mehr Messungen in einer Probe hat. Dann ist der Standardfehler des Mittelwertes kleiner, weil die Standardabweichung durch eine größere Zahl geteilt wird. Um jedoch die Unsicherheit (Standardfehler des Mittelwertes) in einem Mittelwert halb so groß zu machen, muss der Stichprobenumfang (n) viermal so groß sein. Der Grund dafür ist, dass die Standardabweichung durch die Quadratwurzel des Stichprobenumfangs geteilt wird. Um die Unsicherheit ein Zehntel so groß zu machen, muss der Stichprobenumfang (n) hundertmal so groß sein!
Standardfehler sind leicht zu berechnen und werden deshalb häufig verwendet:
- Wenn der Standardfehler mehrerer Einzelgrößen bekannt ist, kann der Standardfehler einer Funktion der Größen in vielen Fällen leicht berechnet werden;
- Wenn die Wahrscheinlichkeitsverteilung des Wertes bekannt ist, kann sie verwendet werden, um eine gute Annäherung an ein genaues Konfidenzintervall zu berechnen; und
- Wenn die Wahrscheinlichkeitsverteilung nicht bekannt ist, können andere Gleichungen verwendet werden, um ein Konfidenzintervall zu schätzen
- Da die Stichprobengröße sehr groß wird, zeigt das Prinzip des zentralen Grenzwertsatzes, dass die Zahlen in der Stichprobe den Zahlen in der Gesamtgruppe sehr ähnlich sind (sie haben eine Normalverteilung).
Relativer Standardfehler
Der relative Standardfehler (RSE) ist der Standardfehler geteilt durch den Durchschnitt. Diese Zahl ist kleiner als eins. Die Multiplikation mit 100% ergibt ihn als Prozentsatz des Durchschnitts. Dies hilft zu zeigen, ob die Unsicherheit wichtig ist oder nicht. Betrachten Sie zum Beispiel zwei Erhebungen zum Haushaltseinkommen, die beide einen Stichprobendurchschnitt von 50.000 $ ergeben. Wenn eine Umfrage einen Standardfehler von 10.000 $ und die andere einen Standardfehler von 5.000 $ aufweist, dann betragen die relativen Standardfehler 20% bzw. 10%. Die Umfrage mit dem niedrigeren relativen Standardfehler ist besser, weil sie eine präzisere Messung hat (die Unsicherheit ist kleiner).
Tatsächlich entscheiden Menschen, die Durchschnittswerte kennen müssen, oft, wie gering die Unsicherheit sein sollte, bevor sie sich entscheiden, die Informationen zu verwenden. Beispielsweise gibt das U.S. National Center for Health Statistics keinen Durchschnittswert an, wenn der relative Standardfehler 30% übersteigt. Das NCHS verlangt auch mindestens 30 Beobachtungen, damit eine Schätzung gemeldet werden kann. []
Beispiel
Zum Beispiel gibt es im Wasser des Golfs von Mexiko viele Rotbarsche. Um herauszufinden, wie viel ein 42 cm langer Rotbarsch im Durchschnitt wiegt, ist es nicht möglich, alle Rotbarsche zu messen, die 42 cm lang sind. Stattdessen ist es möglich, einige von ihnen zu messen. Die Fische, die tatsächlich gemessen werden, nennt man Probe. Die Tabelle zeigt die Gewichte für zwei Proben von Rotbarsch, die alle 42 cm lang sind. Das durchschnittliche (mittlere) Gewicht der ersten Probe beträgt 0,741 kg. Das durchschnittliche (mittlere) Gewicht der zweiten Probe beträgt 0,735 kg und unterscheidet sich damit ein wenig von der ersten Probe. Jeder dieser Mittelwerte unterscheidet sich ein wenig von dem Durchschnitt, der sich aus der Messung aller 42 cm langen Rotbarsche ergeben würde (was ohnehin nicht möglich ist).
Die Unsicherheit im Mittelwert kann verwendet werden, um zu wissen, wie nahe der Mittelwert der Proben an dem Mittelwert liegt, der sich aus der Messung der gesamten Gruppe ergeben würde. Die Unsicherheit im Mittelwert wird als Standardabweichung für die Probe geschätzt, geteilt durch die Quadratwurzel der Anzahl der Proben minus eins. Die Tabelle zeigt, dass die Unsicherheiten in den Mittelwerten für die beiden Stichproben sehr nahe beieinander liegen. Auch die relative Unsicherheit ist die Unsicherheit im Mittelwert geteilt durch den Mittelwert mal 100%. Die relative Unsicherheit in diesem Beispiel beträgt 2,38% und 2,50% für die beiden Stichproben.
Wenn man die Unsicherheit im Mittelwert kennt, kann man wissen, wie nahe der Stichprobenmittelwert an dem Mittelwert liegt, der sich aus der Messung der gesamten Gruppe ergeben würde. Der Mittelwert für die gesamte Gruppe liegt zwischen a) dem Mittelwert für die Stichprobe plus der Unsicherheit im Mittelwert und b) dem Mittelwert für die Stichprobe minus der Unsicherheit im Mittelwert. In diesem Beispiel wird das Durchschnittsgewicht für alle 42 cm langen Rotbarsche im Golf von Mexiko auf der Grundlage der ersten Probe voraussichtlich 0,723-0,759 kg und auf der Grundlage der zweiten Probe 0,717-0,753 kg betragen.
Beispiel eines Rotbarsches (auch bekannt als Rote Trommel, Sciaenops ocellatus), der in diesem Beispiel verwendet wird.
Fragen und Antworten
F: Was ist der Standardfehler?
A: Der Standardfehler ist die Standardabweichung der Stichprobenverteilung einer Statistik.
Q: Kann der Begriff Standardfehler auch für eine Schätzung der Standardabweichung verwendet werden?
A: Ja, der Begriff Standardfehler kann für eine Schätzung (gute Schätzung) dieser Standardabweichung verwendet werden, die aus einer Stichprobe der gesamten Gruppe stammt.
Q: Wie kann man den Durchschnitt einer ganzen Gruppe schätzen?
A: Der Durchschnitt eines Teils einer Gruppe (Stichprobe genannt) ist der übliche Weg, um den Durchschnitt für die gesamte Gruppe zu schätzen.
F: Warum ist es schwierig, die gesamte Gruppe zu messen?
A: Es ist oft zu schwierig oder zu kostspielig, die gesamte Gruppe zu messen.
F: Was ist der Standardfehler des Mittelwerts, und was besagt er?
A: Der Standardfehler des Mittelwerts gibt an, wie nahe der Durchschnitt der Stichprobe am Durchschnitt der gesamten Gruppe liegt. Er gibt Aufschluss darüber, wie sicher man sich über den Durchschnitt der Stichprobe sein kann.
F: Ist der wahre Wert der Standardabweichung des Mittelwerts bei realen Messungen normalerweise bekannt?
A: Nein, der wahre Wert der Standardabweichung des Mittelwerts für die gesamte Gruppe ist bei realen Messungen in der Regel nicht bekannt.
F: Wie wirkt sich die Anzahl der Messungen in einer Stichprobe auf die Genauigkeit der Schätzung aus?
A: Je mehr Messungen in einer Stichprobe enthalten sind, desto näher liegt die Schätzung am wahren Wert für die gesamte Gruppe.