Diskussion:Standardabweichung (Stochastik)/Archiv/1

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

1/n oder 1/(n-1)


Nachtrag zum Nachtrag: Man kann's aber auch leicht ausrechnen, indem man von 1/n ausgeht als Abweichung der Gesamtheit, mit (n-1)/n erweitert und einen einzelnen Fehler aus der Summe herauszieht. Anschließend muss man nur noch nach der Einzelabweichung auflösen und erhält somit die Abweichung der Einzelmessung entsprechend mit Faktor 1/(n-1). Durch eine Mittelung über alle n Messungen erhält man direkt folgend dann auch noch die mittlere Abweichung der Einzelmessung vom Mittelwert entsprechend dem Artikel.

(Nachtrag zur Diskussion: siehe Artikel bzw:
1/n, wenn Gesamtheit vorliegt, 1/(n-1), wenn nur eine Teilmenge der Gesamtheit (Stichprobe) vorliegt. Grund: Verlust eines Freiheitsgrades, wenn der Mittelwert abgeschätzt werden muss. Anton 12:21, 13. Feb 2005 (CET))

---

Bei der Berechnung der Standardabweichung gibt es zwei Methoden, einmal wird mit 1/n multipliziert und an anderer Stelle wird 1/(n-1) verwendet. Wann ist welche Form anzuwenden? Und was ist der Unterschied? Mfg rho.

Falls n groß ist , macht es kaum einen Unterschied .

Die (n-1)-Fassung ist die erwartungstreue Form für die Schätzung der Varianz. Die verwendet man bei Schätzen und Testen. Würde man hier n verwenden, würde die Varianz systematisch unterschätzt. Allerdings stimmt es, dass das bei Standardabweichung nicht gilt. Wenn man nur Daten beschreibt, kann man die empirische Varianz mit n nehmen. --Philipendula 10:23, 15. Dez 2004 (CET)

Ich möchte die Diskussion nicht verkomplizieren, meines Erachtens ist die Version der Standardabweichung 1/(n-1) die Schätzung aus einer Stichprobe heraus, ich befinde mich hier im Bereich des des sogenannten Vertrauensbereichs.

Anm.: Bei Excel ist dies die Funktion "STABW" Im anderen Fall, der 1/n-Version kenne ich die Grundgesamtheit und betrachte den sogenanten Zufallsstreubereich.

Anm.: Bei Excel ist dies die Funktion "STABN"

Die Erklärung warum ich für die "scheinbar" gleiche Größe einmal n-1 und einmal n benutze erkläre ich mir damit, daß ich Differenzen bilde. Bei dieser Differenzbildung ist ja jedesmal auch der jeweilige Meßwertanteil im Mittelwert vorhanden, d. h. ich habe auch nur n-1 unabhängige Meßwerte die zu dieser Mittelwertbildung geführt haben. (Diese n-1 unabhängigen Meßwerte sind bei weiteren Analysen die sogenannten Freihaitsgrade, die sich insbesondere im F-Test weiter reduzieren können.) Beim Übergang von n ins Unendliche gibt es auch keinen Unterschied mehr zwischen n-1 und n, also gilt bei Wissen der Grundgesamtheit eben n.

Beispiel: Würfel

Bin ich mir im klaren darüber, das der Würfel nur die 6 Zustände hat und berechene die Standardabweichung die alle Würfelergbenisse nach unendlich mal würfeln ergeben, dann müßten die Zustände beim idealen Würfel auch ideal gleichverteilt sein, erhalte dann etwa s=1,7 und kann mit 1/n rechnen.

Wenn ich nur "Stichprobenwerte" sehe, aber nicht weiß, daß es ein Würfel ist, nehme ich die Formel mit n-1, liege damit bei den Streuungen höher, aber nähere mich bei unendlichen Würfen an die 1,7.

Als Praxisrelevanz kann man mit diesem Wissen z. B. Würfel überprüfen, ob sie auch wirklich gleichverteilt sind oder mit einem gewissen Vertrauensniveau oder Irrtumswahrscheinlichkeit die Hypothese verwerfen, daß ein Würfel wirklich zufällige Ergebniise gibt. Ebenso kann man mit solchen Systemen/Modellen auch beliebige Prozesse analysieren.

Bei einer "reinen"Datenbeschreibung 1/n-1 zu nehmen ist meines Erachtens mathematisch nur zulässig, wenn es sich um eben alle Daten handelt, d. h. auch die Grundgesamtheit vollständig abbildet.

Es ist vielleicht nicht so mathematisch schön ausgedrückt, aber den Anspruch habe ich nicht. --Kokomiko 11:03, 16. Dez 2004 (CET)

Du hast natürlich recht, die Grundgesamtheit mitreinzubringen. Ich bin bei der Frage automatisch von der Stichprobe ausgegangen, weil sich mir sonst die Frage bezüg. 1/n und 1/(n-1) gar nicht gestellt hätte.
Ob man bei einer reinen Datenbeschreibung, also ohne den Anspruch, die Varianz schätzen zu wollen, n oder n-1 verwendet, ist vermutlich wurscht, denn es sollen ja keine Rückschlüsse auf die Grundgesamtheit getroffen werden.
--Philipendula 11:50, 16. Dez 2004 (CET)

Ich habe eben immer nur die Fragestellungen die GG zu schätzen, bei grossen Messungen = "Stichproben" ist es praktisch egal. Wir haben bei der DGQ (Deutsche Gesellschaft für Qualität) bzw. den Qualitätsdiskussionen eben immer diese Unterscheidung. Ich denke im Rahmen einer Enzyklopädie haben wir eine genügend präzise Darstellung :-).--Kokomiko 12:54, 17. Dez 2004 (CET)

Ja, im Allgemeinen will man Rückschlüsse auf die Grundgesamtheit ziehen, aber eben nicht immer. Ich persönlich verwende immer n-1 in der Vorlesung, da kann ich mir die Verrenkungen ersparen. Von Hand rechnet das eh heutzutage niemand mehr und dem Computer ist es egal. --Philipendula 14:22, 17. Dez 2004 (CET)
Bitte entschuldigt, wenn ich nach dieser Diskussion immer noch nicht verstanden habe, wie das 1/(n-1) in die Gleichung kommt. Kann man anhand eines einleuchtenden Beispiels vielleicht die 1/(n-1)-Verwendung deutlich machen? Danke, --Abdull 11:09, 13. Jul 2005 (CEST)
(n-1) hat einen ganz einfachen Grund. Stell Dir vor, du hat nur eine Messreihe mit lediglich einem Wert. Dann würde der Wert gleich dem Mittelwert sein und die Standardabweichung wäre 0. Das macht aber keinen Sinn (Man würfelt einmal und behauptet der Würfel zeigt immer das selbe an). Besser wäre es einen unendlich großen Fehler anzunehen, da man keine Aussagen über den Fehler machen kann. Man muss mindestens zwei mal messen, um eine Aussage über den Fehler zu bekommen. Nun gibt es den Fall (siehe Ausgleichsrechnung) dass man nicht nur den Mittelwert einer Größe bestimmen möchte, sondern eine Gerade beschreiben möchte. Diese ist gegeben durch zwei Werte (Steigung und Achsenabschnitt). Bei solchen Rechnungen würde man erst ab 3 Messwerten ein echtes Mass für den Fehler bekommen, denn durch zwei Messwerte kann man immer fehlerfrei eine Gerade legen. Bei diesen Rechnungen tritt folgerichtig 1/(n-2) als Vorfaktor auf. Fazit: das (n-1) ist die Anzahl der Messwerte (also hier = n) MINUS Anzahl der Informationen die man erhalten möchte (also hier = 1; den Mittelwert). Boehm 17:18, 14. Jul 2005 (CEST)
Ich bin von der Erklärung von Boehm überzeugt, aber gleichzeitig verwirrt: wenn das von ihm genannte Fazit gilt, dann ist "1/n" immer falsch gewesen. Aber auf vielen Lehrbüchen und Formelsammlungen steht "1/n", sind alle auch falsch? deathyoghurt
Es gibt noch die deskriptive Varianz, bei der auf Rückschlüsse auf die Grundgesamtheit verzichtet wird. Hier ist 1/n gebräuchlich. Und wenn man den Erwartungswert der Grundgesamtheit kennt, ist auch 1/n der richtige Faktor. Allerdings ist das selten der Fall. --Philipendula 17:29, 12. Jan 2006 (CET)

Im englischen Artikel en:Standard_deviation ist es besser erläutert. Es gibt jedenfalls keinen allgemein "richtigen" Schätzwert. 1/n ist bei Normalverteilung der MLE , 1/(n-1) ist unbiased (genauer: das Quadrat ist ein unverzerrter Schätzer für die Varianz), je nach Anwendung kann der eine oder der andere zweckmäßig sein. Meiner Meinung nach sollten beide Werte angegeben werden (NPOV), der englische Artikel zeigt, wie es aussehen könnte. --NeoUrfahraner 07:18, 6. Mär 2006 (CET)

??? standardabweichung / rms ???

dass die standardabweichung gleichbedeutend mit rms ist, wie am anfang des artikels dargestellt, halte ich fuer ein geruecht! vgl. z.b.: http://mathworld.wolfram.com/Root-Mean-Square.html

http://mathworld.wolfram.com/StandardDeviation.html

zitat: "Physical scientists often use the term root-mean-square as a synonym for standard deviation when they refer to the square root of the mean squared deviation of a quantity from a given baseline." --JN

Der Meinung stimme ich voll zu, da der Verweis von rms es ja auch zeigt, daß damit nicht die standardabweichung oder standard deviation gemeint ist. Wir sollten den Artikel im oberen Bereich ändern, ich bin weg bin zum 5.1.05 Tschüß FF --Kokomiko 16:22, 23. Dez 2004 (CET)


wie bekommt man einen Querstrich ueber einen Buchstaben? Einige einzelne (A..) sind als Zeichen vorgesehen, aber...aVe

AB
<div style="text-decoration:overline">AB</div> --Hinrich 13:35, 15. Sep 2004 (CEST)

Ich hätte das Beispiel so gelassen, wie es ist: Schritt für Schritt eine Sache zu erklären. Man sollte immer an den Leser denken. Jeder der sich mit der Standardabweichung nicht auskennt, wird erst einmal von den Formeln erschlagen. Dann hat er Probleme mit den griechischen Bezeichnungen und den Buchstaben die alle X heißen, aber etwas ganz anderes bedeuten, wenn sie zb eine Querbalken darüber haben. Einfache, verständliche Erklärungen sind angesagt. MfG rho

Ich habe sogar ein schlechtes Gefühl dabei, überhaupt ein Rechenbeispiel anzugeben. Wer sind denn die Leser eines Artikels über die Standardabweichung? Ein vernünftiger Ansatz wäre in meinen Augen, die ganze Rechnerei in ein getrenntes Kochbuch auszulagern und im eigentlichen Artikel zuerst einmal anzugeben, dass die Summe der quadrierten Abweichungen vom arithmetischen Mittel 10 beträgt. Das wesentliche an der Standardabweichung ist in meinen Augen nicht, wie die mechanische Berechnung vonstatten geht. Das wesentliche an einem Artikel über die Standardabweichung ist meiner Meinung nach, dass es verschiedene Größen gibt, die aus verschiedenen Gründen berechnet werden, die aber alle Standardabweichung genannt werden. -- kw

(Konstruktive) Anregung:

Wäre es okay, wenn ich im Laufe der Zeit einige (imho) Interpunktionsnachlässigkeiten korrigiere (oder zumindest zur Diskussion stellte)?

Der Inhalt des Artikels liesse sich (nach meinem persönlichen Empfinden) schneller und prägnanter erfassen, wenn das lernwillige Bewußtsein nicht so stark mit der logischen Zuordnung von Haupt- und Nebensätzen beschäftigt wäre.

jaabdaaj 03:33, 2. Apr 2003 (CEST)

Hi jaabdaaj, willkommen in der Wikipedia! Bei uns heißt es erst schießen, dann Fragen stellen ;-) - Also ruhig drauflos editieren, wenn jemand Deine Änderungen nicht gefallen wird er oder sie sich schon melden. Insbesondere Verbesserungen der Interpunktion bedürfen wohl kaum einer vorausgehenden Diskussion. Also nur zu, und viel Spaß ... --Kurt Jansson 05:31, 2. Apr 2003 (CEST)

Ich habe mir die Ursprungsfassung angeschaut. Da steht ganz einfach drin, was Standardabweichung ist. Jetzt scheint es mir deutlich komplizierter. Vielleicht hilft ein Hinweis zu Statistischen Momenten. RaiNa 17:04, 30. Jan 2004 (CET)


verschoben aus dem zum löschenden Artikel ZuStandardabweichung:

"zu dem Beitrag Standardabweichung:

Ich denke, man sollte wirklich ganz einfach erklären, dass es eine sehr einfache Verteilung gibt, die sich ergibt, wenn man die Münze wirft und dass diese Verteilung eine Fläche, einen Schwerpunkt und ein Standardabweichung hat

Wenn ich eine Münze werfe ist das Ergebnis Bernoulli-verteilt. Um etwas so einfaches wie eine Maßzahl für die Streuung einzuführen würde ich ungern den zentralen Grenzwertsatz herleiten oder veranschaulichen müssen.
Die Verteilung bei vielen Münzwürfen ist eine Binomialverteilung, und die Konvergenz in Verteilung der diskreten Binomialverteilung gegen die stetige Normalverteilung ist ebenfalls etwas, was ich nicht unbedingt mit einer einfachen Streuungsmaßzahl in Verbindung bringen würde.
Wenn die Streuungsmaßzahlen gegenübergestellt werden, dann ist die Logik
  • der Spannweite und
  • der durchschnittlichen absoluten Abweichung von dem Wert, von dem die durchschnittliche absolute Abweichung am kleinsten ist
etwas, was ganz gut hinführt zur durchschnittlichen quadratischen Abweichung von dem Wert, für den die durchschnittliche quadradische Abweichung am kleinsten ist. Für den Übergang von der Varianz zur Standardabweichung als Streuungsmaßzahl finde ich das Argument mit den Quadratkindern (oder zu gegebener Zeit den Quadradmaßkrügen) recht einsichtig. Eine Streuungsmaßzahl, die in der Einheit des betrachteten Untersuchungsmerkmals gemessen wird, ist einfach verlockender.

und dass man einfach eine beliebige Verteilung dahingehend überprüft, ob sie eine Gaußverteilung ist oder ihr zumindest ähnlich ist.

Warum tut man das? Vor allem, warum tut man das, wenn man eine Maßzahl für die Streuung eines Untersuchungsmerkmals sucht?

Die meisten Leute haben ja schon Probleme damit, dass in einer Klasse die mittlere Note 3 ist, aber keine mittleren Schüler existieren, sondern nur die Einserschüler und die Fünferkandidaten.

Also sollte der Aufbau meiner Meinung nach so sein:

Standardabweichung: siehe Gaußverteilung

und danach folgende Beispiele, Erläuterungen, ...


Im Artikel Gaußverteilung steht dann:

Gaußverteilung als Grenzfall der binären Verteilung,
hat Kennwerte Fläche -->Link
              Schwerpunkt --> Link
              Standardabweichung --
              ....
Dass die Fläche ein Kennwert der Gaußverteilung ist und wo bei der Bernoulli-Verteilung für Nicht-Maßtheoretiker anschaulich eine Fläche vorkommt ist für mich nicht einsichtig.


Und dann ein paar schöne Geschichten zur Gaußverteilung. Da gibt es unendlich viele, da meiner Meinung nach nichts wichtiger ist.

Diese Meinung teile ich nicht, aber niemand hindert Dich daran, die Normalverteiung mit schönen Geschichten anzureichern. Auch der Hinweis, daß eine Normalverteilung durch die Angabe von Erwartungswert und Standardabweichung vollständig beschrieben ist, ist sicher nett.

Ich würde schon ganz gerne an einem solchen Projekt mitmachen. RaiNa 12:51, 20. Feb 2004 (CET)"

--AndreasE


Bei meiner aktuellen Browser-Einstellung (Mozilla, bestimmte Breite, bestimmter Font, ...) bekomme ich folgenden Umbruch:

"Die eindimensionale Normalverteilung kann unter anderem so dargestellt werden, dass die

Standardabweichung ein Parameter der Verteilung ist. Bei dieser Schätzung kann die Eigenschaft der

Maximum-Likelihood-Schätzung genutzt werden, dass eine monotone Transformation einer Maximum-Likelihood-Schätzung eine

Maximum-Likelihood-Schätzung für die monotone Transformation des geschätzten Parameters ist. Das bedeutet, dass die Quadratwurzel einer

Maximum-Likelihood-Schätzung eines Parameters, der nur positiv sein kann, eine

Maximum-Likelihood-Schätzung für die Quadratwurzel dieses Parameters ist."

Das sieht doch sehr hässlich aus. Gibt es eine geeignete Abkürzung für "Maximum-Likelihood-Schätzung"?


Im allgemeinen wird "ML-Schätzung" oder "MLS" verwandt.

Der Troll 18:08, 10. Aug 2005 (CEST)

Zum Schwankungsbreiten-Beispiel

Ich finde das Beispiel nicht sonderlich gelungen. Zuerst einmal bekommt man den Begriff Schwankungsbreite ohne Erläuterung zugeworfen, dann werden die Variablen MW und s nicht deklariert, und schließlich kann man nicht erkennen, was denn im Beispiel nun die Standardabweichung ist. Hoffentlich kann das jemand verbessern... --Head Diskussion 11:55, 28. Jul 2004 (CEST)

Zum Abschnitt 'Erwartungstreue Schätzung der Standardabweichung aus einer Stichprobe'

Bezeichnungen wie oben ist leicht dämlich, weil oben weder ein sigma-Dach noch ein Gamma auftaucht. Ein bisschen Text, worum es überhaupt geht, wäre auch nicht schlecht. --Head Diskussion 12:00, 28. Jul 2004 (CEST)

das i-te Element

Vielleicht kann jemand in dem Abschnitt "Berechnung" noch erklären, was genau unter dem i-ten Element zu verstehen ist. Ansonsten kann ich die Gleichung nicht anwenden, da nicht klar ist, welcher Wert hierfür einzusetzten ist.

Wenn beispielsweise die Grundgesamtheit eine Urne mit 5 Kugeln ist, die jeweils mit einer Zahl beschriftet sind, dann ist beispielsweise die Zahl auf der 2. Kugel das zweite Element. --Philipendula 15:12, 30. Dez 2004 (CET)

Änderung Standardabweichung

RaiNa schreibt: Hallo Anton, ich bin über die Änderung bei Standardabweichung nicht sehr glücklich. Den gelöschten Satz so hinzukriegen war schon recht schwierig. Aber nun ist viel verloren gegangen. Bitte nochmal genau nachlesen! Zum Beispiel kann eine Zufallsvariable doch keinen Fehler haben. Sie ist eben zufällig. So was müsste man korrigieren. Also, bitte noch mal in Dich gehen! RaiNa 18:59, 12. Feb 2005 (CET)

Ich habe kein Problem, die Änderungen zurück zu nehmen. Der ganze Artikel müsste dringend überarbeitet werden, und es nur bei der Einleitung zu belassen, ist wohl nicht ausreichend. Nebenbei: ich hatte geschrieben: Die Standardabweichung ist ein Maß für die Streuung von Zufallswerten um einen Mittelwert. und Die Standardabweichung macht eine Aussage über die Meßgenauigkeit. Sind die Messungen normalverteilt, gibt die Standardabweichung die Fehlerbreite an, in der 68% aller Messergebnisse liegen. Was genau mit Fehlern von Zufallsvariablen gemeint sein soll, weiß ich auch nicht. Anton 00:49, 13. Feb 2005 (CET)

Frage

Hallo

ich habe folgendes problem: ich habe einen Wert gegeben x für den gilt: "x shall correspond to the maximum value anticipated" das heißt x gibt nicht die maximale häufigkeit sondern den maximalen wert der funktion an

die funktion ist normalverteilt, also sollte sie meiner meinung nach gar keinen maximalen wert haben!? aber vermutlich geht man davon aus, dass die häufigkeit irgendwann gegen null geht und das soll dann der maximalwert sein

ich möchte aber eigentlich die standardabweichung wissen gibt es einen zusammenhang zwischen maximum und standardabweichung?

ich hätte jetzt gesagt, dass das maximum ja ungefähr 2*standarddev sein muss (etwas größer, aber 2*standarddev entspricht ja ungefähr 95% der werte) und dass dann der halbe wert des maximums der standardabweichung entspricht was haltet ihr davon?

danke für die hilfe!

Hallo Bar, die Normalverteilung gibt Auskunft über Häufigkeitkeiten, während dein Zitat von einer Meßkurve zu sprechen scheint. Beispiel Messen des Durchmessers von Äpfeln; x-Achse = Nummer (nicht Anzahl!) der Messung, y-Achse= Meßwert. Werden nur endlich viele Äpfel gemessen, gibt es auch einen größten Apfel. Dies sagt aber nichts darüber aus, ob es auch viele große Äpfel gibt.
Anton 21:37, 3. Jun 2005 (CEST)
PS: Fügst du die vier Zeichen ~~~~ an deine Kommentare an, ersetzt das System sie automatisch mit deinem Namen und Datum.
Hallo, gemeint könnte auch der Erwartungswert der Maxima der Stichproben sein. Wenn Du Stichproben â 10 Stück ziehst und jeweils die Maxima der Stichproben erfasst, sind diese nicht mehr normalverteilt. Deren Verteilung resultiert aus der Überlegung, dass die Wahrscheinlichkeit an jedem Punkt gleich der Wahrscheinlichkeit ist, dass keiner der gezogenen Werte den Punkt übersteigt

Wobei die Dichtefunktion und die Verteilungsfunktion der Standardnormalverteilung ist.
Der Troll 4. Jul 2005 15:34 (CEST)

Schnellere Berechnungs-Formel?

Wäre es nicht nett, die "schnelle" Berechnung direkt auf Summe und Summe d. Quadrate zu erwähnen? In der englischen Version stehen die auch drin.

Du meinst vermutlich den Verschiebungssatz. Der gehört eigentlich zu Varianz, aber da ist die Stichprobenvarianz nicht drin. Überhaupt finde ich die Trennung von Varianz und Standardabweichung nicht so glücklich. --Philipendula 11:25, 29. Jun 2005 (CEST)
In http://en.wikipedia.org/wiki/Standard_deviation heißt die einfach "shortcut calculation". Ich bin kein Mathematiker, deswegen würde ich's auch nicht selbst ändern wollen, aber wenn ich als Programmierer "Standardabweichung" nachschlage, dann meistens weil ich die Formel vergessen hab...
Außerdem ist der Verschiebungssatz nicht automatisch die schnellste Lösung. Wenn die Durchschnitte glatte Zahlen sind, ist die Berechnung mit den zentrierten Werten schneller und eleganter, weil die Zahlen kleiner werden. UNd mit dem Verschiebungssatz rechnet man ohnehin nur per Hand und nicht mit dem Computer. --Philipendula 4. Jul 2005 15:40 (CEST)

Ich habe jetzt mal die "running sums" Variante reingeschrieben. Die ist in manchen Umgebungen (s. Beitrag) echt vorteilhaft. Zu vs. : Wenn man die Umformung per Hand macht gibt es . (Ein Professor von mir pflegte zu sagen: "Wenn das einen Unterschied macht, hat man sowieso ein zu kleines ...").


Anleitung zur Berechnung für Nicht-Mathematiker

Für Menschen, die wie ich Mathe-Analphabeten sind, füge ich hier mal eine Anleitung zur Berechnung der Standardabweichung ein. So was hab ich mal gesucht und leider nicht (für mich) verständlich in der Wikipedia gefunden. Ich hoffe, die Mathematiker steinigen mich nicht gleich dafür und es stimmt so. Also:

Sagen wir, Du hast folgende 18 Messwerte: 245 nm, 266 nm, 252 nm, usw., und der Mittelwert ist 260 nm. Jetzt ziehst Du von jedem Meßwert den Mittelwert ab, quadrierst das Ergebnis und addierst alles: (245 nm - 260 nm)² + (266 nm - 260 nm)²+ (252 nm - 260 nm)² + usw. für alle 18 Meßwerte. Das Ergebnis ist 3321 nm, das teilst Du durch die Anzahl der Meßwerte minus 1 (also hier durch 17) und ziehst daraus die Wurzel, das ergibt 14 nm. Damit hast Du: 260 nm ± 14 nm. Fertig.

Jaja ich weiß, es ist eine Enzyklopädie und kein Kochbuch, aber auf der Diskussionsseite könnte man das doch stehen lassen? --Morinn 19:46, 1. Sep. 2007 (CEST)

? oder auf Grund des Speicherbedarfs auch unmöglich ?

"In Systemen, die kontinuierlich große Mengen an Messwerten erfassen, ist es oft unpraktisch  ? oder auf Grund des Speicherbedarfs auch unmöglich ? alle Messwerte zwischenzuspeichern, um die Standardabweichung zu berechnen." - Das Fettgedruckte hab ich rausgenommen, da es definitiv keine Formulierung für den Artikel ist, sondern für die Diskussionsseite. Peritus 23:24, 16. Nov 2005 (CET)

Also hier stimmt was nicht!!!

"Möchte man die Varianz ohne vorherige Mittelwertberechnung aus der Stichprobe errechnen, ist folgende Formel nützlich:"


und weiter unten dann

"Durch Anwendung der 2. binomischen Formel und der Definition des Mittelwerts gelangt man zur Darstellung"

hier steht offensichtlich zweimal dasselbe, aber zugleich soll es sich um zwei verschiedene dinge handeln. wie kann das sein?

gruß unbekannt

Nein, es soll sich beides Mal um das selbe handeln, allerdings stand ein Mal irrtümlicherweise Varianz statt Standardabweichung und es wurde die Notation gewechselt. Ich habe es korrigiert; vielleicht wird es jetzt klarer. --NeoUrfahraner 09:51, 3. Apr 2006 (CEST)

Mathematische Definition

Wieso wird die standardabweichung als definiert und nicht als ? Wofür das "-1" im Nenner? Erscheint mir nicht schlüssig, Stern 23:28, 22. Apr 2006 (CEST)

Das N-1 statt dem N erscheint für die Schätzung der Standardabweichung, falls der Erwartungswert durch den Mittelwert geschätzt werden muß.


Verständnisproblem

Bitte nicht mißverstehen, aber ich verstehe aus dem Artikel so gut wie nichts! Schlägt man unter dem Begriff "Standardabweichung" nach so wird diese durch die Varianz erklärt; schlägt man unter den Begriff "Varianz" nach, so wird die Varianz mit der Standardabweichung erklärt... also dreht man sich im Kreis:( Vergleichbare Aussage wäre: Anisotrop ist der Gegensatz zu Isotrop. Isotrop ist der Gegensatz von Anisotrop

Also ich hoffe ich erzähle jetzt nichts Falsches (ist schon so 4 bis 5 Jahre her, dass ich mich damit rumschlagen musste), aber die Standardabweichung ist doch nur die Wurzel aus der Varianz, d.h. die Varianz ist die quadrierte Standardabweichung. --NickKnatterton - Kommentar? 21:54, 4. Mai 2006 (CEST)

Ja, vom Prinzip schon ,aber wer soll das sich Bildlich vorstellen? Es wäre schon eine große Hilfe, wenn man zum Anfang erwähnen würde, daß die Varianz ein Maß für die Streuung um den Mittelwert ist und die Standardabweichung die durchnittliche mittlere Abweichung der Zufallsvariablen ist. Sehr schön könnte man es z.B. mit einen praktischen Versuch erklären um es verständlich zu machen oder mit einer Zeichnung verdeutlichen usw... da gibt es sicherlich gute Beispiele. Man könnte vielleicht ein Beispiel bringen, in dem man versucht den zurückgelegten Weg eines Teilchens zu ermitteln und an sich feststellen würde daß die Werte jedoch immer etwas unterschiedlich ausfallen und darüber die Standardabweichung erklären und dann die Varianz. Also eine kurze Einführung mit einfachen verständlichen Wörtern für alle und dann kann man es sehr mathematisch machen. Ich denke, daß dann die Erwartungen von jedem erfüllt werden, da der Artikel dann unterschiedliche Schwierigkeitsgrade hätte.

Standardabweichung = RMS?

Die Standardabweichung heißt auch mittlerer Fehler oder RMS error (von engl. root mean square). Kann mir jemand bitte erklären, warum bei der englischen Wiki[| Wiki] eine andere Definitionsformel für RMS steht? Bei uns steht: :

und bei den Leuten von en: :

Für große N gehen sie ineinander über. Aber ich bin verwirrt, wegen der unterschiedlichen Formeln. --Stimpson 14:54, 21. Jul 2006 (CEST)

Geht es um N vs. N-1? Siehe dazu auch meine Meinung weiter oben: Im englischen Artikel en:Standard_deviation ist es besser erläutert. Es gibt jedenfalls keinen allgemein "richtigen" Schätzwert. 1/n ist bei Normalverteilung der MLE , 1/(n-1) ist unbiased (genauer: das Quadrat ist ein unverzerrter Schätzer für die Varianz), je nach Anwendung kann der eine oder der andere zweckmäßig sein. Meiner Meinung nach sollten beide Werte angegeben werden (NPOV), der englische Artikel zeigt, wie es aussehen könnte. --NeoUrfahraner 10:35, 27. Jul 2006 (CEST)
Mir geht es auch um die Unterschiede in den Termen der Summe. Einmal wird der Mittelwert abgezogen und das andere mal nicht. --Stimpson 12:53, 21. Aug 2006 (CEST)
Das steht, wie so manches andere auch, ein wenig unklar im Artikel. Gemeint ist wohl The standard deviation is the root mean square (RMS) deviation of the values from their arithmetic mean, vgl. en:Standard deviation. --NeoUrfahraner 15:27, 21. Aug 2006 (CEST)

überarbeiten

Ich habe jetzt den Überarbeiten Baustein heineingesetzt. Verdeutlicht werden sollte meiner Meinung nach die Sache mit N vs. N-1 (siehe z.B. den englischen Artikel fuer die statistischen Eigenschaften) sowie die RMS-Frage (siehe vorigen Abschnitt). --NeoUrfahraner 15:33, 21. Aug 2006 (CEST)

Hallo NeoUrfahraner, trafen wir uns nicht einmal beim Bogenmaß? Dann werde ich diesen Artikel wohl auch aus meiner Beobachtung herausnehmen. Zu deiner Frage: siehe meinen Kommentar oben: (Nachtrag zur Diskussion: siehe Artikel bzw: 1/n, wenn Gesamtheit vorliegt, 1/(n-1), wenn nur eine Teilmenge der Gesamtheit (Stichprobe) vorliegt. Grund: Verlust eines Freiheitsgrades, wenn der Mittelwert abgeschätzt werden muss. Anton 12:21, 13. Feb 2005 (CET)). Gruß, Anton 16:23, 21. Aug 2006 (CEST)
So einfach ist es leider nicht, siehe en:Standard deviation. Bei der Varianz stimmt es, da liefert das Ersetzen von n durch n-1 einen erwartungstreuen Schaetzer. Die Standardabweichung ist aber die Wurzel der Varianz, und die Wurzel eines erwartungstreuen Schaetzers fuer die Varianz ist eben kein erwartungstreuer Schaetzer fuer die Wurzel der Varianz. Dafuer ist die Variante mit 1/n der MLE im Fall normalverteilter Zufallsgroeßen. Mit anderen Worten, werder die Variante mit n noch die Variante mit n-1 ist "richtig", beide sind Schaetzwerte mit gewissen statistischen Eigenschaften, von denen je nach Anwendung der eine oder der andere besser geeignet ist. --NeoUrfahraner 16:42, 21. Aug 2006 (CEST)


1/n und 1/(n-1): So isses

Also meinem Verständnis nach verhält sich das so: Mathematisch sind Mittelwert und Varianz einer beliebigen Verteilung definiert als

und

dabei ist die Varianz einfach der Mittelwert der quadratischen Abweichung der Einzelwerte vom Mittelwert. Quadratisch deshalb, weil sich einfacher Summierung ohne vorheriges Quadrieren positive und negative Abweichungen einfach zu Null wegmitteln könnten. Die Wurzel der Varianz, die Standardabweichung , hat wiederum den Vorteil, die gleiche Einheit wie die Messwerte zu haben (s. das schöne Beispiel mit den Quadratkindern weiter oben).

In der Physik versucht man nun aus einer endlichen Anzahl von Messwerten, für die man eine Verteilungsfunktion annimmt, bzw. kennt, eine Schätzung für den Mittelwert und für die Breite dieser Verteilung zu erhalten. Dazu benutzt man im allgemeinen die "Maximum Likelihood Methode": Für eine bekannte Verteilungsfunktion wird der beste Schätzwert, jeweils für den Mittelwert und die Breite der Verteilung gesucht. Da in der Physik hauptsächlich poisson- und gaussverteilte Größen vorkommen, werden in den Standardwerken der Literatur auch nur für diese beiden Funktionen Ausdrücke hergeleitet. Für die Gaussverteilung (Normalverteilung) ergibt sich als bester Schätzwert für die Mitte der Verteilung, also der Gausskurve, der o.g. Mittelwert der Messwerte, also wieder

und als Schätzwert für dessen Unsicherheit, oder auch den "Fehler des Mittelwerts"

. Achtung: Das ist jetzt noch nicht die Breite der Verteilung, die wir mit bezeichnen. Die kommt jetzt erst.

Für endliche Anzahlen von Messwerten ergibt sich nun, dass der Schätzwert für die Varianz den wahren Wert der Verteilungsbreite unterschätzt, und zwar:

Der Grund hierfür ist, dass bei kleinen Mengen von Messdaten Messwerte mit sehr großen Abweichungen zu selten vorkommen und deshalb die Breite der Gaussverteilung im allgemeinen unterschätzt wird. In der Praxis schätzt man die Breite der zugrundeliegenden Verteilung deshalb besser ab mit:

Daher das N-1, das eigentlich immer nur für Verwirrung sorgt. Ich hoffe dass die ganze Sache hierdurch ein bischen klarer geworden ist, und dass die Physikassis jetzt ein bischen weniger leiden müssen.

Peter


Das mit dem N-1 sollte eigentlich daran liegen, dass man statt EX den Schätzer xquer verwendet. --Philipendula 17:06, 25. Okt. 2006 (CEST)

Hallo, ich habe die von Peter skizierten Rechnungen frei nach dem englischen Artikel en: Maximum-Likelihood in das Lemma Maximum-Likelihood-Methode übertragen, siehe Maximum-Likelihood-Methode#Beispiel. Man könnte/sollte diese Rechnungen vielleicht aber in den Artikel Erwartungstreue oder hierher oder in das wikibook Statistik verschieben. --OlafsWissen 19:05, 25. Mär. 2007 (CEST)

Die Berechnung des Erwartungswerts der Varianzschätzung passt meines Erachtens am besten in den Artikel Empirische Varianz, der im Nov 2006 von Benutzer:Chrisqwq aus Varianz ausgegliedert wurde. Ich persönlich halte diese Zersplitterung zwar nicht für sinnvoll, aber jedenfalls bietet der bisher kurze Artikel Empirische Varianz genügend Platz für diese Berechnung, sodass man dann von Maximum-Likelihood-Methode#Beispiel dorthin verweisen kann. --NeoUrfahraner 08:48, 26. Mär. 2007 (CEST)
Ich fand die Zersplitterung auch nicht sinnvoll. Wenn du wieder einen großen Artikel draus machen willst, hast du meine volle Unterstützung, zumal der User zwar organisatorisch ausgegliedert hat, aber das dann offensichtlich nicht umsetzen konnte oder wollte. --Philipendula 09:59, 26. Mär. 2007 (CEST)
Also ich selber werde mir nicht die Mühe machen, die Artikel wieder zusammenzuführen. Die organisatorische Ausgliederung an sich kann ich bis zu einem gewissen Grad akzeptieren; das Hauptproblem ist eben, dass die Aufteilung viel zu früh erfolgte und, wie Du schon gesagt hast, mangelhaft umgesetzt wurde. Die Ausgliederung wieder rückgängig machen ist aber wohl auch nicht so einfach. --NeoUrfahraner 11:08, 26. Mär. 2007 (CEST)
Och, sooo schwierig wäre das IMHO gar nicht. Man könnte das als weiteren Unterpunkt in Varianz einfügen. Es ist die Frage, was man will: Die Trennung in Grundgesamtheit und Stichprobe ist nur sinnvoll, wenn bei Stichprobe was Wesentliches bei rumkommt. Tut es aber nicht. Die 5 Zeilen in der Stichprobenvarianz können problemlos wieder bei Varianz eingegliedert werden, zumal ja noch ein eigener Artikel Standardabweichung existiert. Außerdem sollte man überlegen, ob noch die zusätzliche Abspaltung der Varianz des Stichprobenmittels sinnvoll ist, insbesondere hier auch wieder die Trennung in GG und Stichprobe. Aber wie heißt es so nett: Et jibt nischt Jutet, außer man tut et. --Philipendula 11:43, 26. Mär. 2007 (CEST)
Wie schon gesagt, ich werde die Artikel nicht zusammenführen. Wenn es aber jemand anderer machen will, ist es mir durchaus recht. --NeoUrfahraner 08:10, 27. Mär. 2007 (CEST)

Was die Sache bei der Standardabweichung komplizierter macht

Ja. Nimmt man für die Varianz den Schätzer

so ist das ein erwartungstreuer Schätzer:

.

Was die Sache verkompliziert, ist allerdings, dass die Wurzel des erwartungstreuen Schätzers für die Varianz kein erwartungstreuer Schätzer für die Standardabweichung ist:

Denn für konkave Funktionen gilt nach der Jensenschen Ungleichung

,

also

;

der vorgeschlagene Schätzer unterschätzt also die Standardabweichung. Da man nun leider keinen schönen erwartungstreuen Schätzer angeben kann, wird daher auf en:Standard deviation empfohlen, gleich bei zu bleiben, weil der MSE gleichmäßig kleiner wäre (letzteres aber ohne Quellenangabe) --NeoUrfahraner 17:36, 25. Okt. 2006 (CEST)

Aso, stimmt, wir sind ja hier bei Standardabweichung. Ich war geistig bei der Varianz. Da laufen immer ähnliche Diskussionen ab. --Philipendula 17:59, 25. Okt. 2006 (CEST)
In dem Artikel herrscht immer noch ein gewisses Durcheinander. Aber irgendwie hat auch niemand Lust, das mal zu systematisieren ... --Philipendula 19:56, 25. Okt. 2006 (CEST)
Bin überhaupt kein Experte auf diesem Gebiet, habe aber beim Suchen nach Orientierung das Internetlexikon für Empirische Sozialforschung gefunden. Ich glaube, dort kann man sehen, wie diese Sachverhalte einfacher und anschaulicher erklärt werden können, ohne mathematisch ungenau zu sein. Die URL: [1]. --Konrad II 17:14, 27. Okt. 2006 (CEST)

Lieber NeoUrfahraner, Deine Rechnung mit der Jensenschen Ungleichung stimmt zwar, nur ist das kein Beweis. Man muss ein konkretes Beispiel dafür angeben, dass die Standardabweichung unterschätzt wird. OlafsWissen

Was meinst Du damit, dass es "kein Beweis" ist? Meinst Du damit, dass in der angegebenen Form die Jensensche Ungleichung nur "kleiner gleich", nicht aber "echt kleiner" liefert? --NeoUrfahraner 11:03, 21. Mär. 2007 (CET)
Ja, so war das gemeint. Schau doch bitte mal, ob Du diesen Punkt im Artikel so jetzt unmissverständlicher findest. Gibt es ein einfaches Beispiel, das die Unterschätzung zeigt?

OlafsWissen 14:05, 21. Mär. 2007 (CET)

Da die Wurzel strikt konkav ist, sollte die Jensensche Ungleichung bis auf den Trivialfall immer "echt kleiner" liefern. Du hast aber recht, ein Beispiel ist wohl anschaulicher. Mit Ausnahme des Trivialfalls lässt sich da jede jedes Beispiel wählen, das einfachste ist wohl der Wurf einer fairen Münze, wobei die Ergebnisse mit -1 oder +1 bezeichnet werden (Mittelwert 0, ). Kennt man die Ausgangsverteilung nicht und schätzt die Standardabweichung aus zwei Münzwürfen, so erhält man mit jeweils Wahrscheinlichkeit 1/4 die Werte (-1,-1), (-1,+1), (+1,-1) und (+1,+1). ist dann jeweils 0,2,2,0; (also die Varianzschätzung ist erwartungstreu) und (also die Stichprobenstandardabweichung unterschätzt den Wert). Soll ich das als Beispiel einbauen? --NeoUrfahraner 21:52, 21. Mär. 2007 (CET)
Ja, nun fällt es mir wie Schuppen von den Augen. --OlafsWissen 09:53, 22. Mär. 2007 (CET)
Ich habe das Beispiel eingebaut. Einverstanden? --NeoUrfahraner 10:04, 22. Mär. 2007 (CET)
Sehr schön gemacht. Mein "eventuell" stört mich jetzt noch. Da die einzige Ausnahme der Trivialfall ist, der wohl in der Praxis kaum vorkommt, läßt sich da wohl auch noch eine bessere Formulierung finden. Sollen wir aus dem "eventuell" ein "in der Regel", "in den meisten Fällen" oder "in der Praxis" machen oder hältst Du es für besser, auf die strikte Konvexität hinzuweisen? --OlafsWissen 13:40, 22. Mär. 2007 (CET)
Ich habe mich für "in den meisten Fällen" entschieden. Die strikte Konvexität baue ich lieber nicht in den Artikel ein, dazu müsste man das vorher im Artikel Jensensche Ungleichung behandeln; eine saubere Behandlung erfordert da aber wohl relativ viel Aufwand, der Zusatznutzen ist aber IMHO gering. --NeoUrfahraner 14:21, 22. Mär. 2007 (CET)

Was tun mit den Faustregeln?

Ich habe jetzt den Artikel ein wenig überarbeitet. Unklar ist mir noch, was mit folgenden beiden Faustregeln passieren soll:

Faustregeln für die Praxis sind: Werte außerhalb der zwei- bis dreifachen Standardabweichung nennt man Ausreißer. Ausreißer können ein Hinweis auf grobe Fehler der Datenerfassung sein. Es kann den Daten aber auch eine stark schiefe Verteilung zu Grunde liegen. Andererseits muss ca. jeder 20ste Messwert außerhalb der zweifachen Standardabweichung liegen.

Erstens führt der Abschnitt IMHO vom Thema fort, zweitens ist das mit den Ausreißern sowieso komplizierter.

Zur schnellen Schätzung von sucht man jenes Sechstel der Werte, die am kleinsten beziehungsweise am größten sind. Die Standardabweichung ist dann die halbe Differenz der beiden Grenzwerte. Bei unübersichtlichen Verteilungen oder wenn man nur „im Kopf“ rechnen kann, geht auch folgende Abschätzung: (Maximalwert-Minimalwert)/3. Erstaunlicherweise liefert diese Schätzung sowohl bei Normalverteilungen wie Gleichverteilungen oder hohen Variationskoeffizienten gute grobe Schätzungen.

Das mit dem Sechstel ergibt sich klarerweise daraus, dass bei der Normalverteilung ca. 2/3 der Werte in sind, ist also nicht wirklich erstaunlich; für Gleichverteilungen bezweifle ich, dass es eine gute grobe Schätzung ist. (Maximalwert-Minimalwert)/3 ist eine seltsame Faustformel, da insbesondere bei Normalverteilungen dieser Wert für wachsenden Stichprobengröße immer größer wird. --NeoUrfahraner 22:30, 27. Nov. 2006 (CET)

Ich habe jetzt die Ausreißer-Formulierung entschärft und die von einem anonymen Benutzer ohne Quellen beigsteuerte Faustregel (Maximalwert-Minimalwert)/3 entfernt. --NeoUrfahraner 08:37, 28. Nov. 2006 (CET)

BKL am Anfang

Brauchen wir die BKL am Anfang des Artikels? Die Standardabweichung der Stichprobe wird ja gar nicht in Stichprobenvarianz behandelt, sondern derzeit immer noch in Standardabweichung; verschieben erscheint mir nicht zweckmäßig. Der Verweis auf Standardfehler für die Standardabweichung der Stichproben-Mittelwerte erscheint mir auch nicht zwechkmäßig, die Stichproben-Mittelwerte haben genauso wie jede andere Zufallsvariable mit endlichen zweiten Momenten eine Standardabweichung, darauf braucht IMHO nicht extra verwiesen werden. --NeoUrfahraner 08:51, 28. Nov. 2006 (CET)

  • Stichprobenvarianz will ich noch ausbauen. Standardfehler ist von zentraler Bedeutung für de Statistik und nicht die Standardabweichung irgendeiner Zufallsvariable. Darüber hinaus finde ich es zumindest für Stdabw. der Stichprobe (Stichprobenvarianz) grundsätzlich sinnvoll, bei gleichem Begriff auf den anderen zu Beginn hinzuweisen. Für nicht-statistiker ist das sonst nicht überschaubar. --Chrisqwq 09:30, 28. Nov. 2006 (CET)
"Standardfehler" und "Standardabweichung" klingen tatsächlich ähnlich und können daher verwechselt werden; BKL ist dann wohl passend. Was aber soll in Stichprobenvarianz dazukommen bzw. was soll dann in Standardabweichung übrigbleiben, was nicht zur Standardabweichung der Stichprobe gehört? Dieser Teil nimmt momentan ja weit mehr als die Hälfte des Artikels ein. --NeoUrfahraner 09:42, 28. Nov. 2006 (CET)

Standardabweichung bei laufend aktualisierten Werten (running sums)

Hilfe!

In dem Wikipedia-Artikel zur Standardabweichung wird eine alternative Berechnungsmethode vorgestellt, die sich für die dauernde Aktualisierung bei neu eintreffenden Werten eignet. Dann sollen nicht noch einmal alle Werte aus der Vergangenheit durchgeackert werden, sondern es genügt, drei Kennwerte zu halten und zu aktualisieren: Anzahl der Werte, deren Summe und Summe von deren Quadraten.

Anhand des einfachen Beispiels in dem Artikel (mit 5, 6, 8, 9) habe ich die alternative Formel ausprobiert und komme auf ein anderes Ergebnis: sqrt(10/3) anstatt sqrt(10/4) Intensive Überprüfungen des Rechengangs und Berechnung in Excel erbrachten dasselbe Ergebnis.

Es scheint, als ob die Formel für "running sums" falsch sei. Damit fällt mein Redesign für eine Anwendung mit Millionen von Werten in den Bach. Andere Autoren zitieren zwar auch diese schlaue Formel, aber nirgendwo wird ein Vergleich der Ergebnisse angestellt! Hat hier einer vom anderen abgeschrieben?

Antworten und Hinweise erbitte ich an Horst.vanBremen@db.com je eher, desto besser! (Der vorstehende, nicht signierte Beitrag stammt von 129.35.231.17 (DiskussionBeiträge) )

Die Formel stimmt. Damit wir über dasselbe sprechen:
--85 [?!] 19:52, 7. Feb. 2007 (CET)

Korrekte Berechnung der Standardabweichung bei "Running Sums"

Nachdem ich, Horst van Bremen, am 7.2.2007 meinen Kommentar zu der falschen Formel eingestellt hatte, habe ich die richtige Formel hergeleitet. Leider stehen mir hier keine mathematischen Symbole zur Verfügung; daher muss ich mit Textzeichen arbeiten.

Der Kernterm der Standardabweichung ist sum<1,N>(xi-xquer)^2, wobei sum<1,N> das Summensymbol bedeutet, xi einen Einzelwert mit i = 1 ... N und xquer den Mittelwert. Mit ^2 ist das Quadrieren gemeint.

Es gilt nach dem 2. binomischen Satz:

sum<1,N>(xi-xquer)^2 = (x1-xquer)^2 + (x2-xquer)^2 + (x3-xquer)^2 + ... + (xN-xquer)^2 = (x1^2 - 2*x1*xquer + xquer^2) + (x2^2 - 2*x2*xquer + xquer^2) + (x3^2 - 2*x3*xquer + xquer^2) + ... + (xN^2 - 2*xN*xquer + xquer^2)

umgeordnet: = x1^2 + x2^2 + x3^2 + ... + xN^2

 - 2*x1*xquer - 2*x2*xquer - 2*x3*xquer - ... - 2*xN*xquer
 + N*xquer^2 (wegen der N Quadratterme)

Zwischenrechnung: - 2*x1*xquer - 2*x2*xquer - 2*x3*xquer - ... - 2*xN*xquer = -2*xquer*(x1 + x2 + x3 + ... + xN) = -2*xquer*sum<1,N>xi

Die Summe im ersten Teil der umgeordneten Formel ist sum<1,N>xi^2 Damit ergibt sich weiter unter Verwendung von xquer = (sum<1,N>xi)/N:

sum<1,N>(xi-xquer)^2 = sum<1,N>xi^2 -2*xquer*sum<1,N>xi + N*xquer^2 = sum<1,N>xi^2 -2*((sum<1,N>xi)/N)*sum<1,N>xi + N*((sum<1,N>xi)/N)^2 = sum<1,N>xi^2 -2*(1/N)*(sum<1,N>xi)^2 + (1/N)*(sum<1,N>xi)^2 (N gekürzt gegen N^2) = (1/N)*(N*sum<1,N>xi^2 -2*(sum<1,N>xi)^2 + (sum<1,N>xi)^2) = (1/N)*(N*sum<1,N>xi^2 -(sum<1,N>xi)^2)

Mit sigma = sqrt((1/N)*sum<1,N>(xi-xquer)^2) folgt: sigma = sqrt((1/N)*(1/N)*(N*sum<1,N>xi^2 -(sum<1,N>xi)^2))

  • sigma = (1/N)*sqrt(N*sum<1,N>xi^2 -(sum<1,N>xi)^2) für "running sums"

womit der lästige 1/N-Term aus der Wurzel verschwindet. Anhand des Beispiels mit den N=4 Werten xi = 5, 6, 8 und 9 ergibt sich:

sigma(5, 6, 8, 9) = (1/4)*sqrt(4*(5^2+6^2+8^2+9^2)-(5+6+8+9)^2) = (1/4)*sqrt(4*(25+36+64+81)-28^2) = (1/4)*sqrt(4*206-784) = (1/4)*sqrt(824-784) = (1/4)*sqrt(40) = (1/4)*2*sqrt(10) = (1/2)*sqrt(10) = sqrt(10/4) = sqrt(5/2) q.e.d.

Ich bitte darum, nun die falsche Formel aus Wikipedia zu entfernen (auch aus den anderssprachigen Seiten!). Gern dürfen Sie auch einen Mathematiker fragen... (aber die langweilt so etwas nur).

Die Formel mit dem verdächtigen Term N-1 im Nenner stammt möglicherweise aus den Berechnungsmethoden für Schätzwerte bei statistisch ausgewählten Stichproben.

Für negative xi habe ich die neue Formel noch nicht ausprobiert. Vermutlich kann auch der Beweis geführt werden, dass N*sum<1,N>xi^2 >=(sum<1,N>xi)^2 immer gilt, also der Wert unter der Wurzel nie negativ werden kann. Das möge aber bitte jemand anderes machen.

Lieber Horst, sei nicht böse, aber niemand mag diese "Formelsprache" auseinanderklauben. Du kannst mit TeX Formeln erstellen. Siehe Hilfe Tex. Am besten, du kopierst dir eine Formel aus dem Quellcode und setzt dann die entsprechenen Elemente ein. Und unterschreibe bitte hier mit --~~~~. Das wird dann automatisch in deine Unterschrift umgesetzt. Gruß --Philipendula 09:48, 9. Feb. 2007 (CET)

Herleitung
Einverstanden? --85 [?!] 11:54, 9. Feb. 2007 (CET)
Na, geht doch ;) --Philipendula 16:37, 9. Feb. 2007 (CET)
Mit sigma = sqrt((1/N)*sum<1,N>(xi-xquer)^2) folgt: sigma = sqrt((1/N)*(1/N)*(N*sum<1,N>xi^2 -(sum<1,N>xi)^2)) stimmt leider nicht: Du hast vergessen, Dein hinzugenommenes 1/N durch Multiplikation mit N auszugleichen. Als Formel reicht doch auch das davor, oder? --Anne 17:46, 4. Jun. 2007 (CEST)
Wie bitte? Nehmen wir . Dann gilt , , .
(1)
(2) und
(3) .
Welche Version stimmt also? --NeoUrfahraner 22:34, 4. Jun. 2007 (CEST)
Vorab möchte ich nochmal betonen, dass ich nicht den Text "Nachdem ich, Horst van Bremen, [...]" verfasst habe, nicht dass da was durcheinander kommt!!! (So würde ich nie einen Text beginnen.)
@NeoUrfahraner (sorry, hab mir erlaubt, Deinen Beitrag zu numerieren): (1) und (3) sind korrekt, und stimmen überein, wie ich mit der Herleitung zeigen wollte. (2) entspricht nicht der Def. von sX, ist in diesem Zusammenhang also "falsch" (wenn auch richtig gerechnet :) --85 [?!] 22:56, 4. Jun. 2007 (CEST)
@85: Meine Frage war nicht auf Deine Rechnung bezogen (die ist korrekt), sondern auf die Version vom 18:09, 4. Jun. 2007 : http://de.wikipedia.org/w/index.php?title=Standardabweichung&diff=32739124&oldid=32661420 --NeoUrfahraner 07:54, 5. Jun. 2007 (CEST)
Sorry, da hab ich wohl etwas missverständlich eingerückt... Ich habe Horst van Bremens Rechnung auf Papier nachvollzogen, und dabei ist mir aufgefallen, dass er bei dem letzten Teil seiner Umformung, den ich zitiert habe, eine Multiplikation mit N unterschlagen hat. Was bei ihm am Ende rausgekommen ist, ist nicht mehr gleich . Ob seine ursprüngliche Formel allerdings stimmt, weiß ich nicht - ich war mal davon ausgegangen, weil ihn niemand korrigiert hat.--Anne 15:22, 6. Jun. 2007 (CEST)

95,4 oder 95,5?

Aus der Tabelle der Standardnormalverteilung ist ersichtlich, dass für normalverteilte Zufallsgrößen 95,4 % der Realisierungen im Intervall im Intervall liegen.

Nun, der betreffende Wert ist , die Genauigkeit reicht also nicht aus,um zwischen 95,4 und 95,5 zu unterscheiden. Zum Glück gibt's es:Tabla distribución normal tipificada, dort findet man , also stimmen die 95,4% und die Änderung http://de.wikipedia.org/w/index.php?title=Standardabweichung&diff=35316200&oldid=35314046 von Benutzer:Fuenfundachtzig. --NeoUrfahraner 10:02, 9. Aug. 2007 (CEST)

Danke :) --85 [?!] 15:54, 9. Aug. 2007 (CEST)

Nochmal: Korrekte Berechnung der Standardabweichung bei "Running Sums"

Also ich kann van Bremen nur voll und ganz zustimmen. Die in der (Mess-)Praxis am häufigsten verwendete Form ist die der "running sums" bzw. "Standardabweichung des Mittelwertes". Es ist mir schleierhaft, warum diese wichtige Formel hier im Artikel nicht zu finden ist (ev. anderer Artikel oder hab ich was in der Diskussion übersehen?).

Jedenfalls ist die "Standardabweichung des Mittelwertes einer Probe":

wobei

der arithmetische Mittelwert über die n Werte ist.

Nachzulesen in jedem x-beliebigen Buch zum Thema Statistik.

M. E. sollte der Artikel um diese Formel erweitert werden. (Der vorstehende, nicht signierte Beitrag stammt von Plankton314 (DiskussionBeiträge) NeoUrfahraner 19:14, 14. Sep. 2007 (CEST))

"running sums" findest Du im Abschnitt Berechnung für auflaufende Messwerte; "Standardabweichung des Mittelwertes" hat einen eigenen Artikel: Standardfehler --NeoUrfahraner 19:14, 14. Sep. 2007 (CEST)


Okay, das hat meine Frage direkt beantwortet, aber dadurch bin ich dann doch auf die richtige Lösung gekommen... Thnx@NeoUrfahraner.

Ich bin aber dennoch etwas irritiert, denn meine Formel war der sog. Standardfehler, wird aber in der Literatur teils dennoch als Standardabweichung gehandelt; ist im nachhinein durch die Division durch Wurzel(N) klar, dennoch verwirrend. Ich hab eine Fußnote gefunden die besagt das nach DIN-1319 die Bezeichnung "Fehler" durch "Abweichung" ersetzt wird; vielleicht kann hier jemand etwas Licht bei Gelegenheit reinbringen...?!

Aber immerhin hat es dazu geführt, dass ich auch nochmal die Herleitung und Umformung komplett durchgerechnet habe und bin zu folgendem Ergebnis gekommen: Die obige Formel (2) ist - wie bereits festgestellt - falsch; ich schreibe hier mal jeden einzelnen meiner Rechenschritte hin:

Beginnend mit (1)

Ausmultiplizieren nach binomischer Formel:

(2)

Wir setzen

und erhalten dann (3):

Der letzte Summand lässt sich umformen:

Der zweite Summand lässt sich ebenfalls vereinfachen:

Anschließend lassen sich der zweite und dritte Summand zusammenfassen:

Abschließend erhält man: (4)

Zum Vergleich mit o. g. Formeln kann noch mit N erweitert werden: (5)

Was uns zeigt das in o. g. Formel (2) von NeoUrfahraner im Divisor (N-1) irgendwo verloren ging. Im Grunde ist das deckungsgleich mit van Bremens Ausführungen, aber jetzt ist mal jeder einzelne Schritt dokumentiert, falls doch noch irgendwo Unklarheiten auftauchen...

Und nein, der Wert unter der Wurzel kann nie negativ werden. ist nur definiert für (bei einem Messwert Division durch null, weniger als 0 Messwerte geht sowieso nicht). Ansonsten ist leicht zu sehen, dass , da und außerdem , da und für beliebiges mit gilt.

Wenn aber hier Konsens besteht, dass ich jetzt alles nur nochmal doppelt hingeschrieben hab, dann löscht/kürzt den Beitrag.

-- Plankton314 16:32, 15. Sep. 2007 (CEST)

Standardabweichung des Mittelwerts/der Verteilung

Also bitte, eine ordentliche Unterscheidung zwischen Standardabweichung des Mittelwertes und Standardabweichung der Verteilung sollte doch jetzt endlich mal in dem Artikel stehen... (nicht signierter Beitrag von 91.0.119.121 (Diskussion) )

Sei mutig --HurwiczRocks 03:05, 20. Mär. 2008 (CET)
Geht's um den Standardfehler? --NeoUrfahraner 06:59, 20. Mär. 2008 (CET)


Faustformel für Würfel

Zu http://de.wikipedia.org/w/index.php?title=Standardabweichung&diff=51090386&oldid=51014858 : "Würfel: nicht normalverteilt. zufall wenn faustformel passt" Genau darum geht es ja. Der Würfel ist nicht normaverteilt, das Beispiel soll ja zeigen, dass die Faustformel nicht exakt, sonder nur näherungsweise passt (die Faustformel für liefert hier also eine gute Näherung. Die Faustformel für passt hingegen nicht) --NeoUrfahraner 07:07, 24. Sep. 2008 (CEST)

Ich habe jetzt einen Satz ergänzt, um klar zu machen, dass es nicht darum geht, die Faustformel zu bestätigen, sondern um ein Beispiel, wo sie nicht passt. --NeoUrfahraner 11:38, 2. Okt. 2008 (CEST)

(die Faustformel für liefert hier also eine gute Näherung.) Das stimmt doch nicht! Die Standardabweichung hat in bei gleichverteilten Größen wenig Sinn. (nicht signierter Beitrag von 88.70.76.88 (Diskussion) 21:06, 23. Dez. 2011 (CET))

Der ganze Abschnitt hat wenig Sinn. Die Faustformel liefert nur für normalverteilte Variablen (bzw. Variablen die approximativ normalverteilt) sind sinnvolle Werte. Für jede andere Verteilung ist die Faustformel wertlos. --Sigbert 09:36, 24. Dez. 2011 (CET)
Deshalb habe ich den Abschnitt geaendert. Bitte, lese ihn mal, und, falls notwendig, andere ihn. Nijdam 20:28, 24. Dez. 2011 (CET)

Unverständlich

Den Satz in der Eingangsdefinition

"Die Varianz einer Zufallsvariable ist das zentrierte Moment zweiter Ordnung der zugehörigen Verteilung, der Erwartungswert das erste Moment."

Versteht wahrscheinlich nur der, der bereits weiß was gemeint ist. Hätte jemand etwas dagegen, wenn ich wegen dieses Satzes den Unverständlichkeitsbaustein in den Artikel setze bis sich jemand erbarmt hat, eine verständlichere Einleitung (vielleicht in Anlehnung an den Artikel in der englischen WP) zu schreiben?--Oliver s. 17:18, 28. Sep. 2008 (CEST)

Ich versuche mal was in Anlehung an diesen Text zu schreiben. Da ich aber kein Mathematiker bin, bitte ich um Korrektur.

Arbeitsvorschlag:

Die Standardabweichung (abgekürzt σ (kleines sigma)) ist ein um 1860 von Francis Galton eingeführter Begriff der Statistik und der Wahrscheinlichkeitsrechnung. Die Standardabweichung gibt an, wie weit eine Datenmenge um ihren Mittelwert gestreut ist. Die Standardabweichung kann für eine bestimmte Datenmenge berechnet werden, in dem man zunächst den Durchschnitt der Datenmenge bildet, dann die Abweichungen der einzelnen Datenwerte vom Durchschnittswert quadriert, diese Ergebnisse addiert und schließlich aus der sich ergebenden Summe die Wurzel zieht. Wenn die Daten nahe bei ihrem Mittelwert liegen, ist die Standardabweichung klein, wenn die Daten weit gestreut sind ist die Standardabweichung groß und wenn alle Daten gleich sind, ist die Standardabweichung null. Ein Vorteil der Standardabweichung gegenüber der ebenfalls die Verteilung einer Datenmenge angebenden Varianz ist, dass der Wert der Standardabweichung die gleiche Einheit hat wie die Datenwerte selber.

Ende des Arbeitsvorschlags

Es scheint da auch noch so was wie Sample- und Population-Standardabweichung zu geben. Wenn das vielleicht auch noch jemand einarbeiten könnte? Gruß,

--Oliver s. 17:56, 28. Sep. 2008 (CEST)

Hast Du die WP:BKL am Anfgang des Artikels gesehen? --NeoUrfahraner 07:49, 29. Sep. 2008 (CEST):
Ja. Hat mir aber scheinbar nicht geholfen oder wie ist deine Frage zu verstehen? :-)--Oliver s. 08:16, 29. Sep. 2008 (CEST)
Weil Du anscheinend von der Standardabweichung der Stichprobe ("Datenmenge") sprichst und nicht von der Standardabweichung einer Zufallsvariable. --NeoUrfahraner 09:20, 29. Sep. 2008 (CEST)
ist es denn nicht moeglich unter dem Lemma Standardabweichung nur die Standardabweichung allgemein zu beschreiben und von dieser allgemeinverstaendlichen Einfuerung auf die besonderen Typen der Standardabweichung (Stichprobe versus Zufallsvariable) zu verweisen?
So ist es ja im Moment. --NeoUrfahraner 15:26, 29. Sep. 2008 (CEST)
(BK) - Das bezog sich wohl auf "Wenn das vielleicht auch noch jemand einarbeiten könnte?".
Deinen Vorschlag hier könnte man mit dem vorhandenen zu einem neuen erweitern. Dabei ist es imho nicht von Vorteil die mathematische Formel einfach in Fließtext zu verwandeln. Wer so eine Formel nicht als Formel sondern nur im Fließtext versteht, kann mit dem Artikel insgesamt nichts anfangen. Dabei bitte nicht alles blau machen (Summe, Durchschnitt, Addition, Quadrierung und 1860 brauchen nicht geblaut zu werden.) - Ich habe den ersten Satz entsprechend umgestellt und gleich ein paar doppelte Verlinkungen entfernt.
Bin kein Mathe-Freak und finde das aktuelle Intro dennoch nicht unverständlich. Ich habe daher daraus ein "überarbeiten" gemacht. Grüße von -- Nolispanmo Disk. Hilfe? 09:32, 29. Sep. 2008 (CEST)

Empirische Standardabweichung

Die mathematische Formel ist die empirische Standardabweichung, nicht die Standardabweichung einer Zufallsvariable. Ich habe daher die von http://de.wikipedia.org/w/index.php?title=Standardabweichung&diff=next&oldid=49710303 eingefügte empirische Standardabwechung rausgenommen. Für die Empirische Standardabweichung siehe WP:BKL am Anfang des Artikels. --NeoUrfahraner 09:34, 29. Sep. 2008 (CEST)

Das sollte dann aber für "Doofe" in den Artikel zu empirische Varianz, oder? --source 12:09, 29. Sep. 2008 (CEST)
Ja, wobei wir uns aber vorher endlich einigen sollten, wie die Variante mit n im Nenner und wie die Variante mit n-1 im Nenner heißt. --NeoUrfahraner 12:22, 29. Sep. 2008 (CEST)
ICh dachte das wäre nch der Diskussion dort klar?! Wenn nicht halte ich mich aber lieber raus :-) --source 13:31, 29. Sep. 2008 (CEST)

Galton oder Pearson?

The term STANDARD DEVIATION was introduced by Karl Pearson (1857-1936) in 1893, "although the idea was by then nearly a century old" (Abbott; Stigler, page 328). According to the DSB: The term "standard deviation" was introduced in a lecture of 31 January 1893, as a convenient substitute for the cumbersome "root mean square error" and the older expressions "error of mean square" and "mean error." http://members.aol.com/jeff570/s.html --NeoUrfahraner 09:46, 29. Sep. 2008 (CEST)

Immer noch nicht allgemeinverständlich genug

  • Vielen Dank für eure Bemühungen den Text etwas verständlicher zu machen. Ich möchte aber dennoch eine letzte kritische Anmerkung dazu machen: Ich habe vor 20 Jahren in der Oberstufe einen Mathematikgrundkus (Statistik) mit 14P abgeschlossen und zumindest damals das Gefühl, man könne ganz gut verstehen, was eine Standardabweichung ist. Diese Vorbildung reicht allerdings nicht, um ohne weiteres nachzuvollziehen, was in der Einleitung des Artikels steht. Wer bitte soll den verstehen was gemeint ist, wenn da so unvermittelt steht:
"Die Varianz einer Zufallsvariable ist das zentrierte Moment zweiter Ordnung der zugehörigen Verteilung, der Erwartungswert das erste Moment."
Ich halte die hiermit erreichte Verständlichkeit immer noch nicht für ausreichend. Sorry. Auch verstehe ich, dass eine Formel den Sachverhalt am prägnantesten ausdrückt. Schon Steven Hawking hat allerdings in seinem Buch "Eine kurze Geschichte der Zeit" angemerkt, dass sich seine Leserschaft mit jeder verwendeten Formel wohl halbieren würde. Daher halte ich es für durchaus sinnvoll, den Inhalt von Formeln der Allgemeinverständlichkeit halber auch in Worte zu fassen; jedenfalls dann, wenn das so einfach möglich wäre wie hier. Gruß --Oliver s. 21:06, 29. Sep. 2008 (CEST)

Auf den Satz "Die Varianz einer Zufallsvariable ist das zentrierte Moment zweiter Ordnung der zugehörigen Verteilung, der Erwartungswert das erste Moment." kann man meines Erachtens tatsächlich verzichten. Wer nicht weiß. was die Varianz ist, soll im verlinkten Artikel nachelesen; mit diesem Zusatz (vgl. http://de.wikipedia.org/w/index.php?title=Standardabweichung&diff=next&oldid=6547862 ) alleine versteht er es wohl auch nicht. --NeoUrfahraner 06:48, 30. Sep. 2008 (CEST)

Ich haben den kritisierten Satz gestrichen. --NeoUrfahraner 11:38, 2. Okt. 2008 (CEST)

PS: Wie kommst Du auf Galton? Meine Quelle sagt Pearson. --NeoUrfahraner 06:48, 30. Sep. 2008 (CEST)


Das stand so in der englischen WP. Gruss oliver s.

Bemerkungen

  1. Zwar ist es nicht falsch, aber warum wird im Beginn des Artikels von positiver Quadratwurzel gesprochen. Das gibt Anlass zum falschen Gedanke es gäbe auch eine negative Quadratwurzel.
  2. MMn wird im Artikel zu wenig darauf hingewiesen dass es unterschiedliche Standardabweichungen gibt, namentlich, einer Zufallsvariablen, einer Grundgesamtheit und einer Stichprobe. Gerade diesen Unterschied ist sehr wichtig, weil die Begriffe oft nicht gut unterschieden werden. Nijdam 09:08, 7. Jun. 2009 (CEST)
  3. Im Artikel heisst es dass Galton der Begriff Standardabweichung erfunden hat. Die Englische Wikipedia nennt Pearson jedenfalls als Erfinder der Name 'Standardabweichung'. Vermutlich beschaeftigte Galton sich schon mit der Idee ohne von Standardabweichung zu sprechen, und bedacht Pearson die Name. Aber ich weiss es auch nicht genau. Nijdam 10:39, 8. Jun. 2009 (CEST)
Ad 2: Siehe WP:BKL am Anfang des Artikels --NeoUrfahraner 07:33, 8. Jun. 2009 (CEST)
Das stimmt leider nicht ganz, denn am Endes des Artikels wird ausfuerlich ueber die Standardabweichung einer Stichprobe geschrieben. Und auch in der zweite Abschnitt ist schon von Daten die Rede. Nijdam 10:39, 8. Jun. 2009 (CEST)

Zufallsvariable

Ich habe nicht umsonst die Änderung X -> x durchgeführt. Der Abschnitt zeigt eine große Inkonsekwenz in der Notation. Was hat zB X mit xi zu tun? Es wird nicht klar unterschieden zwischen Zufallsvariablen und Daten. Es sollte etwa lauten wie: Es sei X1,...,Xn eine Stichprobe unabhängiger Kopien der Zufallsvariable X. Ein Schätzer der Standardabweichung ist der Stichprobestandardabweichung SX, definiert durch:

Merke auf daß jetzt keine kleingeschriebene x auftaucht.Wie könnte das auch? Nijdam 11:15, 9. Aug. 2009 (CEST)

Möglich ware auch:

Sind die die Ausprägungen n unabhängiger, identisch wie X verteilter Zufallsvariablen, also beispielsweise eine Stichprobe, so wird die Standardabweichung des Mermals X der Grundgesamtheit der Stichprobe häufig mit der Formel

geschätzt. Nijdam 11:23, 9. Aug. 2009 (CEST)

Ich persönlich sehe da keinen Änderungsbedarf. Ich habe aber auch nichts dagegen, die groß zu schreiben. Für die Definition ist aber groß X sehr gebräuchlich, und daher sollten wir das auch verwenden. --Drizzd 20:55, 9. Aug. 2009 (CEST)
Und??Nijdam 22:25, 9. Aug. 2009 (CEST)

Nochmals betrachtet handelt es sich um die Funktion g:

die man auch mit bezeichnen kann. Und statt könnte man auch schreiben. Aber was ist der Logik um oder zu benutzen?Nijdam 08:46, 10. Aug. 2009 (CEST)

Schwankungsbreiten-Beispiel II

Hallo! Ich weiss, die Frage gehört nicht hierher, aber das Schwankungsbreiten-Beispiel enthält genau mein Problem: Könnte mir jemand einen Tip/Link geben, wie ich die verschiedenen Messwerte für Jungen und Mädchen inklusiv Standardabweichung zu einem Wert "Menschliche Körpergröße (in cm +/-Standardabweichung)" zusammenrechnen kann? Danke im Voraus! 213.39.155.204 19:43, 24. Mai 2010 (CEST)

Laplace-Wuerfel

Es handelt sich um ein ganz gewoehnlicher Wuerfel. Nur zum sicher gehen ist die Eigenschaft "fair" hinzugefuegt, weil Statistiker im Algemeinen auch an unfairen Wuerfel denken wollen. Der Begriff "Laplace-Wuerfel" ist mMn bestimmt nicht wissenschaftlich. Nijdam 11:56, 11. Nov. 2010 (CET)

Maximum-Likelihood-Schätzung für die Standardabweichung einer Normalverteilung

Was macht dieser Abschnitt hier? Er ist anscheinend redundant zum Artikel der unkorrigierten Stichprobenvarianz. Außerdem ist dieser Schätzer nur asymptotisch erwartungstreu und ist nicht auf eine Normalverteilung beschränkt.

Wenn keine Gegenstimmen auftauchen, werde ich ihn entfernen und einen Verweis setzen. -- Plankton314 00:44, 27. Dez. 2011 (CET)

Ich finde den Abschnitt eigentlich schon informativ: Man erfährt, dass die Maximum-Likelihood-Methode bei der Normalverteilung auf die -Formel führt, aber nicht bei allen Verteilungen. Auch die Redundanz sehe ich nicht, bei Stichprobenvarianz steht doch fast nichts über die Sichprobenstandardabweichung. -- HilberTraum 13:18, 27. Dez. 2011 (CET)
Ja, mag sein, dass der Artikel Stichprobenvarianz nicht sehr ausführlich ist. Das ändert jedoch nichts daran, dass dieser Abschnitt redundant dazu ist. Im Zweifelsfall sollte der zugehörige Artikel ausgebaut werden. Das hier als Unterabschnitt zu führen ist nicht zweckmäßig.
Dieser Schätzer ist zudem, wie oben bereits beschrieben, auch nicht bzw. nur asymptotisch erwartungstreu (Beweis siehe ML-Schätzung). Im Abschnitt Berechnungsgrundlagen ist der erwartungstreue Schätzer für beliebige Verteilungen angegeben. Ich kann leider den enzyklopädischen Mehrwert dieser Übung in Schätztheorie nicht erkennen.
Ganz davon abgesehen, kann ich hier weder einen mathematischen Beweis erkennen noch ist eine Quelle angegeben. Das allein würde im Grunde schon reichen, den besagten Abschnitt zu entfernen. -- Plankton314 14:26, 27. Dez. 2011 (CET)
Das mit der Quelle stimmte natürlich, sollte man nachtragen, wobei eine Beweisidee ja schon angedeutet ist. Ansonsten verstehe das Problem immer noch nicht so ganz: Stichprobenvarianz behandelt doch nur die Schätzung der Varianz und nicht die der Standardabweichung. Welche Formel meinst du mit deinem Link auf Berechnungsgrundlagen? Der führt leider ins Leere, aber es gibt keinen erwartungstreuen Schätzer der Standardabweichung für alle Verteilungen. Und die Information, wie der ML-Schätzer eines Parameters bei Normalverteilung aussieht, halte ich schon für relevant, da die ML-Methode allgemein eine wichtige Methode zu Konstruktion von Schätzern ist. Du hast recht, dass diese nicht immer erwartungstreu sind, aber man kann zeigen, dass sie immer asymptotisch erwartungstreu sind. -- HilberTraum 16:07, 27. Dez. 2011 (CET)
Der ML-Schätzer für die Normalverteilung wird bereits hier bei der korrigierten Stichprobenvarianz beschrieben/erwähnt. Ob das widerrum eine glückliche Stelle ist, sei auch mal dahingestellt.
Dieser Abschnitt sollte auf jeden Fall allgemeinverständlicher formuliert und mit Quellen oder Beweisen belegt werden.
Es sollte auch erwähnt werden, dass die Schätzung nur asymptotisch erwartungstreu ist. Der Bezug zur Poisson-Verteilung ist überflüssig, da bereits in der Überschrift erwähnt ist, dass es sich auf die NV bezieht.
Dennoch halte ich den Abschnitt für fehl am Platz, besser wäre m.E. der Artikel Normalverteilung#Parameterschätzung selbst. Ansonsten hätten etliche weitere Verteilung ebenfalls das "Recht" hier erwähnt zu werden. Ich denke, das gehört streng genommen nicht zum Thema Standardabweichung. -- Plankton314 01:35, 28. Dez. 2011 (CET)
Ich habe den besagten Abschnitt in der Artikel Normalverteilung verschoben und ergänzt, hoffentlich zur Zufriedenheit aller anderer.
Ggf. kann hier ja noch ein Verweis auf den Abschnitt hinzugefügt werden. -- Plankton314 16:40, 28. Dez. 2011 (CET)

Nicht Doof

Für die Doofen, die wissen wollen, was sich hinter den Zahlen verbirgt: Ist die Standardabweichung (der Wert, der nach all den schlauen Messungen herauskommt) gering, also je näher an Null, desto mehr häufen sich die Messungen um den Mittelwert = homogene Gruppe, wenig Abweichungen. Ist die Standardabweichung hoch, sind die Werte weiter verstreut = heterogene Gruppe, starke Abweichung.

Dies kann man auch etwas anders ausdrücken: Sind die Zufallswerte normalverteilt (für die Doofen: einfach ignorieren, aber sonst sind die Mathematiker beleidigt) so sind etwa 68 Prozent der Werte in dem Bereich Mittelwert +/- Standardabweichung. Etwa 95 Prozent sind im Bereich Mittelwert +/- 2*Standardabweichung. Und etwa 99.7 Prozent der Werte im Bereich Mittelwert +/- 3*Standardabweichung.

Ist also der Mittelwert 42 und die Standardabweichung 5, so sind etwa 95 Prozent der Werte zwischen 32 und 52.

Zur Diskussion: Diese 68-95-99.7 Regel ist auch in der englischen Wikipedia. Das könnte man doch auch in den deutschen Artikel einbauen. --Torsten, 16:13, 6. Juli 2006 (CEST)

Einheit vs. Dimension

Es ist falsch, zu sagen, die Standardabweichung hätte die gleiche Einheit wie die Beobachtungswerte. Z.B. können die Messwerte in Metern, die Standardabweichung dagegen in Millimetern (wer mag, auch in Zoll) angegeben werden. Sie haben aber die gleiche Dimension, nämlich die Dimension einer Länge. --Joaolin (Diskussion) 18:37, 2. Feb. 2013 (CET)

Theoretische oder empirische Standardabweichung?

Hi, der Artikel ist ziemlich inkonsequent: Wird hier nun die empirische Standardabweichung oder die Standardabweichung einer Zufallsvariablen beschreiben?

Der Artikel ist der häufigste aufgerufenen Artikel in der Deskriptive Statistik. Ausserdem haben meine Studenten (ca. 20) bei der Rezension des Artikel Varianz (Stochastik) nicht erkannt, dass es sich um die Varianz einer Zufallsvariablen handelt, aber sich über die sehr math. Darstellung beschwert. Das weist meiner Ansicht daraufhin, dass dieser Artikel statt Standardabweichung besser Standardabweichung (Stochastik) heisst und man unter Standardabweichung besser die empirische Standardabweichung beschreibt.

--Sigbert (Diskussion) 11:37, 30. Jun. 2013 (CEST)

Solche Studenten haette ich auch; haben's alle nicht geschaft. Nijdam (Diskussion) 00:22, 1. Jul. 2013 (CEST)
Eine Begriffsklärungsseite analog zu Varianz wäre vielleicht auch hier eine Option. -- HilberTraum (Diskussion) 11:21, 1. Jul. 2013 (CEST)
Gute Idee. Nijdam (Diskussion) 12:43, 1. Jul. 2013 (CEST)
Das scheint mir auch eine sinnvolle Lösung zu sein. --Sigbert (Diskussion) 20:21, 2. Jul. 2013 (CEST)

 Ok Ist in aktueller Form diesbezüglich überzeugend gelöst.--Xeno06 (Diskussion) 00:10, 22. Jan. 2014 (CET)

Der Artikel enthält grobe Fehler

Das Problem 1/n oder 1/(n-1)

Es gibt zwei Schätzer für die Standardabweichung - einer mit 1/n, der andere mit 1/(n-1).

Diese unterscheiden sich je nachdem, ob man

a) den Erwartungswert der Verteilung exakt kennt, oder

b) einen Schätzwert für den Erwartungswert verwendet (arithmetischer Mittelwert)


Für a) verwendet man die Formel 1/n zur Schätzung der Standardabweichung.

Für b) verwendet man die Formel 1/(n-1) zur Schätzung der Standardabweichung.

Soweit die Aussage für große n. Man sollte wissen, daß eigentlich eine Student-t-Verteilung vorliegt. Praktisch bedeutet das, daß zur Konfidenzberechnung (1-sigma-Grenze, 2-sigma-Grenze) Korrekturfaktoren berücksichtigt werden müssen. Das weiß ich sicher für den Fall, daß sowohl Erwartungswert als auch Standardabweichung geschätzt werden müssen.

=== Was sonst noch fehlt ===Eventuell sollte noch ein Hinweis auf die Ergodizität der Fehlerquelle herein. Ergodizität der Fehlerquelle bedeutet meiner Erinnerung nach, daß Scharmittelwert und zeitlicher Mittelwert des Fehlers übereinstimmen.

Grobe Fehler

Ein grober Fehler ist es, irgendeine der Formeln mit dem Titel "Standardabweichung" oder gar "Definition der Standardabweichung" zu versehen, die Formeln, die darauf folgen, sind Schätzwerte.

Die Frage ist, wie man mit groben Fehlern umgeht. In der Wikipedia bessert man die Fehler einfach aus... --Sebastian.Dietrich 20:24, 19. Aug. 2014 (CEST)
Point taken ... ich war da vielleicht zu zurückhaltend. Hanspi (Diskussion) 19:06, 10. Sep. 2014 (CEST)

Konfidenzinterval

Was bedeutet diesen Satz?

Die Wahrscheinlichkeiten für bestimmte Konfidenzintervalle beziehungsweise die Konfidenzintervalle für bestimmte Wahrscheinlichkeiten können mithilfe der Lösung der folgenden Gleichung berechnet werden:

Nijdam (Diskussion) 14:48, 18. Jan. 2015 (CET)

Ich habe diesen Satz eingefügt, um zu klären, wie diese wüsten Werte für bzw. für Prozent innerhalb () in der Tabelle zustande kommen. Es geht also um die Lösungen der Gleichung von oben. Einmal für den Fall, dass man die Grenzen des Intervalls gegeben hat und die Wahrscheinlichkeit berechnen möchten und zum anderen für den Fall, dass die Wahrscheinlichkeit gegeben ist und die Grenzen gesucht sind.
Ich habe das wohl uneindeutig formuliert. Wie wäre es alternativ mit folgendem Satz: Zwischen der Wahrscheinlichkeit eines Konfidenzinervalls und dessen Grenzen besteht folgender Zusammenhang: (Gleichung 1) Durch Integration erhält man eine vereinfachte, auf der Gauß'schen Fehlerfunktion basierende Funktion: (Gleichung 2) Basierend auf dieser Gleichung lässt sich eine Funktion für den umgekehrten Zusammenhang finden. Diese Funktion beschreibt die Abhängigkeit der Grenzen des Konfidenzintervalls von dessen Wahrscheinlichkeit: (Gleichung 3)
Was meint ihr? Viele Grüße, --T.seppelt (Diskussion) 17:01, 18. Jan. 2015 (CET)
Das sind allerdings gar keine Konfidenzintervalle, das ist etwas ganz anderes. In der Überschrift heißen sie noch „Streuintervalle“. Ich frage mich auch gerade, ob diese „wüste“ Tabelle in dieser Ausführlichkeit überhaupt hier her gehört. -- HilberTraum (d, m) 18:12, 18. Jan. 2015 (CET)
Meinentwegen kann die Tabelle weg, und auch die darunter stehende Text. Es handelt sich nur um Folgendes. Sei , dann ist: Nijdam (Diskussion) 20:35, 19. Jan. 2015 (CET)
Ich hab die Stelle jetzt mal ein bisschen überarbeitet. Wie ausführlich die Tabelle sein soll, ist sicher Geschmacksache. -- HilberTraum (d, m) 21:52, 19. Jan. 2015 (CET)
Vielen Dank. Als zusätzliche Information ist sie ganz nett, aber wie gesagt Geschmackssache. -- 217.84.193.239 22:36, 19. Jan. 2015 (CET)

Streuintervalle - Absatz kontaminierte Normalverteilungen

Stimmt folgender Satz? (Zitat aus dem Artikel)

Diese Praxis ist aber nicht empfehlenswert, denn sie kann zu sehr großen Fehlern führen. Zum Beispiel ist die Verteilung optisch kaum von der Normalverteilung zu unterscheiden (siehe Bild), aber bei ihr liegen im Intervall µ ± σ ganze 95,2 % der Werte.

Im Intervall µ ± σ liegen bei der Verteilung 68% der Daten. Jetzt kommen Ereignisse aus zehn mal so breit gestreuten Verteilung hinzu. Wieso sollen dann ploetzlich mehr Ereignisse im Bereich µ ± σ liegen? Sind da verschiedene σ gemeint und sie werden lediglich in der Notation nicht unterschieden? Oder habe ich einen groben Denkfehler?

--Stefan 05:46, 10. Jan. 2016 (CET) (ohne Benutzername signierter Beitrag von 18.62.20.235 (Diskussion))

Aus dem Text davor vermute ich, dass bei dem Intervall die Standardabweichung der kontaminierten Normalverteilung gemeint ist und nicht das aus den beiden Normalverteilungen. Wenn ich das damit durchrechne komme ich aber auf 92,5 %, siehe unten. Also vermutlich zusätzlich noch ein Zehlendreher. Danke für den Hinweis und Grüße -- HilberTraum (d, m) 17:12, 10. Jan. 2016 (CET)
> s <- sqrt(0.9*1^2 + 0.1*10^2)
> 0.9*(pnorm(s)-pnorm(-s)) + 0.1*(pnorm(s,sd=10) - pnorm(-s,sd=10))
[1] 0.925006

Tutoriallink

Habe den Link

entfernt, die Seite wird momentan überarbeitet. Vielleicht findet jemand die neue Adresse wenn die Seite überarbeitet ist.

Link: http://barolo.ipc.uni-tuebingen.de/ (nicht signierter Beitrag von 217.194.34.123 (Diskussion) 09:33, 16. Sep. 2005 (CEST))

Dank

mein Dank gilt allen, die diese Seite gemacht haben!!! War 'ne riesige Hilfe für einen "outsider"

Val (nicht signierter Beitrag von 194.95.177.102 (Diskussion) 11:25, 5. Okt. 2005 (CEST))

Für Doofe?

Es wäre toll, wenn auf der Seite für Doofe wie mich kurz stünde, was Werte wie "0,8" oder "1,2" als Standardabweichung ungefähr bedeuten. (nicht signierter Beitrag von 62.8.239.186 (Diskussion) 12:48, 14. Feb. 2006 (CET))

Für "Doofe" (2)

dem kann ich mich nur anschließen. Ohne ein Mathe-Diplom ist dieser Artikel wirklich etwas schwierig zu begreifen!!! Wenn sich jemand erbarmen könnte, vielleicht irgendwo oben oder unten einfach mal ganz kurz das Wesentliche auf den Punkt zu bringen, das würde mit Sicherheit nicht nur mir, sondern auch sehr vielen anderen weiterhelfen.

MfG Stefan. (nicht signierter Beitrag von 217.224.226.241 (Diskussion) 21:43, 1. Apr. 2006 (CEST))

Das lässt sich so einfach nicht Beantworten. Die Standardabweichung ist ja ein Mass für die Streuung deiner Beobachtungen. Eine Streuung von 2 kann klein oder groß sein. Je nach dem, wo sich dein arithmetisches Mitell befindet. (nicht signierter Beitrag von 89.56.253.169 (Diskussion) 20:25, 17. Dez. 2006 (CET))
(bitte immer unterschreiben: --~~~~!) Wenn es eine Normalverteilung ist und σ bekannt ist, kann man an der Tabelle ablesen, welcher Anteil der Grundgesamtheit demnach vermutlich innerhalb eines gewissen Abweichungsbereichs liegt (z. B. 68% hat weniger als σ Abweichung vom Mittelwert). Ob eine Streuung als zu groß zu beurteilen ist, hängt gänzlich von der Vorgabe ab (Wie groß darf die Abweichung sein?), weniger vom Ort des Mittelwerts μ.--Yuwash (Diskussion) 14:32, 15. Mär. 2015 (CET)

Bedeutung?

Mathematisch korrekt geschildert wird folgendes in eine Aussage gepackt: "Die korrigierte Stichprobenstandardabweichung unterschätzt also die Standardabweichung der Grundgesamtheit."

Leider ist das der letzte Satz des entsprechenden Abschnitts, daher ist unverständlich, was mit dieser Aussage anzufangen ist, ob sie korrigierbar ist usw. --Amtiss, SNAFU ? 15:17, 20. Jun. 2016 (CEST)

Kompliziertheit der Beiträge

Ich habe immer mal wieder gespendet auf Wikipedia, muss aber feststellen, das immer mehr Seiten dermaßen fachbezogen ausfallen, dass Sie für einen Menschen außerhalb des jeweilige Fachbereiches keine Informationen mehr vermitteln. Das ist schade und ärgert. Ich würde dafür plädieren solche Seiten auch um eine 'Normaldarstellung' erweitern. Dann kann Wikipedia auch seinem Zweck dienen. (nicht signierter Beitrag von 88.76.188.67 (Diskussion) 15:32, 25. Nov. 2016 (CET))

Hast du konkrete Kritikpunkte oder spezifische Anregungen für Verbesserungen? Dies wäre für eine potentielle Verbesserung sehr hilfreich, insbesondere da es als Autor nicht immer einfach ist, das Niveau der Leserschaft einzuschätzen. LG --NikelsenH (Diskussion) 10:50, 26. Nov. 2016 (CET)

Verschieben und BKL-Einrichtung

Ich bin für eine Verschiebung des jetzigen Artikels auf das Lemma Standardabweichung (Stochastik) und die Einrichtung einer BKL Typ I auf der jetzigen Seite mit den Einträgen Standardabweichung (Stochastik) und Stichprobenstandardabweichung. Gründe: Beide Begriffe werden als Standardabweichung bezeichnet. Zwar hat die Stichprobenstandardabweichung bisher keinen eigenen Artikel, aber die hohen Besuchszahlen auf diesem Lemma (bis zu 3000, im Vergleich zu 1000 für den Erwartungswert) deuten meiner Meinung nach darauf hin, dass hier nicht jeder den Wahrscheinlichkeitstheoretischen Begriff sucht, sondern auch den Begriff aus der deskriptiven Statistik. Eine BKL wäre daher für die Leserführung Sinnvoll. Ebenso ermöglicht sie, die (Wiki-)Inlinks auf Standardverteilung gezielt zu überprüfen und zu korrigieren. Meinungen? (und frohes neues ;) )--NikelsenH (Diskussion) 00:03, 1. Jan. 2017 (CET)

Wurde verschoben. Habe aber einen anderen Klammerzusatz gewählt (da die Statstik ja streng genommen zur Stochastik gehört). Werde demnächst anfangen, die Links auf die BKL-Seite korrekt zuzuordnen. --NikelsenH (Diskussion) 12:40, 4. Jan. 2017 (CET)
(Im Rahmen der mir verfügbaren Ressourcen) erledigt --NikelsenH (Diskussion) 23:05, 4. Jan. 2017 (CET)

Warum leitet dieser Artikel zur "Varianz" weiter?

Schon im ersten Absatz der Varianz heißt es: "Sie ist das Quadrat der Standardabweichung, dem wichtigsten Streuungsmaß in der Stochastik". "Standardabweichung" wird dort fett geschrieben (wie es bei der Zusammenführung inhaltlich überlappender Themen angebracht ist), aber das "wichtigste Streuungsmaß der Stochastik" hat nun weder einen eigenen Artikel noch einen eigenen Abschnitt? Wie in jeder anderen Sprache, sollte das auch hier wieder der Fall sein, denn des Weiteren erweckt die Weiterleitung von "Standardabweichung" nach "Varianz" den Eindruck, dass beides den selben Sachverhalt darstellt, was aber scheinbar nicht ganz der Fall ist. --MA-Maddin (Diskussion) 15:54, 4. Nov. 2018 (CET)