Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

Standardabweichung Interpretation im Detail: Was ist die Bedeutung von Standardabweichung?

Einer der wichtigsten Kennzahlen für statistische Analysen ist sicherlich die Standardabweichung (Abkürzung Standardabweichung: SD oder s). Zahlreiche statistische Verfahren laufen letztendlich auf eine Analyse der Standardabweichung bzw. der Varianz (quadrierte Standardabweichung) hinaus. Die Varianzanalyse trägt die Varianz zum Beispiel bereits im Namen. Aber die Standardabweichung bildet auch für viele andere Verfahren den grundlegenden Baustein der Analyse. Ein grundlegendes Verständnis von Standardabweichung ist daher unerlässlich für jeden der mit Ergebnissen aus Datenanalysen zu tun hat. In diesem Artikel möchten wir Ihnen deshalb eine leicht verständliche Einführung für die Standardabweichung Interpretation präsentieren.

 

Folgende Fragen werden in diesem Artikel beantwortet

  • Was bedeutet Standardabweichung?
  • Wie berechnet sich Varianz und Standardabweichung?
  • Wie kann ich die Standardabweichung sinnvoll interpretieren?

 

Standardabweichung Bedeutung – ein Praxisbeispiel

Grundsätzlich geben die Standardabweichung und die Varianz an, wie sehr die Daten vom Mittelwert abweichen. Anders gesagt drückt die Standardabweichung aus, wie stark sich die Datenpunkte voneinander unterscheiden. Zur Verdeutlichung ein Beispiel:

Ein Unternehmen möchte gerne wissen wie zufrieden seine Kunden mit dem gekauften Produkt sind. In einer Kundebefragung beantworten Kunden unter anderem folgende Frage: „Mit welcher Wahrscheinlichkeit würden Sie unser Produkt weiterempfehlen?“

Standardabweichung Interpretation: Wie weichen die Antworten ab?
Auch für so genannte NPS Umfragen spielt die Standardabweichung eine Rolle

Nehmen wir einmal an, alle befragten Kunden hätten bei dieser Frage einen Wert von 7 angegeben. In diesem Fall wäre der Durchschnitt 7 und es gebe überhaupt keinen Unterschied zwischen den Datenpunkten; die Standardabweichung wäre 0. In solch einem Fall gäbe es tatsächlich keinen Ansatz für eine klassische statistische Analyse: Eines der wichtigsten Ziele von Statistik ist es Unterschiede zwischen Datenpunkten zu erklären und vorherzusagen. Wenn alle Kunden identisch sind gibt es keine Unterschiede die es zu erklären oder vorherzusagen gibt.

Standardabweichung Interpretation: Beginn in der deskriptiven Statistik
Eine Verteilung mit Standardabweichung 0 wäre sehr ungewöhnlich

 

Ein solcher Fall ist natürlich extrem unwahrscheinlich. Selbst wenn alle Kunden die Dienstleistung normalerweise mit 7 bewerten würden, gibt es praktisch immer Messfehler. So bewerten manche Kunden das Produkt vielleicht etwas höher, weil Sie einen guten Tag hatten. Andere bewerten das Produkt etwas niedriger, weil Sie generell schwer zufrieden zu stellen sind. Ein anderer Kunde hat sich einfach verklickt, und so weiter.

In diesem Fall werden die Daten um den Wert 7 herum liegen, der Durchschnitt wäre also 7. Alle Werte werden aber nicht identisch sein, manche Werte werden also unter 7 oder über 7 liegen. Wenn die Daten in etwa normal verteilt sind, werden die meisten Werte um den Mittelwert liegen. Werte mit geringer Abweichung vom Mittelwert werden häufiger vorkommen als Werte mit sehr starker Abweichung.

Standardabweichung Interpretation: Auch wichtige Rolle für Verteilung
Beispiel für eine annähernde Normalverteilung

 

Wenn wir jetzt wissen wollen wie stark sich die Werte denn nun voneinander unterscheiden, ist die Standardabweichung eine äußerst praktische Größe. Für die Standardabweichung müssen wir zunächst die Varianz berechnen.

 

Von der Varianz zur Standardabweichung

Varianz ist der statistische Ausdruck für die Streuung der Daten. Die Varianz gibt also an wie weit sich die Daten im Schnitt vom Mittelwert unterscheiden. Um so größer die Varianz umso weiter liegen die Daten vom Mittelwert entfernt.

Standardabweichung Interpretation: Abhängig von der Varianz
Beispiel für hohe Varianz

 

Standardabweichung Interpretation: Abhängig von der Varianz
Beispiel für niedrige Varianz

 

Die Abweichung vom Mittelwert können wir einfach ausdrücken als:

Abweichung=x-\bar{x}

Wobei \bar{x} den Mittelwert darstellt.

Wenn der Wert nun kleiner als der Durchschnitt ist fällt die Abweichung negativ aus. Wir möchten aber, dass eine hohe Abweichung auch durch einen hohen Wert ausgedrückt wird. Für die Definition der Varianz verwendet man daher die quadrierten Abweichungen.

Quadrierte Abweichung= \left( x-\bar{x} \right) ^{2}

Die Varianz der Population ist definiert als der Durchschnitt aller quadrierter Abweichungen:

Var \left( x \right) = \frac{ \sum _{i=1}^{n} \left( x_{i}-\bar{x} \right) ^{2}}{n}

Das heißt wir rechnen für alle Werte zunächst die quadrierte Abweichung und bilden aus diesem dann den Durchschnitt. Eine Schätzung der Varianz mit einer kleinen Varianz unterschätzt diese allerdings. Um dafür zu korrigieren wird für die Berechnung der Stichprobenvarianz s2 für gewöhnlich durch n – 1 geteilt:

s^{2}= \frac{ \sum _{i=1}^{n} \left( x_{i}-\bar{x} \right) ^{2}}{n-1}

Die Standardabweichung (Abkürzung Standardabweichung: SD oder s) ist einfach definiert als die Wurzel aus der Varianz:

s=\sqrt[]{s^{2}}= \sqrt[]{\frac{ \sum _{i=1}^{n} \left( x_{i}-\bar{x} \right) ^{2}}{n-1}}

Was sagt dieser Wert jetzt aus? Wie wir Ihnen im nächsten Abschnitt zeigen hat die Standardabweichung einige sehr nützliche Eigenschaften. Diese machen die Standardabweichung Interpretation sehr einfach.

 

Interpretation Standardabweichung: Praktische Faustregeln

Wenn die Daten in einer Normalverteilung vorliegen, können Sie viele nützliche Informationen aus einer Standardabweichung Interpretation ablesen. Bei annähernd normal verteilten Daten liegen etwa 68% aller Daten innerhalb einer Standardabweichung vom Mittelwert. Etwa 95% liegen innerhalb von 2 Standardabweichung (genauer: 1,96) und 99,7% liegen innerhalb von 3 Standardabweichungen. Dies wird auch als 68-95-99,7 Regel bezeichnet. Bei einem normal verteilten Daten reicht also ein kurzer Blick auf den Mittelwert und die Standardabweichung um eine Vorstellung davon zu erhalten in welchen Bereich sich die meisten Daten bewegen.

Auch ein Konfidenzintervall lässt sich mit der Standardabweichung und dem Mittelwert schnell berechnen. Ein 95%-Konfidenzintervall hat einen kritischen z-Wert von 1,96. Der Mittelwert befindet sich also mit 95% Sicherheit zwischen M-1,96\ast\frac{SD}{\sqrt[]{n}} und M+1,96\ast\frac{SD}{\sqrt[]{n}}.

 

Standardabweichung Interpretation in der Praxis

Zurück zu unserem Beispiel: Eine erste Analyse der Kundenbefragung ergab, dass die Daten annähernd normal verteilt sind. Eine deskriptive Analyse ergab folgende Kennzahlen:

Standardabweichung Interpretation: Hoch oder niedrig?
SPSS Ausgabe mit Standardabweichung

 

Aus dem Mittelwert und der Standardabweichung lässt sich mit der 68-95-99,7 Regel ermitteln, wie sich die Daten bei einer Normalverteilung ungefähr verteilen sollten (Abkürzung Mittelwert: M, Abkürzung Standardabweichung: SD).

Anteil der Daten Faustregel Ungefährer Bereich
68% M +/- SD 5,60 – 8,24
95% M +/- (SD*2) 4,27 – 9,57
99,7% M +/- (SD*3) 2,95 – 10

Beachten Sie bei der obigen Tabelle, dass 99,7% der Daten eigentlich zwischen 2,95 – 10,89 liegen müssten, 10 aber den möglichen Maximalwert der Skala darstellt.

Um genauer abschätzen zu können in welchem Bereich die Kundenzufriedenheit vermutlich liegt soll ein 95%-Konfidenzintervall ermittelt werden. Dies kann natürlich einfach in SPSS erledigt werden, ist aber auch per Hand schnell erledigt:

95\%KI=M \pm 1,96\ast\frac{SD}{\sqrt[]{n}}=6,92 \pm 1,96\ast\frac{1,32}{\sqrt[]{100}}=6,92 \pm 0,26= \left[ 6,66;7,18 \right]

Der Mittelwert liegt also mit 95% Sicherheit zwischen 6,7 und 7,2. Eigentlich wird ein durchschnittlicher Wert von 8 angestrebt. Eine anschließende Studie soll klären welchen Faktor zu mehr Zufriedenheit beitragen könnten. Dies könnte etwa durch eine ANOVA oder Regressionsanalyse geschehen.

 

Zusammenfassung: Interpretation Standardabweichung einfach gemacht

In diesem Artikel haben wir Ihnen eine kurze Einleitung zur Standardabweichung Interpretation gegeben. Die Standardabweichung ist eine zentrale Kennzahl der Statistik und bildet den Grundbaustein für viele wichtige statistischen Verfahren. Aber allein in Kombination mit dem Mittelwert ist die Standardabweichung Bedeutung bereits sehr aufschlussreich, insbesondere bei normal verteilten Daten.

Im Anschluss an eine erste Analyse des Mittelwerts und der Standardabweichung bietet sich oft eine vertiefende Analyse der Daten mit fortgeschrittenen Verfahren an. Wenn Sie hier Beratung über das weitere Vorgehen wünschen stehen unsere Experten von Novustat Ihnen gerne zur Seite.

 

Weiterführende Quellen:

[1] https://wissenschafts-thurm.de/grundlagen-der-statistik-dispersionsparameter-varianz-und-standardabweichung/

[2] http://statweb.stanford.edu/~naras/jsm/NormalDensity/NormalDensity.html

[3] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1255808/