Statistische Tests führt man immer dann durch, wenn man mit Hilfe von erhobenen Daten Rückschlüsse auf die gesamte Grundgesamtheit bzw. Zielpopulation nachweisen möchte. Der Grundsatz für statistische Tests ist hierbei, dass der Anwender oder Statistiker das Gegenteil widerlegt. Ja nach Fragestellung und vorhandenen Variablen unterscheidet man eine Vielzahl verschiedener Verfahren für statistische Tests.
Folgende Fragen werden in diesem Artikel beantwortet:
- Was ist ein statistischer Test?
- Was versteht man unter einem Hypothesentest?
- Wann benötigt man multivariate Tests?
- Warum gibt es verschiedene statistische Tests?
- Welche statistischen Tests gibt es?
Sollten Sie Unterstützung bei Ihren statistischen Tests benötigen, helfen unsere Statistiker Ihnen gerne weiter. Nutzen Sie einfach unser Kontaktformular für eine kostenlose Beratung & ein unverbindliches Angebot – oder rufen Sie uns an.
Was ist ein statistischer Test?
Die Statistik beantwortet oft Fragen bezüglich der Unterschiede zwischen zwei Gruppen von Personen oder Daten. Beispielsweise: Haben Frauen im Schnitt kleinere Füße als Männer? Haben die Teilnehmer, die eine bestimmte Lernmethode verwendet haben, später bessere Testergebnisse als die Kontrollgruppe? Sind kranke Mäuse, die das zu testende Medikament erhalten haben, mit größerer Wahrscheinlichkeit wieder gesund geworden als diejenigen, die nicht behandelt wurden? Werden in Stuttgart mehr Schuhe gekauft als in Berlin?
Rückschluss auf die Grundgesamtheit
Solche Unterschiede nachzuweisen ist schwierig. Denn die Individuen in jeder Gruppe sind nicht gleich. Die Schuhgröße hängt nicht nur vom Geschlecht und das Testergebnis nicht nur von der Lernmethode ab. Die Mäuse sind verschieden robust, sowohl in Stuttgart als auch in Berlin gibt es Menschen mit unterschiedlichen Gehaltsklassen. Die Statistik kennt verschiedene Verfahren, um den Einfluss einer unabhängigen Variablen (z.B. Geschlecht) auf eine abhängige Variable (z.B. Schuhgröße) herauszurechnen oder quantitativ einzuschätzen. Wie wahrscheinlich ist es, dass Frauen tatsächlich kleinere Füße haben als Männer?
Statistischer Test und Evidenz
Selbst wenn die Daten tausender von Menschen aufzeigen, dass der Durchschnitt in der Frauengruppe kleiner ist als in der Männergruppe, so könnte dieser Unterschied immer noch zufällig entstanden sein. Je größer die Datenmenge, umso unwahrscheinlicher wird ein solcher Fehler allerdings. Einen echten Beweis im mathematischen Sinne kann die Statistik nicht liefern. Sie kann aber angeben, mit welcher Wahrscheinlichkeit eine Schlussfolgerung vermutlich richtig oder falsch ist. Genau dazu dienen statistische Tests.
Was versteht man unter einem Hypothesentest?
Es ist immer leichter, eine Hypothese (=Vermutung) zu widerlegen als sie zu beweisen. Ein einziger schwarzer Schwan genügt, um die Hypothese „Alle Schwäne sind weiß“ zu widerlegen. Oder: Wenn wir messen, dass die Schuhgrößen von Frauen kleiner sind als die von Männern, kann man immer noch bezweifeln, dass dies allgemein gilt. Vielleicht war die Stichprobengröße zu klein?
Aufstellen von Hypothesen
Darum geht man beim Hypothesentest so vor, dass man zuerst eine Nullhypothese definiert. Diese ist das Gegenteil von dem, was man beweisen will. Will man also nachweisen, dass Frauen kleinere Füße als Männer haben, definiert man die Nullhypothese H0 „Frauen haben größere oder gleich große Füße wie Männer“. Diese Nullhypothese versucht man zu widerlegen.
Man sammelt nun Schuhgrößen von Männern und Frauen und berechnet für beide Gruppen den Mittelwert und die Standardabweichung. Stellt sich heraus, dass die Schuhgrößen von Frauen untereinander und von Männern untereinander sehr stark variieren (= große Standardabweichungen), dann ist es wahrscheinlicher, dass ein beobachteter Unterschied des Mittelwerts zufällig entstanden sein könnte. Vielleicht hat man zufällig vor allem kleine Frauen mit großen Männern verglichen?
Fehlermöglichkeiten
Eine Hypothese kann nie mit absoluter Sicherheit bestätigt bzw. widerlegt werden, sondern immer nur mit einer gewissen Wahrscheinlichkeit. Insgesamt gibt es vier Möglichkeiten:
- H0 ist richtig und wird als richtig angenommen. Dies wäre richtig.
- H0 ist richtig und wird vom statistischen Test als falsch verworfen. Dies wäre ein Fehler 1. Art (oder α-Fehler).
- H0 ist falsch und wird vom statistischen Test als richtig angenommen. Dies wäre ein Fehler 2. Art (oder β-Fehler).
- H0 ist falsch und wird als falsch verworfen. Dies wäre richtig.
Grundgesamtheit: H0 | Grundgesamtheit: H1 | |
Testergebnis: H0 | ✓ richtige Testentscheidung | Fehler 2. Art, β-Fehler |
Testergebnis: H1 | Fehler 1. Art, α-Fehler | ✓ richtige Testentscheidung |
Auch wenn man anhand von Daten aus einer Stichprobe nicht wirklich beweisen kann, ob die Nullhypothese H0 richtig oder falsch ist, kann man doch für statistische Tests die Größe des α-Fehlers vorgeben (in der Regel 5%, also 0,05) und die des β-Fehlers mit Hilfe der Stichprobengröße regulieren. Je kleiner diese Fehler, umso sicherer kann man sein, die richtige Schlussfolgerung aus den Daten gezogen zu haben.
Wann verwendet man multivariate Tests?
Während sich Hypothesentests in der Regel auf zwei Variablen konzentrieren – die unabhängige und die abhängige – können multivariate statistische Tests Abhängigkeiten zwischen deutlich mehr unabhängigen Variablen untersuchen, finden und ihre Stärke abschätzen. Beispielsweise könnte man mit einem multivariaten Test den Einfluss nicht nur des Geschlechts, sondern auch der Körpergröße und des Alters auf die Schuhgröße untersuchen.
Warum gibt es verschiedene statistische Tests?
Es gibt verschiedene Arten von Daten, z.B. auf verschiedenen Skalen (Nominal- oder Ordinalskala, Intervall-, Verhältnis- oder Absolutskala). Manchmal setzt der statistische Test voraus, dass die Daten normalverteilt sind, also einer Gaußschen Glockenkurve folgen. Andere Tests setzen dies nicht voraus. Je nach Datenskala sowie Verteilung der Daten sind jeweils unterschiedliche statistische Tests nötig. Das Vorliegen der Voraussetzungen muss vor der Durchführung der Tests auf jeden Fall geprüft werden, um sicher zu stellen, den richtigen Test auszuwählen. Sonst erhalten Sie ungültige Ergebnisse.
Welche statistischen Tests gibt es?
Statistische Tests gibt es in unterschiedlichsten Versionen – Zu den wichtigsten zählen folgende Varianten:
Tests auf Gruppenunterschiede
- Der Student-Test (auch T-Test genannt) und der Wilcoxon-Mann-Whitney-Test vergleichen die Lage zweier unabhängiger Stichproben.
- Der Kruskal-Wallis-Test und der ANOVA-Test (F-Test) vergleichen die Lage von drei oder mehr Gruppen unabhängiger Stichproben.
- Die Varianzanalyse prüft Mittelwertunterschiede zwischen Gruppen.
- Der Chi-Quadrat-Test prüft 2 kategoriale Variablen bezüglich Abhängigkeiten zwischen den Gruppen.
- Der Wilcoxon-Vorzeichen-Rang-Test vergleicht die Lage zweier abhängiger Stichproben (bspw. Paarvergleiche).
- Der Friedman-Test vergleicht die Lage von drei oder mehr Gruppen abhängiger Stichproben.
Tests auf Zusammenhänge von Variablen
- Die Kanonische Korrelationsanalyse (Pearson Korrelation, Spearman Korrelation) misst die Zusammenhänge zwischen zwei Gruppen von Daten.
- Die Assoziationsanalyse identifiziert Regeln wie „Wenn A, dann B“.
- Die Faktorenanalyse wertet im Gegensatz zu Korrelations- und Regressionsanalyse die Zusammenhänge zwischen allen Variablen aus und sortiert dann die weniger relevanten Faktoren wieder aus, um sich auf die relevanten Zusammenhänge zu konzentrieren.
Multivariate Tests
- Die Diskriminanzanalyse untersucht Unterschiede zwischen zwei bzw mehr Gruppen, die anhand mehrerer Variablen beschrieben werden. Häufige Anwendung in der Biometrie.
- Die lineare oder nichtlineare Regression erklärt die Änderungen einer abhängigen Variablen durch die Änderungen einer bzw mehrerer unabhängiger Variablen.
Sonstige wichtige Tests
- Der Shapiro-Wilk-Test sowie der Kolmogorov-Smirnov Test prüft eine Verteilung auf Normalverteilung.
- Der Levene Test überprüft Varianzhomogenität zwischen zwei bzw mehreren Gruppen