Die Homogenität der Varianzen ist eine zentrale Voraussetzung für viele statistische Verfahren, wie beispielsweise die Varianzanalyse (ANOVA) oder t-Tests. Sie beschreibt, ob die Streuungen der abhängigen Variablen innerhalb von Gruppen, die miteinander verglichen werden sollen, als gleich angenommen werden können. Eine Verletzung dieser Annahme führt zu fehlerhaften Ergebnissen, wenn die Varianzinhomogenität ignoriert wird. Deshalb ist es wichtig, die Varianzhomogenität zu prüfen, bevor inferenzstatistische Tests anwendet werden.
In diesem Beitrag zeigen wir Ihnen, wie Sie die Homogenität der Varianzen testen können, welche Verfahren dafür zur Verfügung stehen – insbesondere den Levene-Test und den Bartlett-Test – und welche Besonderheiten es dabei zu beachten gilt.
Was bedeutet Varianzhomogenität?
Varianzhomogenität bedeutet, dass die Varianzen (also die Streuungen) der abhängigen Variablen (metrisch) in den zu vergleichenden Gruppen gleich oder zumindest sehr ähnlich sind
Beispiel zur Veranschaulichung
Stellen Sie sich als fiktives Beispiel eine Studie vor, in der die Lernleistung von Studierenden in drei verschiedenen Lernumgebungen verglichen werden soll:
- Präsenzunterricht (Gruppe 1)
- Online-Unterricht (Gruppe 2)
- Integriertes Lernen (Gruppe 3)
Die abhängige Variable (AV) ist die Punktzahl in einem standardisierten Abschlusstest.
Wenn die Varianzhomogenität gegeben ist, bedeutet das, dass die Werte der AV in allen drei Gruppen ähnlich stark streuen. Das erlaubt einen unverzerrten Vergleich der Mittelwerte, ob beispielsweise Integriertes Lernen im Durchschnitt bessere Leistungen hervorbringt.
Eine Verletzung der Varianzhomogenität liegt dann vor, wenn die Werte hingegen in der Gruppe Integriertes Lernen viel stärker schwanken als in den anderen Gruppen. Das würde bedeuten, dass die Vergleichbarkeit der Gruppenmittelwerte erschwert ist.
Die folgende Darstellung zeigt exemplarisch die Verteilung von Messwerten in drei Gruppen, einmal unter der Annahme homogener Varianzen (links) und einmal bei deutlich unterschiedlicher Streuung zwischen einzelnen Gruppen (rechts).

Varianzhomogenität ist Voraussetzung für die Anwendung vieler statistischer Verfahren, darunter:
- Einfaktorielle und mehrfaktorielle Varianzanalyse (ANOVA)
- t-Test für unabhängige Stichproben
- Lineare Regressionsanalysen (bei Gruppenvergleichen)
Werden die Varianzen als unterschiedlich angenommen (also die Annahme der Varianzhomogenität verletzt), kann dies zu einer verzerrten Schätzung der Teststatistik führen und damit zu falschen Entscheidungen über Hypothesen. Dies gilt jedoch nur, wenn Analyseverfahren verwendet werden, die die Annahme gleicher Varianzen voraussetzen, ohne Korrekturmaßnahmen vorzusehen. Moderne Statistikprogramme wie SPSS bieten oft automatisch Alternativen an, etwa die Welch-Korrektur bei der ANOVA, die auch bei Ungleichheit der Varianzen zuverlässige Ergebnisse liefern.
Daher ist es wichtig, die Homogenität der Varianzen zu prüfen, bevor inferenzstatistische Tests durchgeführt werden. Falls die Voraussetzung verletzt ist, sollte ein angepasstes Verfahren gewählt werden, das dieser Heterogenität Rechnung trägt (siehe Abschnitt „Was tun bei Verletzung der Varianzhomogenität?“).
Hinweis zur Praxisrelevanz
Einige statistische Verfahren, wie etwa die ANOVA, sind relativ robust gegenüber ungleichen Varianzen, wenn die Gruppen ähnlich groß sind und ausreichend große Stichproben vorliegen. Kritischer wird es bei stark unterschiedlichen Varianzen kombiniert mit ungleichen Gruppengrößen. Daher sollte die Varianzhomogenität immer geprüft und, falls sie verletzt ist, ein angepasstes Verfahren in Betracht gezogen werden.
Levene-Test: Robuster Test auf Varianzhomogenität
Der Levene-Test ist eines der am häufigsten verwendeten Verfahren, um die Varianzhomogenität zu testen. Er ist besonders robust gegen Verletzung der Normalverteilungsannahme und daher in der Praxis weit verbreitet.
Funktionsweise
Der Levene-Test vergleicht die Abweichungen der Einzelwerte vom Mittelwert oder Median der Gruppen. Der Test prüft die Nullhypothese, dass sich die Varianzen der Gruppen nicht unterscheiden. Die Alternativhypothese besagt entsprechend, dass mindestens eine Gruppenvarianz von den anderen abweicht. Wird das Testergebnis signifikant, wird die Nullhypothese verworfen und die Alternativhypothese angenommen. Das bedeutet, dass sich die Gruppen in ihrer Streuung bzw. Varianz signifikant voneinander unterscheiden, also mindestens eine Gruppe eine deutlich abweichende Varianz aufweist.
Interpretation
- p > .05: Die Varianzen sind homogen. Das spricht für Varianzhomogenität – die Voraussetzung ist erfüllt.
- p < .05: Die Varianzen unterscheiden sich signifikant und sind nicht homogen – die Voraussetzung ist verletzt.
Ein nicht-signifikantes Ergebnis spricht also dafür, dass die Gleichheit der Varianzen angenommen werden und somit mit dem Verfahren fortgefahren werden kann, ohne spezielle Anpassungen vornehmen zu müssen.
Bartlett-Test: Sensibel, aber leistungsstark
Der Bartlett-Test ist ein klassisches Verfahren, um Varianzhomogenität zu testen. Er ist besonders dann sinnvoll, wenn die Daten der abhängigen Variable normalverteilt sind und man maximale Teststärke möchte. Ob eine Normalverteilung vorliegt, kann mit visuellen Verfahren wie einem Histogramm und Q-Q-Plot geprüft werden, sowie statistischen Verfahren wie dem Kolmogorov-Smirnov- oder Shapiro-Wilk-Test.
Funktionsweise
Der Bartlett-Test basiert auf einer Transformation der Varianzschätzungen und prüft, ob die Unterschiede zwischen den Gruppenvarianzen zufällig oder systematisch sind.
Interpretation
Auch beim Bartlett-Test gilt: Ist der p-Wert größer als 0,05, kann von Varianzhomogenität ausgegangen werden. Die Interpretation erfolgt analog zum Levene-Test.
Einschränkung
Der Bartlett-Test reagiert empfindlich auf Verletzungen der Normalverteilung. Sind die Daten nicht normalverteilt, kann der Test zu Fehlentscheidungen führen. In solchen Fällen ist der Levene-Test die bessere Wahl.
Hinweis: Verwechseln Sie den Bartlett-Test nicht mit dem „Bartlett’s Test auf Sphärizität“, der im Rahmen der Faktorenanalyse und Hauptkomponentenanalyse verwendet wird, um die Eignung von Variablen für die Analyse zu überprüfen.
Varianzhomogenität prüfen in SPSS & Co.
Wer Varianzhomogenität prüfen möchte, kann dies bei einer einfaktoriellen ANOVA in SPSS sehr einfach umsetzen. Unter „Analysieren“ – „Mittelwerte vergleichen“ – „Einfaktorielle Varianzanalyse“ kann die abhängige Variable sowie der Gruppenfaktor definiert werden. Unter „Optionen“ kann das Kontrollkästchen „Test auf Homogenität der Varianzen“ aktiviert werden. SPSS führt dann automatisch den Levene-Test durch und zeigt dessen Ergebnis in der Ausgabe an.
In R kann der Levene-Test unter der Verwendung des Pakets car und der Funktion leveneTest() durchgeführt werden. Nutzen Sie dafür den folgenden Befehl:

Die metrische AV Punktzahl wird durch eine Tilde (~) vom Gruppenfaktor Lernumgebung getrennt. Der verwendete Datensatz heißt Lernleistung. Dieser Befehl testet die Varianzhomogenität der abhängigen Variable über die Gruppen.
Der Bartlett-Test auf Varianzhomogenität ist in SPSS nicht verfügbar – weder über Menüs noch über die Standard-Syntax. SPSS bietet standardmäßig nur den Levene-Test zur Prüfung der Homogenität der Varianzen an, da dieser robuster gegenüber Verletzungen der Normalverteilung ist.
Wenn Sie den Bartlett-Test auf Gleichheit der Varianzen dennoch durchführen möchte, können Sie dies in R mit der Funktion bartlett.test tun, die in der Basisinstallation enthalten ist:

Wie wird die Teststatistik interpretiert?
In der Ergebnisausgabe von SPSS oder R finden Sie folgende Kennzahlen für den Levene-Test:
- Levene-Statistik: Die berechnete Teststatistik
- df1: Die Zählerfreiheitsgrade (Anzahl Gruppen – 1)
- df2: Die Nennerfreiheitsgrade (Gesamtanzahl der Fälle – Anzahl Gruppen)
- Sig.: Der p-Wert (Signifikanzwert)
Die Freiheitsgrade (df1 und df2) geben Aufschluss über die Größe und Struktur der Stichprobe und sind Teil der formalen Berechnung der Teststatistik. In der Praxis konzentriert man sich jedoch meist auf den p-Wert, da dieser direkt angibt, ob der beobachtete Unterschied der Varianzen statistisch bedeutsam ist. Die Levene-Statistik ist dabei die Prüfgröße, die aus den absoluten Abweichungen vom Median oder Mittelwert innerhalb der Gruppen berechnet wird. Je größer der Wert, desto stärker unterscheiden sich die Varianzen. Aussagen über die Signifikanz ergeben sich aus dem p-Wert.
R-Ausgabe Levene-Test

Die Ausgabe zeigt das Ergebnis der Prüfung der Varianzhomogenität für die drei unterschiedlichen Lernumgebunden des Studiendesigns. Die Freiheitsgrade df1 und df2 werden untereinander in der Spalte Df dargestellt. F value gibt die berechnete F-Statistik an, die als Prüfgröße auf den Unterschied der gruppenspezifischen Abweichungen vom Median basiert. Die Spalte Pr(>F) enthält den zugehörigen p-Wert, der angibt, ob das Ergebnis statistisch signifikant ist.
Da im gezeigten Beispiel p > .05 ist, wird angenommen, dass die Varianzen nicht signifikant unterschiedlich sind, also liegt Varianzhomogenität vor.
Das Ergebnis wird nach APA-Richtlinien in der Form F(df₁, df₂) = F-Wert, p = p-Wert berichtet und kann im Text wie folgt dargestellt werden:
„Der Levene-Test war nicht signifikant, F(2, 27) = 2.44, p = .105, sodass von Varianzhomogenität ausgegangen werden kann.“
R-Ausgabe Bartlett Test

Die Ergebnisausgabe zeigt das Resultat des Bartlett-Tests auf Homogenität der Varianzen. Der Wert Bartlett’s K-squared ist die berechnete Teststatistik. Die Variable df enthält die zugehörigen Freiheitsgrade df1. Der p-Wert gibt an, ob die Varianzen zwischen den Gruppen signifikant unterschiedlich sind.
Da im gezeigten Beispiel p > .05 ist, kann davon ausgegangen werden, dass Varianzhomogenität vorliegt.
Die Teststatistik des Bartlett-Tests ist eine Chi-Quadrat-verteilte Prüfgröße. Das Ergebnis wird nach APA-Richtlinien in der Form χ²(df1) = Wert, p = p-Wert berichtet und kann im Text beispielsweise so dargestellt werden:
„Der Bartlett-Test war nicht signifikant, χ²(2) = 4.33, p = .115, sodass von Varianzhomogenität ausgegangen werden kann.“
Was tun bei Verletzung der Varianzhomogenität?
Wenn der Levene- oder Bartlett-Test eine signifikante Verletzung anzeigt, stehen mehrere Möglichkeiten zur Verfügung:
- Transformation der Daten (z. B. Logarithmus, Wurzel), um die Varianzen anzugleichen
- Verwendung robuster Verfahren, wie die Welch-ANOVA oder der Brown-Forsythe-Test, die keine Varianzhomogenität voraussetzen
- Nichtparametrische Tests wie der Kruskal-Wallis-Test, wenn auch die Normalverteilung fraglich ist
- Bootstrap-Verfahren zur Schätzung stabilerer Konfidenzintervalle
Hier kann eine fundierte Beratung helfen, das passende Verfahren für die jeweilige Fragestellung zu wählen.
Fazit
Die Homogenität der Varianzen ist eine entscheidende Voraussetzung für viele statistische Analysen wie ANOVA, Regressionsmodelle oder Gruppenvergleiche per t-Test. Wer valide Ergebnisse erhalten möchte, sollte deshalb die Varianzhomogenität testen. Der Levene-Test bietet hier eine robuste Lösung, während der Bartlett-Test unter Normalverteilung besonders leistungsfähig ist. Moderne Statistiksoftware wie SPSS macht das Varianzhomogenität prüfen einfach und zugänglich.
Wenn Sie unsicher sind, welches Verfahren für Ihre Daten am besten geeignet ist, oder Hilfe bei der Interpretation benötigen, unterstützen wir Sie gerne. Unsere erfahrenen Statistikberater stehen Ihnen zur Seite.