Sie kennen sicher folgendes Szenario: Sie wollen eine Umfrage erstellen (oder nehmen an einer teil). Bei dieser sind Fragen aufgelistet, die nicht bloß mit „Ja/Nein“ zu beantworten sind. Stattdessen bieten die Fragen ein breiteres Spektrum an Antwortmöglichkeiten. Solche Fragen werden mittels Likert Skala beantwortet.
Zentrales Kennzeichen der Skala ist die Mehrstufigkeit, mit der Meinungen und Einstellungen gemessen werden. Vorteil für die Befragten: Sie können ihre Meinung differenziert – eben entlang der gebotenen Skalierung – angeben.
Nachfolgend werfen wir einen Blick auf die Fragen: Wie gehen wir konkret mit einer Likert Skala um? – Welche Art der Skalierung gibt es und wie und wann setzen wir Likert Fragen am besten in einem Fragebogen ein? Außerdem gehen wir tiefgründiger auf die Auswertungsmöglichkeiten und Einflusskomponenten der Likert Skala ein.
Wenn Sie Unterstützung bei der Planung Ihrer Studie oder der statistischen Auswertung Ihrer Daten benötigen, sollten Sie sich an die erfahrenen Experten von Novustat wenden. Unsere Statistiker helfen Ihnen weiter mit einer individuellen und bedarfsgerechten Beratung!
Was ist eine Likert Skala?
Benannt nach ihrem Begründer, dem amerikanischen Sozialforscher Rensis Likert, besteht die Likert Skala aus mehreren Items, konkret aus einer Abfolge von Aussagen (auch Itembatterie genannt), denen die Befragten auf einer vorgegebenen abgestuften Antwortskala zustimmen bzw. ablehnen können. Alternativ kann man gegebenenfalls auch eine neutrale Einstellung nennen. Im Gegensatz zu Binärfragen, die stets nur zwei Antwortoptionen haben (z. B. „Ja/Nein“), ermöglicht die Likert Skala demnach ein tiefergehendes Feedback zu den gemessenen Einstellungen und Meinungen. Ziel ist eine trennscharfe Itemmenge, die Basis für ein valides Ergebnis im Hinblick auf die untersuchte Fragestellung ist.
Die zentrale Frage daraus ist jene nach möglichen Arten der Skalierung für Likert Fragen. Konkret lassen sich diverse Skalenarten unterscheiden. Wir wollen nachfolgend auf einige wesentliche Differenzierungen eingehen: verbalisierte versus endpunktbenannte; gerade versus ungerade Anzahl an Skalenpunkten; Breite und Richtung der Skala.
Gestaltung von Likert Skalen im Fragebogen
Die Qualität der späteren Auswertung hängt direkt von der Gestaltung der Skala ab. Daher sollten zentrale Designentscheidungen bewusst getroffen werden.
Verbalisierte vs. endpunktbenannte Skalen
Verbalisiert nennen wir eine Skala, deren einzelne Skalenpunkte verbal benannt sind, zum Beispiel:
Item 1: „Mopeds werden überwiegend von Frauen gefahren.“

Bei endpunktbenannten Skalen benennt man dagegen nur die jeweiligen Randskalenpunkte. Die dazwischen liegenden Skalenpunkte versieht man zur Orientierung mit Zahlen:

In schriftlichen Befragungen verwenden Forschende häufig eine Mischform der beiden genannten Skalen, also verbalisierte Skalen, die durch Skalenpunkte ergänzt werden:

Welche Variante nun zu bevorzugen sei, dazu gibt es unter Experten unterschiedliche Auffassungen. Der Vorteil der verbalisierten Skala liegt eindeutig darin, dass für Befragte sofort ersichtlich ist, wie die einzelnen Abstufungen der Skala zu verstehen sind. Die Herausforderung indes liegt in der passenden verbalen Formulierung für die einzelnen Antwortmöglichkeiten, die in gleichen Abständen voneinander liegen.
Dieses Formulierungsproblem entfällt bei der endpunktbenannten Skala. Dafür ist es aber für Befragte eventuell unklar wie die einzelnen Zahlenwerte und Ihre Abstände dazwischen zu interpretieren sind.
Als Tipp: Entscheiden Sie sich für eine (von Ihnen bevorzugte) Likert Skala, die in jedem Fall an den Endpunkten verbale Formulierungen enthalten. Verwenden Sie die gewählte Skala einheitlich und durchgängig im Aufbau des Fragebogens und erklären Sie verständlich die Anwendung der Skala in einem Beispiel zu Beginn.
Gerade vs. ungerade Anzahl an Skalenpunkten
Eine Schlüsselfrage unter Forschern ist zweifellos jene nach der Anzahl an Skalenpunkten. Beide Varianten, eine gerade wie eine ungerade Anzahl an Werten, haben ihre Vorteile. Die Wahl liegt wie so oft beim Anwender. Eine Likert Skala mit einer ungeraden Anzahl hat einen Mittelpunkt und dies erleichtert die Orientierung. Zugleich wird die Mitte gerne als Fluchtkategorie verwendet, wenn sich Befragte nicht entscheiden können oder wollen. Eben diese Mitte fehlt bei einer geraden Skalierung. Folglich sind Befragte gezwungen, sich für eine Tendenz zu entscheiden und sich für oder gegen eine Aussage zu positionieren.
Ob eine Mittelkategorie nun als vorteilhaft oder aussageverzerrend anzusehen ist, hängt auch von der Forschungsfrage bzw. dem Auswertungsplan ab.
Anzahl der Skalenpunkte
In der Praxis haben sich Skalen mit 4 bis 7 Antwortoptionen etabliert. Sind mehr als 7 Skalenpunkte vorhanden, werden die Befragten erfahrungsgemäss eher zufällig eine Antwort auswählen, was die Ergebnisse nutzlos machen würde. In Onlineumfragen wird zunehmend eine Variante mit einem Schieberegler eingesetzt, bei der Befragte ihre Antwort auf einer Skala von Null (Minimum) bis 100 (Maximum) angeben.
Richtung und Darstellung der Skala
Eine intuitive Skala verläuft von links nach rechts, wobei höhere Werte eine stärkere Zustimmung ausdrücken. Unklare oder inkonsistente Kodierungen erhöhen das Risiko systematischer Verzerrungen.
Auch visuelle Hervorhebungen oder ungewöhnliche Darstellungen sollten vermieden werden, da sie das Antwortverhalten beeinflussen können.
Die genannten Aspekte der Skalengestaltung wirken sich direkt auf die statistische Auswertung und Interpretation der Ergebnisse aus. Im nächsten Schritt betrachten wir daher, wie Likert Skalen statistisch eingeordnet und ausgewertet werden.
Einfluss der Skalengestaltung auf die Auswertung
Die Art der Skalierung beeinflusst maßgeblich die Interpretation der Ergebnisse.
Einfluss der Mitte
Im genannten Beispiel wurde eine Skalierung mit Mittelkategorie gewählt. Ihr Einfluss lässt sich daran gut zeigen: Eine solche Mittelkategorie ermöglicht es Befragten, eine neutrale Position einzunehmen.
Die Alternative ohne Mittelkategorie würde die Befragten dagegen dazu auffordern, sich konkret zu positionieren, entweder in Richtung Zustimmung („trifft voll/eher zu“) oder Ablehnung („trifft nicht zu“).
Ob der Einsatz einer Mittelkategorie sinnvoll ist, hängt von der Forschungsfrage und dem Auswertungsziel ab. Während sie eine differenziertere Einschätzung erlaubt, kann sie gleichzeitig dazu führen, dass sich Befragte einer klaren Positionierung entziehen.
Bipolare Skalen (Polaritätsprofil)
Wir haben bis jetzt stets von unipolaren Skalen gesprochen, d.h. von einer Likert Skala mit Ausprägungen von beispielsweise „gar nicht“ bis „sehr“. Eine Alternative sind sogenannte bipolare Skalen, die Gegensatzpaare verwenden und eingesetzt werden, um Einstellungen oder die Einschätzung von Eigenschaften (etwa zu Marken) zu messen und daraus ein Polaritätsprofil zu erstellen. Beispiele solcher Polaritäten sind:
- Modern–traditionell
- Gesund–ungesund
- Schön–hässlich
- Innovativ–konservativ
- Flexibel–träge
Methodologisch sind unipolare Skalen gängiger, aber nicht zwingend valider, der Einsatz hängt wiederum vom Forschungsziel ab.
Einfluss durch Skalenbenennung
Ein letzter Punkt soll den Einfluss von Fragestellung und Vorgabe der Antwortmöglichkeiten bei der Likert Skala auf das Ergebnis zeigen. Wir wollen das Interesse von Studierenden an Statistik erheben und formulieren dazu zwei (unterschiedliche) Fragen mit unterschiedlichen Antwortausprägungen. Der Frageninhalt ist jeweils derselbe.
Item A: “Ich interessiere mich für Statistik.”

Item B: “Wie stark, würden Sie sagen, interessieren Sie sich für Statistik?”

Das erste Item ist als Aussage konzipiert und fokussiert in den Antwortoptionen den Grad der Zustimmung bzw. Ablehnung. Die zweite Frage bezeichnen wir als item-spezifisch, sie legt den Fokus auf die Fragestellung und bewirkt beim Befragten eine höhere Aufmerksamkeit. Experimente zeigen: Während die erste Variante bei Befragten eher zu schnellen Routine-Antworten führt (insbesondere bei längeren Fragebatterien), lesen und beantworten Befragte item-spezifische Fragen deutlich sorgfältiger. Dabei zeigen sie eine höhere Konzentration, was zu zuverlässigeren Antworten führt. Und eine kritische Beurteilung der Daten liegt ja im Interesse des Forschers.
Auswertung von Likert Skalen
Bevor wir den Blick auf den Zusammenhang von Likert Skala und Skalierungsniveau werfen, ist klarzustellen: Die Skalierungen nominal, ordinal (bzw. Rangskala) und metrisch (kardinal) beschreiben das Messniveau einer Variable oder eines Items, während eine Likert Skala eine Abfolge von Aussagen bzw. Items bezeichnet, die anhand vorgegebener Kategorien beantwortet werden.
Wichtig zu beachten bei der Likert Skala: Die statistische Auswertung wird bestimmt durch das Skalierungsniveau der einzelnen Items. Hier gilt zu beachten, dass die Daten der einzelnen Items einer Likert Skala ordinal- bzw. rangskaliert sind, also die einzelnen Abstände innerhalb der Ausprägungen nicht als gleich betrachtet werden können. Ergebnisse lassen sich folglich anhand der Lageparameter Modus und Median darstellen. Forschende sollten den Mittelwert statistisch nur dann anwenden, wenn die Likert Skala symmetrisch formuliert ist und die Skalenpunkte von allen Befragten als gleichabständig interpretiert werden.
Bildung von Summenscores und Interpretation
In der Praxis werden die Antworten mehrerer Items häufig zu einem Summenscore zusammengefasst. Dieser Wert kann als intervallskaliert betrachtet werden. Folglich dürfen aus den Summenwerten Mittelwerte als auch Standardabweichung errechnet werden und damit steht ein breites Feld an statistischen Auswertungsverfahren zur Verfügung.
Dazu ein Beispiel mit einer Itembatterie aus 2 Fragen:
Ein Befragter beantwortet Item 1 mit „3“ („trifft teilweise zu“) und Item 2 mit „5“ („trifft voll zu“).
Item 1: “Mopeds werden überwiegend von Frauen gefahren.”

Item 2: “Ich fühle mich auf einem Moped ungeschützt.”

Daraus ergibt sich ein Summenwert von 8 und in weiterer Folge der Mittelwert 4 für die gesamte Likert Skala. Die Auswertung besagt, je größer der mittlere Summenwert, desto höher die Zustimmung des Befragten zur gesamten Fragenbatterie.
Top-Box- und Bottom-Box-Analyse
Bei der Auswertung von Likert Skalen werden häufig mehrere Skalenpunkte zu übergeordneten Kategorien zusammengefasst. Man spricht dabei von sogenannten Top-Box- und Bottom-Box-Analysen.
Die Top Box umfasst die positiven Bewertungen (z. B. „trifft eher zu“ und „trifft voll zu“), während die Bottom Box die ablehnenden Bewertungen zusammenfasst (z. B. „trifft eher nicht zu“ und „trifft nicht zu“).
Dabei fassen Sie die einzelnen Ausprägungen zu einer binären Entscheidung („Zustimmung“ vs. „Ablehnung“) zusammen. Der Fokus liegt somit weniger auf Summenscore und Mittelwert, sondern auf der prozentualen Verteilung dieser beiden Gruppen.
Eine solche Vorgehensweise wird insbesondere dann eingesetzt, wenn die Stimmungslage zu einem bestimmten Thema übersichtlich dargestellt werden soll, etwa bei Befragungen mit mehreren Einzelfragen. Die Umsetzung in SPSS erfolgt einfach über den Menüpunkt „Umkodieren in andere Variable“. So wird die ursprüngliche mehrstufig skalierte Variable in eine neue binäre Variable mit den beiden Ausprägungen Zustimmung und Ablehnung transformiert. Im Falle mehrerer Fragen lassen sich gegebenenfalls auch Summen bzw. Mittelwerte bilden, die wiederum einer der beiden Gruppen zugeordnet werden können.
Umfrage Auswertung: Das sollte man beachten
Bei einer Umfrage Auswertung gibt es neben der korrekten Analyse der Likert Skalen natürlich noch andere wichtige Punkte, die man unbedingt beachten sollte. Eine hilfreiche Übersicht bietet hierbei das folgende Video:
Fazit
Die Likert Skala ist ein vielseitiges Instrument zur Erhebung von Einstellungen und Meinungen. Ihr Potenzial entfaltet sie jedoch nur dann vollständig, wenn Gestaltung und Auswertung aufeinander abgestimmt sind.
Eine klare, konsistente Skalierung verbessert die Datenqualität und erleichtert die Interpretation. Gleichzeitig bestimmt die konkrete Ausgestaltung der Skala, welche statistischen Verfahren Sie sinnvoll anwenden können.
Wer valide Ergebnisse erzielen möchte, sollte daher sowohl die Konstruktion der Skala als auch deren Auswertung als zusammenhängenden Prozess betrachten. Je klarer, einheitlicher und verständlicher die Likert Skala gestaltet ist, desto zuverlässiger und valider sind die erhobenen Daten.
Quellenangaben:
Porst, Rolf. Fragebogen. Ein Arbeitsbuch. 4. Aufl. VS Verlag. Wiesbaden 2014.
Schnell, Rainer; Hill, Paul B; Esser, Elke. Methoden der empirischen Sozialforschung. 10. Aufl. Oldenbourg. München 2014.
Survey Monkey: Let’s agree NOT to use agree/disagree questions