Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

Faktorenanalyse einfach erklärt: Mit einem Umsetzungsbeispiel in SPSS

Die Faktorenanalyse als eine zentrale Methode der multivariaten Statistik haben wir bereits in einem Beitrag zur multivariaten Statistik vorgestellt. Faktorenanalyse bzw. Hauptkomponentenanalyse gehört neben der Clusteranalyse zu den wichtigsten Verfahren der Datenreduktion. Während eine Clusteranalyse darauf abzielt, Untersuchungseinheiten sinnvoll zu gruppieren, werden bei der Faktorenanalyse Variablen oder Items auf wenige Faktoren reduziert. Damit werden die Analysen übersichtlicher und aussagekräftiger.

Darüber hinaus basieren diese Verfahren auf der Idee, dass die erhobenen Einzelinformationen nur Dimensionen einer latenten Größe sind, d.h. nicht direkt erfassbar sind. Die Faktorenanalyse dient dann dieser Berechnung.

Sie möchten eine Faktorenanalyse mittels SPSS durchführen und brauchen dabei Unterstützung? Wenden sie sich hierfür an uns für eine professionelle Beratung.

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.


Jetzt unverbindlich anfragen

In diesem Beitrag möchten wir Ihnen die Faktorenanalyse näher vorstellen:

  • Was ist die Grundidee der Faktorenanalyse?
  • inwiefern unterscheidet sich die Faktorenanalyse von der Hauptkomponentenanalyse?
  • Was macht eine konfirmatorische Faktorenanalyse aus?
  • Wie wenden Sie Faktorenanalyse SPSS an?

Grundidee der Faktorenanalyse

Die Grundidee hinter der Faktorenanalyse ist überraschend einfach: man betrachtet die Korrelationen der verwendeten Items zueinander und versucht, Gruppen an Items zu entdecken, die möglichst stark miteinander und möglichst wenig mit den restlichen Items korrelieren. Die zugrundeliegenden Zusammenhänge sind daher oft bereits in der sogenannten Korrelationsmatrix (siehe auch in SPSS) leicht erkennbar.

Nehmen wir an, wir untersuchen die Kundenbewertungen eines Produktes, zum Beispiel eines Autos. So würde var1 für „Schnelligkeit“, var4 für „sportliches Aussehen“ und var5 für „Urbanität“ stehen. Und var6 wäre „Bequemlichkeit“ und var7 „Geräumigkeit“. Folglich erkennt man in diesem (fiktiven) Beispiel, dass var1 (Schnelligkeit) stark mit var4 (sportlich) und var5 (urban), aber nur schwach mit den Variablen var6 und var7 korreliert.

Folglich werden vorrangig die Variablen var1, var4 und var5 einen gemeinsamen – datenreduzierenden – Faktor bilden.

Abbildung: Ausschnitt aus einer Korrelationsmatrix

Das Bestimmen der Faktoren

Das Ableiten der Faktoren aus der Korrelationsmatrix geschieht über die Matrizenrechnung. Man kann sich das bildlich so vorstellen: In einem Koordinatensystem strahlen aus einem Punkt in alle Richtungen Vektoren aus. Jeder Vektor entspricht einem Item und die Winkel zwischen den einzelnen Vektoren entsprechen den umgerechneten Korrelationsgrößen zwischen diesen Items (je weiter unter 90ᵒ desto stärker). Nun versucht man weitere Vektoren (diese sollen die Faktoren repräsentieren) in diesem Raum so zu platzieren, dass ihr gemeinsamer Abstand zu den Item-Vektoren minimal ist.

Diese einzelnen Abstände entsprechen dann den Faktorladungen, also den Korrelationen zwischen den latenten Faktoren und den Items. Um diesen Berechnungsschritt zu erleichtern, dreht bzw. rotiert man immer wieder das Koordinatenkreuz (mittels einer Variablentransformation) ausgehend von seinem Ursprungspunkt. Als würde man das Zimmer drehen, um einen optimalen Platz für das Sofa zu finden.

Faktorenanalyse SPSS

SPSS bietet eine sehr einfache und intuitive Anwendung der Faktorenanalyse. WWir machen  mit dem oben obigen Beispiel weiter: Bei einer der Befragung wurden 15 intervallskalierten Items zur Bewertung eines bestimmten Automodells erhoben. Diese werden mittels der Faktorenanalyse zu allgemeinen Bewertungskriterien zusammengefasst.

Auf der SPSS-Schaltfläche wählen wir:

„Analysieren“ –> „Dimensionsreduktion“ –> „Faktorenanalyse“

Wir verschieben die 15 Variablen in das Fenster „Variablen“. Im Feld „Rotation“ wählen wir eine Rotation, die die Interpretation der Faktoren erleichtern soll. Die gebräuchlichste Rotation ist Varimax, die eine deutlichere Abgrenzung der Faktoren gewährleistet. Im Feld „Scores“ kreuzen wir an, dass die berechneten Faktoren als neue Variable im Datensatz erscheinen sollen.

Das erste wichtige Ergebnisfeld sind die sogenannten Eigenwerte der Faktoren. Der Eigenwert entspricht dem Anteil der Gesamtvarianz (der verwendeten Items), der durch einen Faktor erklärt wird. Grundsätzlich verwendet man nur Faktoren, die einen Eigenwert von größer 1 haben, also nicht weniger Informationen beinhalten als ein einzelnes Item. In unserem Fall ergeben sich drei Faktoren, wobei der erste mit Abstand der informativste ist, da er allein 42 % der Gesamtvarianz erklärt. Die grafische Entsprechung dieser Tabelle ist der Screeplot und unter „Extraktion“ zu finden.

Faktorenanalyse SPSS: Interpretation

Im nächsten Schritt interpretieren wir die Faktoren. Ihre inhaltliche Bedeutung wird aus den Faktorladungen abgeleitet, also aus den Faktor-Item Korrelationen.

Hier ist klar und eindeutig erkennbar, dass var1var5 sowie var14 und var15 stark auf den ersten Faktor laden. Man müsste jetzt die inhaltlichen Bezeichnungen dieser Variablen dazu nutzen, einen Überbegriff für den Faktor zu bestimmen. An dieser Stelle ist weniger Mathematik gefragt, als vielmehr Kreativität und freie inhaltliche Interpretation.

Wir erinnern uns, dass „Schnelligkeit“, „sportliches Aussehen“ und „Urbanität“ dabei waren. Wenn wir annehmen, dass var14 für „modernen Farbton“ und var15 für „moderne Innenausstattung“ stehen, so hätten wir wohl einen Faktor, der die Bewertung des Automodells als „sportlich modernes Auto“ repräsentiert. Ein alternativer Überbegriff könnte “statusdomiert” lauten.

Die Faktorladungen werden schließlich zur Berechnung der Faktorenwerte verwendet und die im Datensatz hinterlegten Scores können wir für weitere Analysen nutzen.

Wenn Sie zur Durchführung und Interpretation einer Faktorenanalyse weitere Fragen haben, zögern Sie nicht, uns unverbindlich zu kontaktieren! Wir beraten und unterstützen Sie gerne bei all Ihren Fragen rund um multivariate Verfahren!

Hauptkomponentenanalyse vs. Hauptachsenanalyse

Ein Missverständnis, das im deutschsprachigen Raum oft im Zusammenhang mit dem Begriff Faktorenanalyse entsteht, basiert darauf, dass man damit eigentlich zwei unterschiedliche Methoden meint. Diese basieren zwar auf ähnlicher Logik und liefern auf den ersten Blick sehr ähnliche Ergebnisse, verfolgen aber zwei grundsätzlich verschiedene Ziele:

  • Die Hauptkomponentenanalyse (principal component analysis) dient primär der Datenreduktion. Hier werden Variablen zu Indizes ohne theoretische Bedeutung zusammengefasst. Strenggenommen und im Englischen klar erkennbar handelt es sich nicht um Faktorenanalyse im eigentlichen Sinn. Dies ist die voreingestellte Methode bei Faktorenanalyse SPSS! 
  • Die Hauptachsenanalyse (principal axis factor analysis) und damit verwandte Ansätze haben das Ziel, latente Größen zu erfassen, von deren Existenz man zwar theoretisch ausgeht, die aber nicht direkt abfragbar bzw. messbar sind. Beispiel sind: Intelligenz, Einstellungen, Verhaltensweisen, etc.

Der wichtigste mathematische Unterschied dieser zwei Methoden besteht nun darin, dass die Faktoren der Hauptkomponentenanalyse nicht miteinander korrelieren! Es geht ja gerade darum, möglichst distinkte Indizes zu bilden. Das macht sie allerdings unbrauchbar für Analysen, wenn Faktoren zueinander in Beziehung gesetzt werden.

Konfirmatorische Faktorenanalyse

Diese Unterscheidung erscheint umso wichtiger, weil Hauptkomponentenanalyse sich nur bedingt zur Anwendung im Rahmen einer konfirmatorischen Faktorenanalyse eignet. Bis hierher haben wir uns die Faktorenanalyse als Mittel zur Entdeckung von Strukturen hinter den Daten angeschaut, also ihre explorative Spielart. Die konfirmatorische Faktorenanalyse dagegen wird angewandt, um zuvor aufgestellten Hypothesen zu prüfen.  Diese können sich auf die Anzahl der Faktoren, die Zuordnung der manifesten Items zu den Faktoren oder aber auch auf die Zusammenhänge zwischen den Faktoren beziehen.

Die Unterscheidung zwischen der explorativen und der konfirmatorischen Faktorenanalyse ist zunächst eher eine konzeptionelle als methodische. So könnten wir in unserem Beispiel die Hypothesen aufgestellt haben, dass var1 bis var5 Dimensionen ein und derselben latenten Größe sind. Diese Hypothese hätten wir mit unserer, jetzt konfirmatorischen, Analyse bestätigt.

So lässt sich die Faktorenanalyse auch zum Zwecke einer Reliabilitätsanalyse verwenden, um das Zueinanderpassen von Items zu einer Batterie zu prüfen. Das ist jedoch ein einfaches Beispiel, konfirmatorische Faktorenanalyse lässt sich insbesondere im Rahmen eines Strukturgleichungsmodells deutlich komplexer gestalten. Für entsprechende Analysen existieren passende Tools wie SPSS AMOS.

Fazit

Wer mit sozialwissenschaftlichen Daten arbeitet, wird zwangsläufig mit der Faktorenanalyse in Berührung kommen. Sei es, um die Analysen übersichtlicher zu gestalten oder um theoretisch benötigte Konstrukte zunächst überhaupt berechnen zu können. Die Einstiegsschwelle wird hier oft – unberechtigt – als sehr hoch empfunden. Dieser Beitrag hat jedoch gezeigt, dass auch wenig erfahrene Nutzer die Faktorenanalyse sinnvoll anwenden und interpretieren können, zum Beispiel mit Faktorenanalyse SPSS, sofern sie einige Grundideen berücksichtigen. Gerne unterstützen Sie unsere Experten bei der Umsetzung und Interpretation ihrer Faktorenanalyse. Nähere Infos erhalten Sie bei unserer Statistik-Beratung!

Jetzt Anrufen Jetzt anfragen