Clusteranalyse in SPSS | NOVUSTAT Statistik-Glossar

Im Gegensatz zu den (multivariaten) analytisch-prüfenden Verfahren (Varianzanalyse, Regressionsanalyse, Diskriminanzanalyse) handelt es sich bei der Clusteranalyse um ein exploratives, d.h. strukturentdeckendes, Verfahren.

Für eine Kombination beliebig skalierter Merkmale werden Cluster von merkmalsähnlichen Paarungen gebildet, wobei im Vorfeld keine Beziehung der einzelnen Merkmale festgelegt wird. Konkret geht es um eine Gruppierung von Beobachtungen bzw. Typisierung von Fällen, wobei jedes Objekt eindeutig einem Typus zugeordnet wird. Ziel ist eine Zusammenfassung von Fällen zu Clustern, die zueinander möglichst homogen sind und sich gleichzeitig von anderen Fallclustern unterscheiden.

Im folgenden Artikel wird zunächst das mathematische Konzept vorgestellt, bevor die implementierten Verfahren anhand von Beispielen dargestellt werden.

Sollten Sie Unterstützung bei Ihrer Analyse mit SPSS benötigen, helfen unsere Statistiker Ihnen gerne weiter. Nutzen Sie einfach unser Kontaktformular für eine kostenlose Beratung & ein unverbindliches Angebot – oder rufen Sie uns an.

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.

Jetzt unverbindlich anfragen

Die Clusteranalyse aus mathematischer Sicht

Im Rahmen der Clusteranalyse werden zunächst die Merkmalskombinationen als mehrdimensionaler Quader aufgefasst. Nun werden wahlweise mittels der Bestimmung von Distanz- und Ähnlichkeitsmassen iterativ „naheliegende“ Nachbarn gesucht und so eine Clusterzugehörigkeit definiert – bei grossen Umfragen kann dies schnell unübersichtlich werden, in dem Fall empfiehlt es sich, die Clustereinteilung in einer gesonderten Variablen erfassen zu lassen.
Für metrisch skalierte Merkmale ist der euklidische Abstand die voreingestellte Berechnungsmethode, für ordinal skalierte Merkmale die Rangfunktion.

Jetzt unverbindlich anfragen

Die Clusteranalyse SPSS

Um für die Clusteranalyse SPSS zu nutzen, wird der Pfad: „Analysieren → Klassifizieren“ aufgerufen.

Die einzelnen Verfahren unterscheiden sich in den Skalierungen der Merkmale und darauf aufbauend im jeweils gewählten Skalenniveau.

Hierarchische Clusteranalyse – sie berücksichtigt metrisch (kardinal) skalierte und ordinale Merkmale sowie dichotome Variablen (mit genau zwei Ausprägungen) und ist auch für eine kleine Fallzahl anwendbar
Two-Step Clusteranalyse – sie berücksichtigt Kombinationen metrischer und kategorialer Merkmale und bestimmt Cluster wahlweise anhand der Likelihood-Quotienten (oder der euklidischen Distanz, sofern ausschliesslich metrische Merkmale untersucht werden) für eine hohe Fallzahl. Zudem kann eine feste Anzahl an Cluster voreingestellt werden
Clusterzentrenanalyse (K-Means Clusteranalyse) – sie berücksichtigt Kombinationen metrisch skalierter Merkmale bei hoher Fallzahl und wählt Cluster anhand der Mittelwerte (Distanz vom Clusterzentrum)

Analog zu den Verfahren der Varianzanalyse, Regressions- und Diskriminanzanalyse ist auch für die Clusteranalyse SPSS anwendend eine kritische Bewertung ratsam, d.h. ein stochastisch statistischer Zusammenhang impliziert nicht zwangsläufig einen sachlogisch kausalen Zusammenhang.

So könnten beispielsweise für bestimmte Stichproben die Wähler von Parteien am linken und rechten Rand des demokratischen Spektrums mit Liberalen zusammengefasst werden aufgrund der Tatsache, dass sie ebenso die Einmischung des Staates in wirtschaftliche und kulturelle Abläufe kritisieren, obwohl ihre politische Grundhaltung nicht vereinbar ist.

Eine sinnvolle Möglichkeit zur Visualisierung von Clustern bietet ein Streudiagramm.

Häufig gestellte Fragen

Was ist eine Clusteranalyse in SPSS und wie funktioniert sie?

Eine Clusteranalyse in SPSS ist ein statistisches Verfahren zur Gruppierung von Objekten auf Basis ähnlicher Merkmale. Dabei werden ähnliche Objekte in denselben Cluster gruppiert. Das Ziel ist es, die heterogenen Daten in homogene Gruppen zu unterteilen. SPSS berechnet die Distanzen zwischen den Objekten und ordnet sie in Cluster ein.

Wofür wird die Clusteranalyse in der Forschung verwendet?

Die Clusteranalyse in SPSS wird häufig in der Marktforschung und Sozialwissenschaft eingesetzt. Sie kann auch in der Biologie und Medizin verwendet werden, um Krankheiten zu klassifizieren oder Gene zu gruppieren. In der Wirtschaft wird die Clusteranalyse zur Kundensegmentierung und für die Marktanalyse verwendet.

Welche Arten von Clusteranalyse gibt es in SPSS?

Es gibt zwei Arten von Clusteranalyse in SPSS: die hierarchische Clusteranalyse und die Partitionierungsklusteranalyse. Die hierarchische Clusteranalyse unterteilt die Daten in schrittweise Cluster, während die Partitionierungsklusteranalyse die Daten in vordefinierte Anzahl von Clustern unterteilt.

Was sind die Voraussetzungen für eine erfolgreiche Clusteranalyse in SPSS?

Die Voraussetzungen für eine erfolgreiche Clusteranalyse in SPSS sind:

Die Variablen müssen normalverteilt sein
Die Daten müssen homogen sein
Die Daten sollten keine Ausreisser enthalten

Wie interpretiert man die Ergebnisse einer Clusteranalyse in SPSS?

Die Ergebnisse der Clusteranalyse können grafisch und tabellarisch dargestellt werden. Die Clusterzentren und die Mitglieder jedes Clusters können überprüft werden. Ein grosser Abstand zwischen den Clustern zeigt an, dass sie sehr unterschiedlich sind.

Weiterführende Links:

Mathematische Aufarbeitung der Verfahren, Beispiele in R

Erläuterungen zu Clusteranalyse

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Speichert die Einstellungen der Besucher, die in der Cookie Box von Borlabs Cookie ausgewählt wurden.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Google Analytics
Name	Google Analytics
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google für Website-Analysen. Erzeugt statistische Daten darüber, wie der Besucher die Website nutzt.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Monate

Akzeptieren	Vimeo Statistiken
Name	Vimeo Statistiken
Anbieter	Vimeo.com, Inc.
Zweck	Sammelt Daten über Besuche des Benutzers auf der Website, wie zum Beispiel welche Seiten gelesen wurden.
Datenschutzerklärung	https://vimeo.com/privacy
Host(s)	vimeo.com
Cookie Name	vuid
Cookie Laufzeit	2 Jahre

Akzeptieren	Proven Expert
Name	Proven Expert
Anbieter	Expert Systems AG
Zweck	Sammelt Informationen zum Besucherverhalten auf mehreren Webseiten. Diese Informationen wird auf der Webseite verwendet, um die Relevanz der Werbung zu optimieren.
Datenschutzerklärung	https://www.provenexpert.com/en-us/privacy-policy/
Host(s)	provenexpert.com
Cookie Name	PE_SESSION
Cookie Laufzeit	Session

Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

+49 211 99346512

+41 78 89 11111

+43 720 3035410

Clusteranalyse SPSS

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.

Die Clusteranalyse aus mathematischer Sicht

Brauchen Sie Hilfe?

Die Clusteranalyse SPSS

Häufig gestellte Fragen

Weiterführende Links:

Akzeptieren	Microsoft Bing Ads
Name	Microsoft Bing Ads
Anbieter	Microsoft Corporation
Zweck	Microsoft Bing Ads UET (Universal Event Tracking, Universelle Ereignisnachverfolgung) Tracking-Cookie, der für die zielgerichtete Werbung genutzt wird
Datenschutzerklärung	https://about.ads.microsoft.com/en-us/policies/legal-privacy-and-security
Cookie Name	_uetsid

Akzeptieren	LinkedIn Insight Tag
Name	LinkedIn Insight Tag
Anbieter	LinkedIn Ireland Unlimited Company, Wilton Plaza, Wilton Place, Dublin 2, Irland
Zweck	Cookie von LinkedIn, der zum Erfassen von Nutzerdaten und das Tracking von LinkedIn Ads verwendet wird
Datenschutzerklärung	https://www.linkedin.com/legal/privacy-policy

Akzeptieren	Meta Pixel
Name	Meta Pixel
Anbieter	Meta Platforms Ireland Ltd., 4 Grand Canal Square, Dublin 2, Irland
Zweck	Cookie von Meta, der zum Erfassen von Nutzerdaten und das Tracking von Meta Ads verwendet wird
Datenschutzerklärung	https://www.facebook.com/privacy/policy

Akzeptieren	Facebook
Name	Facebook
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Wird verwendet, um Facebook-Inhalte zu entsperren.
Datenschutzerklärung	https://www.facebook.com/privacy/explanation
Host(s)	.facebook.com