Wir haben bereits mehrmals unterschiedliche Anwendungsmöglichkeiten der Statistikprogramme SPSS, Stata und R präsentiert sowie diese teilweise miteinander verglichen. Mit diesem Beitrag möchten wir diesen Vergleich vertiefen. Dabei werden wir rasch sehen, dass die Frage nach der ‘besten’ Statistiksoftware nicht generell zu beantworten ist. Tatsächlich kommt es stark auf den individuellen Bedarf und die jeweiligen Forschungsziele an, um zu erkennen, welches Statistikprogramm – SPSS, Stata, R – sich am besten eignet.
Sie möchten eine statistische Datenanalyse durchführen und überlegen, welches Statistikprogramm am besten geeignet ist? Wenden sie sich hierzu an uns für eine professionelle Statistik Beratung. Novustat verfügt über ein erfahrenes Team, das Sie bei der Wahl für das passende Statistikprogramm unterstützt: ob SPSS, Stata, R oder ein anderes Programm bzw. Tool.
Kriterien zur Auswahl für ein Statistikprogramm
Alle drei Satistikprogramme SPSS, Stata, R sind für eine Datenanalyse absolut vertrauenswürdig. Jedoch gibt es einige Kriterien, die je nach persönlicher Gewichtung die Wahl der Statistiksoftware unterschiedlich stark beeinflussen.
Funktionsumfang: Bei einem Statistikprogramm wünscht man sich oft einen Funktionsumfang, der möglichst viele Arbeitsschritte von der ersten Datenverarbeitung bis hin zu spezifischen Analysen abdeckt, da ein Wechsel zwischen den Programmen im Rahmen einer Datenanalyse zeitintensiv und umständlich ist.
Bedienung über eine grafische Oberfläche: Die Angabe von Arbeitsbefehlen über eine grafische Oberfläche ist die Vorgehensweise, die man von den meisten modernen Programmen kennt. Bei einem Statistikprogramm wird eine solche Oberfläche meist verwendet, um einen ersten Eindruck über die Daten und die Ergebnisse zu gewinnen. Eine umfangreiche und intuitive Befehlsmaske erleichtert diesen Schritt ungemein.
Bedienung über die Skriptsprache: Bei größeren Vorhaben arbeiten fortgeschrittene Anwender meist ausschließlich mit der Eingabe von Arbeitsbefehlen in der jeweiligen Skriptsprache. Die Vorteile dieser Vorgehensweise sind klar:
- Ein Skript ist gleichzeitig auch die Dokumentation des Arbeitsprozesses.
- Fertige Vorlagen können neu angepasst und damit immer wieder verwendet werden.
- Mögliche Fehler lassen sich im Skript einfach und rasch entdecken.
- Viele Arbeitsschritte, allem voran Datenaufbereitung, lassen sich mit einem Skript deutlich schneller erledigen.
Möglichkeiten des Ergebnisexports: Dieser Punkt wird oftmals unterschätzt. Viele wissenschaftliche Disziplinen und oft sogar einzelne Zeitschriften haben Vorgaben, wie die Tabellen und die Bilder in einer Publikation aussehen sollen. In den Sozialwissenschaften sind die sogenannten APA-Richtlinien sehr gebräuchlich. Die Formatierung ist teilweise sehr zeitaufwendig und es ist sehr hilfreich, wenn die Outputs bereits möglichst den Vorgaben entsprechen.
Datenanalyse mit SPSS: Vorteile und Anwendung
Die Statistiksoftware SPSS genießt neben der Wissenschaft eine große Popularität in der Verwaltung und in der Marktforschung. Demnach ist einer der wesentlichen Vorteile von SPSS der sehr breite Funktionsumfang, der von einfacher deskriptiver Statistik bis zur Berechnung von Strukturgleichungsmodellen – erfolgt mit dem SPSS Plugin AMOS – reicht.
Bei spezifischen Datenanalysen fällt jedoch auf, dass einige Analyseschritte mit SPSS schwer oder gar nicht umzusetzen sind (beispieleweise im Rahmen der Analyse von Interaktionseffekten). SPSS ist grundsätzlich durch sogenannte Makros erweiterbar (das bekannteste Makro ist hier SPSS-PROCESS), deren Auswahl jedoch gering ist.
Man sollte zudem beachten, dass SPSS-Lizenzen sich nach der Funktionszusammenstellung richten. Bei einer einfachen Lizenz fehlen sogar weit verbreitete Verfahren wie die logistische Regression.
Die Anwendung über die grafische Oberfläche ist – als weiterer SPSS Vorteil – die mit Abstand umfangreichste und bequemste. Damit lassen sich im Prinzip alle Arten von Datenanalysen umsetzen. Das Variablenfenster, das nur SPSS hat, erleichtert wesentlich die Datenaufbereitung.
Die Oberfläche ist nicht immer strikt logisch geordnet (siehe dazu auch den Beitrag zu Allgemeines lineares Modell und multivariate Analyse), die Bedienung bleibt jedoch immer sehr übersichtlich.
Die SPSS Anwendung kann auch grundsätzlich über die sogenannte SPSS-Syntax geschehen, die jedoch recht überladen erscheint (d.h. viel Codeaufwand für einen Befehl). Freies Kodieren wird dadurch erschwert. Eine kluge Idee bei SPSS ist allerdings, dass die Syntax-Befehle bei der Verwendung der grafischen Oberfläche mit im Ausgabefenster angezeigt und gespeichert werden und somit immer wieder eine Reproduktion möglich ist.
Das Ausgabefenster von SPSS ist interaktiv, sprich die Tabellen und Bilder lassen sich bearbeiten und kopieren. Einige Voreinstellungen können festgelegt werden, grundsätzlich bietet SPSS jedoch nur begrenzte Möglichkeiten im Rahmen der automatischen Formatierung der Exporte. Allgemein produziert SPSS sehr viel Output mit spezifischen Einzelwerten, was der Übersichtlichkeit nicht immer förderlich ist.
Datenanalyse: SPSS oder Stata
Stata ist ein sehr beliebtes Statistikprogramm bei Biologen sowie bei Sozial- und Wirtschaftswissenschaftlern, die entsprechenden Kenntnisse werden in diesen Bereichen meist vorausgesetzt.
Auch Stata bietet einen sehr breiten Funktionsumfang, aber anders als SPSS beinhaltet jede Stata-Lizenz alle statistischen Funktionen (die Unterschiede in den Lizenzen liegen hier bei der Fallzahlgröße und der Berechnungsgeschwindigkeit). Der große Vorteil von Stata liegt darin, dass es durch eine beachtliche Auswahl von nutzergeschriebenen Plugins (sogenannten ‘ados’) erweiterbar ist.
Stata war früher für sehr rudimentäre grafische Oberflächen bekannt, allerdings wurde dieser Umstand in den neueren Versionen stark verbessert. Dennoch bleibt die Bedienung deutlich weniger benutzerfreundlich als bei SPSS. Es gibt auch einen Variablen-Manager, der aber schwer zu finden ist.
Das Kodieren in den sogenannten do-files mit dem speziellen Stata-Code ist die primäre Bedienmöglichkeit, denn im Vergleich zur SPSS-Syntax ist der Code erstaunlich knapp und effizient. Insgesamt lässt sich der Stata Code sehr gut optimieren, daher eignet sich Stata sehr gut für umfangreiche repetitive Anwendungen.
Der Output von Stata, der in sogenannten log-files gespeichert werden kann, ist allerdings ebenso ziemlich rudimentär, wenngleich lassen mithilfe einiger ados (z.B. esttab) der Export von publikationsfertigen Tabellen in unterschiedlichen Formaten (darunter Latex) gut möglich ist. Auch automatisierte Formatierungsmöglichkeiten von Bildern sind in großem Umfang gegeben.
Datenanalyse: R oder SPSS
Eigentlich handelt es sich bei R nicht um ein Programm, sondern um eine Programmiersprache, mit der die sogenannten R-Pakete geschrieben und bedient werden. Wegen der relativ hohen Einstiegshürden wird R meistens von Nutzern mit bereits vorhandenen Programmierkenntnissen genutzt. In diesem Punkt haben Stata oder SPSS Vorteile.
Allerdings lohnt sich ein Einstieg, denn der Funktionsumfang von R ist gewaltig. Alle Pakete sind ausschließlich von (aktiven) Nutzern geschrieben und viele wissenschaftliche Teams stellen ihre Software und Analysetools der Community kostenlos zur Verfügung. Dadurch kann man mit dem Statistikprogramm R auch sehr spezifische Datenanalysen umsetzen.
Wieso benutzt man also nicht ausschließlich R? Tatsächlich schreckt die Bedienung viele ab. Die vorinstallierte Konsole hat faktisch nur die Eingabestelle für den Code. Es gibt eine Reihe an grafischen Editoren für R, der bekannteste ist wohl R-Studio. Aber auch diese bieten lediglich eine angenehmere Programmierumgebung. R wird meistens nicht über die grafische Oberfläche bedient. Grafische Editoren wie Jamovi haben aktuell noch einen recht begrenzten Funktionsumfang.
Ob R eine bequeme Programmiersprache ist, ist Gegenstand vieler Diskussionen unter den Nutzern. Wichtig ist, dass ihre Logik für jemanden mit (nur) SPSS oder Stata Vorkenntnissen teilweise schwer nachzuvollziehen ist. In R funktioniert alles über Objekte; so kann man mehrere Datensätze als Objekte in eine Umgebung importieren, während man in SPSS oder Stata immer an einem Datensatz arbeitet.
Auch Arbeitszwischenschritte und die Analysefunktionen werden als Objekte hinterlegt. Die Ergebnisse müssen dann über diese Objekte abgerufen werden. Vor allem die Aufbereitung der Daten kann einem nicht geübten Nutzer doch sehr schwer fallen.
Neben dem großen Funktionsumfang wird man dafür mit wunderschönen Ergebnisexporten belohnt. Tabellen lassen sich in unterschiedlichen Formaten mit weitreichender Vorformatierung gestalten. Ein Bonus sind die Abbildungen, sie sehen in R sehr professionell und seriös aus.
SPSS, Stata, R: Statistikprogramm im Vergleich
Fassen wir das Gesagte nun in Tabellenform zusammen, und als ergänzenden Punkt haben wir noch die Kosten für das jeweilige Statistikprogramm hinzugefügt. Diese spielen für Anwender zwar desöfteren keine Rolle, sobald sie den Zugang zur Software über die Lehreinrichtung oder den Arbeitgeber erhalten. Ist man jedoch für die Beschaffung selber verantwortlich, kann es für Wahl des Programms durchaus bedeutsam sein.
Kriterium | SPSS | Stata | R | Vergleich |
Funktionsumfang | groß | groß | sehr groß | Vorteil von R bei spezifischen Fragestellungen |
Bedienung grafische Oberfläche | sehr gut | möglich | begrenzt möglich | Vorteil SPSS |
Bedienung Skriptsprache | umständlich | sehr bequem | bequem, aber Einstieg schwierig | Vorteil Stata |
Exportmöglichkeiten | Nachbereitung nötig | gut | sehr gut | Vorteil R |
Kosten | sehr hoch | hoch | keine | Vorteil R |
Die Tabelle bringt es auf den Punkt, offensichtlich hat jede der drei Anwendungen ihre spezifischen Vor- und Nachteile. Seriöse Datenanalysen lassen sich mit allen drei Anwendungen gut umsetzen. Am Ende entscheiden die Nutzer über die Kriterien, die letztendlich den Ausschlag geben.
Wenn Sie nun Fragen zur Wahl von unterschiedlichen Statistikprogrammen für Ihre Datenanalyse haben oder konkrete Unterstützung bei der Datenanalyse mit SPSS, Stata und R benötigen, nutzen Sie gleich unser schriftliches Kontaktformular für Ihre unverbindliche Anfrage.