Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

In SPSS R richtig nutzen: Wann es Sinn macht und wie es geht!

In diesem Artikel möchten wir Ihnen zeigen, wie Sie vorgehen sollten, wenn Sie in SPSS R nutzen wollen. Die Programmiersprache R hat einen klaren Fokus auf Datenanalyse und Datenvisualisierung. Gewissermaßen steht R als Statistik-Software also in Konkurrenz mit SPSS. Wenn Sie jedoch R in SPSS integrieren, können Sie die Vorteile beider Software-Pakete gleichzeitig nutzen und in SPSS eine vollständige R Auswertung durchführen. In diesem Artikel möchten wir Ihnen dazu einen ersten Überblick geben.

Welche Fragen werden in diesem Artikel beantwortet

  • Welchen Mehrwert bietet die Nutzung von R in SPSS?
  • Wann ist die Verwendung von R in SPSS sinnvoll?
  • Wie installieren Sie R für SPSS?
  • Wie verwenden Sie R in SPSS?

R Statistik: Welche Vorteile bietet die Statistik mit R?

Die Kombination von R und SPSS stellt eine potente Mischung dar, weil sich beide Statistikpakete in ihren Stärken und Schwächen ideal ergänzen:

StärkenSchwächen
SPSS
  • Leicht zu erlernen
  • Bedienkomfort
  • Standardanalysen durch Menüs schnell zu erledigen
  • Einfache Dateneingabe
  • Gute Tools für Datenmanagement
  • Neue statische Verfahren teilweise nicht verfügbar
  • Programmierbarkeit stark eingeschränkt
  • Aufbereitung komplexer Daten mühselig (insbesondere bei Text)
R
  • Neue statische Verfahren fast immer zuerst in R verfügbar
  • Graphen und Analysen bis ins Detail konfigurierbar
  • Ermöglicht automatisierte Aufbereitung komplexer Daten (insbesondere für Text)
  • Langsamere Lernkurve
  • Einfache Analysen verhältnismäßig umständlich
  • Dateneingabe und Datenmanagement mühselig

SPSS und R ergänzen sich ideal

Wie Sie sehen, gibt es gute Argumente SPSS gegenüber R vorzuziehen; insbesondere in Sachen Datenmanagement kann R einfach nicht den gleichen Komfort bieten. Allerdings hat SPSS auch punktuelle Schwächen und gerade hier macht der Einsatz von R oft Sinn. So könnten z.B. manche Projekte von Verfahren profitieren die in SPSS (noch) nicht verfügbar sind, in R aber bereits unterstützt werden.

Wenn Sie noch keine Erfahrung mit R-Programmierung haben, sollte Sie das nicht abschrecken! Wenn Sie in SPSS R nur punktuelle für spezielle Aufgaben benötigen, verringert sich der zu erlernende R-Code nämlich um ein Vielfaches.

Programmiersprache R in SPSS: Was Sie unbedingt brauchen

Bevor Sie Verfahren der Statistik mit R anwenden können, müssen Sie Plugin installieren um in SPSS R nutzen zu können. Unserer Schritt-für-Schritt-Anleitung unterstützt Sie dabei.

R installieren

Je nachdem welche Version von SPSS Sie besitzen, benötigen Sie auch eine andere Version von R. In der folgenden Tabelle haben wir für Sie die Downloads der Windows-Version bereits verlinkt.

SPSS VersionBenötigte R Version
SPSS 25R 3.3
SPSS 24R 3.2
SPSS 23R 3.1
SPSS 22R 2.15
SPSS 21R 2.14 (32 bit)
SPSS 20R 2.12 (32 bit)
SPSS 19R 2.10
SPSS 18R 2.8

Die benötigte R Version unterscheidet sich je nach SPSS Version

Essentials for R installieren

Um nun auch in SPSS R nutzen zu können benötigen sie noch das Plugin „Essentials for R“. Auch hier unterscheidet sich die Installation je nach SPSS Version:

SPSS 25 

Öffnen Sie den Erweiterungshub in SPSS (unter Erweiterungen)

Suchen Sie nach „STATS_R33_CONFIGURATION“

Setzen Sie den Haken bei „Erweiterung abrufen“ und klicken Sie auf OK

Nach dem Download starten Sie das Konfigurationstool für R3.3 (zu finden unter Erweiterungen)

Setzen Sie das korrekte Verzeichnis für Ihre R 3.3 Installation und klicken Sie auf OK

Standardverzeichnis für Windows: C:\Program Files\R\R-3.3.x(dabei das x mit ihrer letzten Versionsnummer ersetzen)

SPSS 19-24                                           

Den Installer finden Sie im Download-Bereich der IBM Webseite

Suchen Sie auf der Seite nach dem Eintrag mit dem Titel „IBM SPSS Statistics Version [ihre Version] – Essentials for R“ (also z.B. IBM SPSS Statistics Version 24 – Essentials for R) für SPSS Version 24.

Die Installation von Essentials for R in SPSS 25 unterscheidet sich von vorherigen Versionen

 

Erweiterungshub für R in SPSS
Erweiterungshub

 

In SPSS R nutzen: via Plugin
Das R Plugin für SPSS 25 finden Sie hier

Wie Sie in SPSS R richtig nutzen

Ähnlich wie bei der Verwendung von Python in SPSS, schreiben Sie Ihren R-Code einfach innerhalb Ihrer SPSS Syntax. Beginn und Ende von R-Code wird in der SPSS Syntax mit den Befehlen BEGIN PROGRAM R und END PROGRAM markiert. Der Code zwischen diesen Befehlen wird als Code interpretiert der Programmiersprache R interpretiert.

In SPSS R nutzen: Programmiersprache R in SPSS Syntax Editor
Beispiel für R-Codeblocks in SPSS Syntax

SPSS Daten in R einlesen

Für gewöhnlich werden Sie R in SPSS aufrufen, um Daten aus SPSS einzulesen und mit R Statistik-Analysen durchzuführen. Essentials for R beinhaltet für das Einlesen von Daten die nützliche R-Funktion spssdata.GetDataFromSPSS(). Diese Funktion liest die Daten direkt aus dem momentan geöffneten Datensatz ein und speichert es als R Datenframe. Diese Funktion unterstütz zahlreiche Argumente (eine Dokumentation finden Sie hier), besonders häufig werden Sie aber vermutlich „rDate“ für das einlesen von Datumsvariablen und „factorMode“ für das einlesen kategorialer Variablen verwenden. Im folgenden Beispiel sehen Sie, wie sie mit dieser Funktion in SPSS R zum Einlesen von Daten verwenden können:

BEGIN PROGRAM R.
# Daten abrufen und in Datenframe abspeichern
# Wenn Ihr Datensatz Datumsvariablen enthält, verwenden Sie das Argument rDate
# Wenn Ihr Datensatz kategoriale Variablen enthält, verwenden Sie das Argument factorMode
# Stellen Sie vorher sicher, dass Ihre Variablen und Kategorien in SPSS korrekt definiert und beschriftet sind!
meineDaten = spssdata.GetDataFromSPSS(rDate="POSIXct", factorMode="labels")
# Daten ausgeben
print(meineDaten)
# Variablen-Typ ausgeben
lapply(meineDaten, class)
END PROGRAM.

 

In SPSS R nutzen: mit R eingelesener Datensatz
Beispiel-Ausgabe für einen mit R eingelesenen Datensatz

Statistik mit R in SPSS: Ein Anwendungsbeispiel

Im Folgenden möchten wir Ihnen anhand eines Beispiels zeigen wie sie R sinnvoll in SPSS anwenden. In diesem Beispiel verwenden wir Daten vom United States Census Bureau über die Verbrechensrate in amerikanischen Staaten per 100.000 Einwohner (crime) und dem Prozentsatz der Bevölkerung unter der Armutsgrenze (poverty).

Beispieldatensatz aus SPSS für R Auswertung
Ausschnitt aus dem Beispieldatensatz

Um den Einfluss von. Ausreißern auf unser Modell zu minimieren möchten wir eine robuste Regressionsanalyse durchführen. Dieses Verfahren ist in SPSS eigentlich nicht verfügbar, in Kombination mit R allerdings schon:

BEGIN PROGRAM R.
# install.packages("quantreg") # Benötigt unter Umständen eine Installation von quantreg
library("quantreg")
library("MASS")
# Daten abrufen und in Datenframe abspeichern
meineDaten = spssdata.GetDataFromSPSS()
# Lineare Regression
fm.lm <- lm(crime ~ poverty, data=meineDaten)
# Quantile Regression
fm.rq <- rq(crime ~ poverty, data=meineDaten)
# Iterative Gewichtung der kleinsten-Quadrate
fm.rlm <- rlm(crime ~ poverty, data=meineDaten)
# Koeffizenten der verschiedenen Modelle
print("LINEARE REGRESSION")
coef(summary(fm.orig))
print("QUANTILE REGRESSION")
coef(summary(fm.rq))
print("ITERATIVE GEWICHTUNG DER KLEINSTEN-QUADRATE")
coef(summary(fm.rlm))
plot(crime ~ poverty, data=meineDaten)
# Vergleichende Grafik
abline(fm.orig)
abline(fm.rq, col="red")
abline(fm.rlm, col="blue")
legend("topright", inset=0.05, bty="n",
legend = c("Lineare Reg", "Quantile Reg", "Iterative Gew. d. kl. Quadrate"),
lty = c(1),
col = c("black", "red", "blue")
)
END PROGRAM.

 

SPSS Output: R Koeffizienten für die lineare Regression
Regressionskoeffizienten für lineare und robuste Regression
R Regressionslinie für lineare Regression aus SPSS
Regressionslinien für lineare und robuste Regression

Wie Sie an der Grafik deutlich sehen können, kann eine robuste Regression den Einfluss von Ausreißern deutlich verringern.

Zusammenfassung

In diesem Artikel haben wir Ihnen einen Überblick über die Verwendung von Statistik mit R in SPSS gegeben. Wir haben Ihnen eine Anleitung für die Installation der R Plugins für SPSS gegeben und mithilfe eines Anwendungsbeispiels gezeigt wie Sie auch mit geringen Aufwand mit R Statistik-Verfahren nutzen die in SPSS noch gar nicht implementiert sind.

Der Einsatz von R lohnt sich oft bei komplexen Forschungsdesigns oder bei problematischen Datenlagen. Wenn Sie hierbei Beratung wünschen stehen wir Ihnen bei Novustat gerne zur Seite. Unsere Experten von Novustat können für Ihre Analyse neue, maßgeschneiderte Funktionen in R programmieren, die Sie dann auch in SPSS einsetzen können. So können Sie den maximalen Erkenntnisgewinn auch aus komplexen Datenmengen ziehen.

Weiterführende Links:

[1] https://www.ibm.com/developerworks/library/ba-call-r-spss/

[2] How to use R in SPSS – IBM Manual

[3] https://www.uni-trier.de/fileadmin/urt/doku/r4spss/R4SPSS.pdf