In diesem Artikel möchten wir Ihnen zeigen, wie Sie vorgehen sollten, wenn Sie in SPSS R nutzen wollen. Die Programmiersprache R hat einen klaren Fokus auf Datenanalyse und Datenvisualisierung. Gewissermaßen steht R als Statistik-Software also in Konkurrenz mit SPSS. Wenn Sie jedoch R in SPSS integrieren, können Sie die Vorteile beider Software-Pakete gleichzeitig nutzen und in SPSS eine vollständige R Auswertung durchführen. In diesem Artikel möchten wir Ihnen dazu einen ersten Überblick geben.
Welche Fragen werden in diesem Artikel beantwortet
- Welchen Mehrwert bietet die Nutzung von R in SPSS?
- Wann ist die Verwendung von R in SPSS sinnvoll?
- Wie installieren Sie R für SPSS?
- Wie verwenden Sie R in SPSS?
R Statistik: Welche Vorteile bietet die Statistik mit R?
Die Kombination von R und SPSS stellt eine potente Mischung dar, weil sich beide Statistikpakete in ihren Stärken und Schwächen ideal ergänzen:
Stärken | Schwächen | |
SPSS |
|
|
R |
|
|
SPSS und R ergänzen sich ideal
Wie Sie sehen, gibt es gute Argumente SPSS gegenüber R vorzuziehen; insbesondere in Sachen Datenmanagement kann R einfach nicht den gleichen Komfort bieten. Allerdings hat SPSS auch punktuelle Schwächen und gerade hier macht der Einsatz von R oft Sinn. So könnten z.B. manche Projekte von Verfahren profitieren die in SPSS (noch) nicht verfügbar sind, in R aber bereits unterstützt werden.
Wenn Sie noch keine Erfahrung mit R-Programmierung haben, sollte Sie das nicht abschrecken! Wenn Sie in SPSS R nur punktuelle für spezielle Aufgaben benötigen, verringert sich der zu erlernende R-Code nämlich um ein Vielfaches.
Programmiersprache R in SPSS: Was Sie unbedingt brauchen
Bevor Sie Verfahren der Statistik mit R anwenden können, müssen Sie Plugin installieren um in SPSS R nutzen zu können. Unserer Schritt-für-Schritt-Anleitung unterstützt Sie dabei.
R installieren
Je nachdem welche Version von SPSS Sie besitzen, benötigen Sie auch eine andere Version von R. In der folgenden Tabelle haben wir für Sie die Downloads der Windows-Version bereits verlinkt.
SPSS Version | Benötigte R Version |
SPSS 25 | R 3.3 |
SPSS 24 | R 3.2 |
SPSS 23 | R 3.1 |
SPSS 22 | R 2.15 |
SPSS 21 | R 2.14 (32 bit) |
SPSS 20 | R 2.12 (32 bit) |
SPSS 19 | R 2.10 |
SPSS 18 | R 2.8 |
Die benötigte R Version unterscheidet sich je nach SPSS Version
Essentials for R installieren
Um nun auch in SPSS R nutzen zu können benötigen sie noch das Plugin „Essentials for R“. Auch hier unterscheidet sich die Installation je nach SPSS Version:
SPSS 25 | Öffnen Sie den Erweiterungshub in SPSS (unter Erweiterungen)
Suchen Sie nach „STATS_R33_CONFIGURATION“ Setzen Sie den Haken bei „Erweiterung abrufen“ und klicken Sie auf OK Nach dem Download starten Sie das Konfigurationstool für R3.3 (zu finden unter Erweiterungen) Setzen Sie das korrekte Verzeichnis für Ihre R 3.3 Installation und klicken Sie auf OK Standardverzeichnis für Windows: C:\Program Files\R\R-3.3.x(dabei das x mit ihrer letzten Versionsnummer ersetzen) |
SPSS 19-24 | Den Installer finden Sie im Download-Bereich der IBM Webseite
Suchen Sie auf der Seite nach dem Eintrag mit dem Titel „IBM SPSS Statistics Version [ihre Version] – Essentials for R“ (also z.B. IBM SPSS Statistics Version 24 – Essentials for R) für SPSS Version 24. |
Die Installation von Essentials for R in SPSS 25 unterscheidet sich von vorherigen Versionen
Wie Sie in SPSS R richtig nutzen
Ähnlich wie bei der Verwendung von Python in SPSS, schreiben Sie Ihren R-Code einfach innerhalb Ihrer SPSS Syntax. Beginn und Ende von R-Code wird in der SPSS Syntax mit den Befehlen BEGIN PROGRAM R und END PROGRAM markiert. Der Code zwischen diesen Befehlen wird als Code interpretiert der Programmiersprache R interpretiert.
SPSS Daten in R einlesen
Für gewöhnlich werden Sie R in SPSS aufrufen, um Daten aus SPSS einzulesen und mit R Statistik-Analysen durchzuführen. Essentials for R beinhaltet für das Einlesen von Daten die nützliche R-Funktion spssdata.GetDataFromSPSS(). Diese Funktion liest die Daten direkt aus dem momentan geöffneten Datensatz ein und speichert es als R Datenframe. Diese Funktion unterstütz zahlreiche Argumente (eine Dokumentation finden Sie hier), besonders häufig werden Sie aber vermutlich „rDate“ für das einlesen von Datumsvariablen und „factorMode“ für das einlesen kategorialer Variablen verwenden. Im folgenden Beispiel sehen Sie, wie sie mit dieser Funktion in SPSS R zum Einlesen von Daten verwenden können:
BEGIN PROGRAM R.
# Daten abrufen und in Datenframe abspeichern
# Wenn Ihr Datensatz Datumsvariablen enthält, verwenden Sie das Argument rDate
# Wenn Ihr Datensatz kategoriale Variablen enthält, verwenden Sie das Argument factorMode
# Stellen Sie vorher sicher, dass Ihre Variablen und Kategorien in SPSS korrekt definiert und beschriftet sind!
meineDaten = spssdata.GetDataFromSPSS(rDate="POSIXct", factorMode="labels")
# Daten ausgeben
print(meineDaten)
# Variablen-Typ ausgeben
lapply(meineDaten, class)
END PROGRAM.
Statistik mit R in SPSS: Ein Anwendungsbeispiel
Im Folgenden möchten wir Ihnen anhand eines Beispiels zeigen wie sie R sinnvoll in SPSS anwenden. In diesem Beispiel verwenden wir Daten vom United States Census Bureau über die Verbrechensrate in amerikanischen Staaten per 100.000 Einwohner (crime) und dem Prozentsatz der Bevölkerung unter der Armutsgrenze (poverty).
Um den Einfluss von. Ausreißern auf unser Modell zu minimieren möchten wir eine robuste Regressionsanalyse durchführen. Dieses Verfahren ist in SPSS eigentlich nicht verfügbar, in Kombination mit R allerdings schon:
BEGIN PROGRAM R.
# install.packages("quantreg") # Benötigt unter Umständen eine Installation von quantreg
library("quantreg")
library("MASS")
# Daten abrufen und in Datenframe abspeichern
meineDaten = spssdata.GetDataFromSPSS()
# Lineare Regression
fm.lm <- lm(crime ~ poverty, data=meineDaten)
# Quantile Regression
fm.rq <- rq(crime ~ poverty, data=meineDaten)
# Iterative Gewichtung der kleinsten-Quadrate
fm.rlm <- rlm(crime ~ poverty, data=meineDaten)
# Koeffizenten der verschiedenen Modelle
print("LINEARE REGRESSION")
coef(summary(fm.orig))
print("QUANTILE REGRESSION")
coef(summary(fm.rq))
print("ITERATIVE GEWICHTUNG DER KLEINSTEN-QUADRATE")
coef(summary(fm.rlm))
plot(crime ~ poverty, data=meineDaten)
# Vergleichende Grafik
abline(fm.orig)
abline(fm.rq, col="red")
abline(fm.rlm, col="blue")
legend("topright", inset=0.05, bty="n",
legend = c("Lineare Reg", "Quantile Reg", "Iterative Gew. d. kl. Quadrate"),
lty = c(1),
col = c("black", "red", "blue")
)
END PROGRAM.
Wie Sie an der Grafik deutlich sehen können, kann eine robuste Regression den Einfluss von Ausreißern deutlich verringern.
Zusammenfassung
In diesem Artikel haben wir Ihnen einen Überblick über die Verwendung von Statistik mit R in SPSS gegeben. Wir haben Ihnen eine Anleitung für die Installation der R Plugins für SPSS gegeben und mithilfe eines Anwendungsbeispiels gezeigt wie Sie auch mit geringen Aufwand mit R Statistik-Verfahren nutzen die in SPSS noch gar nicht implementiert sind.
Der Einsatz von R lohnt sich oft bei komplexen Forschungsdesigns oder bei problematischen Datenlagen. Wenn Sie hierbei Beratung wünschen stehen wir Ihnen bei Novustat gerne zur Seite. Unsere Experten von Novustat können für Ihre Analyse neue, maßgeschneiderte Funktionen in R programmieren, die Sie dann auch in SPSS einsetzen können. So können Sie den maximalen Erkenntnisgewinn auch aus komplexen Datenmengen ziehen.
Weiterführende Links:
[1] https://developer.ibm.com/tutorials/ba-call-r-spss/
[2] How to use R in SPSS – IBM Manual
[3] https://www.uni-trier.de/fileadmin/urt/doku/r4spss/R4SPSS.pdf