Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

SPSS Dateneingabe im Long-Format: Wie Sie es richtig einsetzen

In diesem Artikel möchten wir Ihnen die verschiedenen Alternativen hinsichtlich des Formats für die SPSS Dateneingabe aufzeigen, die sich Ihnen bei der Fragebogenauswertung bieten, und wie Sie Daten von Excel in SPSS importieren können. Dazu erläutern wir Ihnen zuerst die Grundlagen und geben Ihnen anschließend eine Schritt-für-Schritt Anleitung an einem veranschaulichenden Beispiel.

Die Umfrage ist abgeschlossen und die Versuche sind durchgeführt. Der nächste Schritt besteht nun in der SPSS Dateneingabe. Meistens werden statt einer Dateneingabe SPSS die Daten jedoch zunächst in eine Excel-Tabelle eingetippt, weil Excel die bekannteste Software für den Umgang mit Daten ist und keine speziellen Kenntnisse erfordert. Excel bietet sogar die Möglichkeit, einige grundlegende statistische Verfahren auszuführen. Doch für die professionelle Datenanalyse ist spezialisierte Statistik-Software wie R oder SPSS deutlich besser geeignet. Zum Glück können Sie in R und SPSS ganz einfach Excel Daten importieren.

Daten von Excel in SPSS oder R importieren

Bevor Sie Ihre Daten aus Excel in SPSS oder R importieren, sollten Sie zunächst Ihre Excel-Datei überprüfen. Die erste Zeile sollte die Variablennamen in gültiger SPSS-Syntax enthalten. Es empfiehlt sich zudem, auf Umlaute sowie „ß“ zu verzichten. Bei der Dateneingabe SPSS werden die Variablen üblicherweise mit Zahlen codiert, beispielsweise das Geschlecht mit den Zahlen 1 und 2. Sie können die Variablen später immer noch mit „weiblich“ und „männlich“ beschriften. Die Excel-Datei sollte nur den reinen Datensatz ohne Anmerkungen, Berechnungen oder Diagramme enthalten, sonst können Sie nicht in SPSS Daten importieren. Zudem sollte nach Möglichkeit die Datenbereinigung schon vorher abgeschlossen werden.

Sowohl in SPSS als auch in R (mit RStudio) können Sie Daten über eine grafische Benutzeroberfläche importieren. In RStudio wählen sie dazu im Fenster oben rechts das Menü „Import Dataset“ und anschließend „From Excel…“. Eventuell wird vorher das für den Import benötigte Paket installiert. In SPSS wählen Sie „Datei –> öffnen“ und ändern den Datentyp auf „Excel“. Anschließend wählen Sie die Excel-Datei im passenden Verzeichnis aus.

Wide-Format oder Long-Format für die SPSS Dateneingabe?

Transformation vom Long Format in das Wide Format

Bei der SPSS Dateneingabe stellt sich die Frage, in welchem Format man die Daten haben möchte, im klassischen Wide-Format oder doch eher im Long-Format? In diesem Abschnitt erklären wir Ihnen die Eigenschaften und Besonderheiten dieser beiden Formate.

Das Wide-Format und das Long-Format (manchmal auch ungestapelt und gestapelt genannt) sind Begriffe, welche verwendet werden, um zwei verschiedene Darstellungen von Tabellendaten zu beschreiben.

Die gebräuchlichere Darstellungsmethode der beiden ist das Wide-Format, in welchem jede Spalte eine Variable repräsentiert. Messwiederholte Variablen erhalten pro Zeitpunkt jeweils eine eigene Spalte. Diese intuitive Darstellungsweise ist übersichtlich, wird jedoch nicht von allen statistischen Verfahren unterstützt.

Im Long-Format werden die gesamten Werte der messwiederholten Variable in einer einzigen Spalte dargestellt. Daher werden die Daten im Long-Format auch als “gestapelt” bezeichnet. Die zu den Messwerten gehörenden Zeitpunkte werden in einer separaten Spalte notiert. Im Fall einer nicht messwiederholten Variable enthält diese Spalte stattdessen den Kontext der Werte.

Im Allgemeinen hat das Wide-Format mehr Spalten als das Long-Format, welches dafür mehr Zeilen besitzt. Die Darstellung im Wide-Format ist übersichtlicher, insbesondere wenn viele messwiederholte Variablen vorliegen. Die Anzahl der Spalten bleibt meistens noch überschaubar. Außerdem befinden sich alle Variablen einer Untersuchungseinheit in derselben Zeile, wodurch man leichter Unstimmigkeiten und fehlende Daten entdeckt. Man vergisst bei der Dateneingabe in den Computer auch nicht so leicht Daten. Dagegen enthält die Datenmatrix im Long-Format oft besonders viele Zeilen, was dieses Format weniger leserlich macht.

Wir empfehlen Ihnen also, die Daten im Wide-Format einzugeben, bevor sie die Excel Daten importieren. Wenn Sie in SPSS Daten importieren, können Sie diese ins Long-Format transformieren. Es besteht also kein Grund dafür, die Daten gleich im Long-Format abzutippen. Im folgenden Abschnitt erzeugen wir anhand eines fiktiven Beispiels mit der Statistik-Software R Daten im Wide-Format, um sie anschließend ins Long-Format zu transformieren.

Vom Wide-Format zum Long-Format

Ein Ernährungswissenschaftler möchte eine neue Diätmethode testen. Hierfür nehmen 10 übergewichtige Personen, davon 5 Frauen und 5 Männer, an einer Studie teil. Die Probanden werden unmittelbar vor Beginn (Gewicht.1) und nach Ende (Gewicht.2) der Diät gewogen, um eine Gewichtsreduktion durch die Diät feststellen zu können. Außerdem wird das Gewicht ein Jahr später (Gewicht.3) erneut gemessen, um den langfristigen Erfolg der Diät zu überprüfen. Das Gewicht erscheint als messwiederholte Variable in mehreren Spalten im Gegensatz zum Geschlecht, welches bei jedem Probanden nur einmal gemessen wird.

# R-Programm-Code zur Erstellung des Datensatzes im Wide-Format und Export zu Latex:
library ( xtable ) # optional; braucht man nur für Latex bzw. Lyx!
set.seed ( 42 )
datensatz.wide = data.frame(Probandennummer=1:10,Geschlecht=c(rep(“w”,5),rep(“m”,5)) ,
Gewicht.1 = rnorm(10,150,10),Gewicht.2=rnorm(10,140,10),Gewicht.3=rnorm(10,135,10) )
View ( datensatz.wide )
xtable ( datensatz.wide,caption=”Wide-Format”,digits=1,align=c(“c|”,”c”,”c”,”c”,”c”,”c”) )

SPSS Dateneingabe im Wide Format

So anschaulich das wide-Format auch ist, manche statistischen Verfahren wie zum Beispiel die Varianzanalyse mit Messwiederholung aus dem R-Paket ez benötigen eine Darstellung im Long-Format. Im Wide-Format wird für jeden Zeitpunkt einer messwiederholten Variable eine eigene Spalte im Datensatz angelegt. Dagegen werden im Long-Format sämtliche Messwerte des Gewichts für die drei Zeitpunkte in einer einzigen Spalte untergebracht. Damit die Information über den Zeitpunkt nicht verloren geht, wird entsprechend eine neue Variable erstellt.

SPSS Dateneingabe im Long Format

# R-Programm-Code zur Transformation vom Wide -ins Long-Format und Export zu Latex:
datensatz.long = reshape ( datensatz.wide , idvar = ”Probandennummer” ,
varying = c(“Gewicht.1″,”Gewicht.2”,“Gewicht.3″), v.names = „Gewicht“ ,
timevar = ”Zeitpunkt” , sep = ”.” , direction = ”long” )
View ( datensatz.long )
xtable ( datensatz.long,caption=”Long-Format”,digits=1,align=c(“c|”,”c”,”c”,”c”,”c”) )

Die Transformation vom Wide- ins Long-Format geschieht in R mit dem reshape-Befehl. Das erste Argument der Funktion ist der zu umstruktierende Datensatz, in diesem Fall datensatz.wide. Idvar ist die Variable, welche die Probanden eindeutig kennzeichnet, in diesem Fall mit den Nummern 1 bis 10. varying gibt die messwiederholte Variable Gewicht inklusive der Bezeichnung für den Zeitpunkt an. Der Messzeitpunkt ist von der Variablenbezeichnung durch einen Punkt getrennt, sodass sich die drei einzelnen Variablen im Wide-Format als Vektor c(“Gewicht.1″,”Gewicht.2″,”Gewicht.3”) ergeben. Weil in diesem Fall ein Punkt zur Trennung verwendet wurde, wird das im Argument sep = ”.” notiert. Bei einem Leerzeichen wie bei Gewicht1 würde man stattdessen sep = ”” schreiben. Die messwiederholte Variablenbezeichnung ohne Messzeitpunkt wird bei v.names eingetragen. Im Long-Format wird eine neue Variable erstellt, damit eindeutig ist, zu welchem Zeitpunkt die messwiederholte Variable gemessen wurde. Eine Variablenbezeichnung hierfür kann unter timevar vergeben werden. Schließlich wird noch mit direction die Richtung der Transformation angegeben, in diesem Fall in ein Long-Format.

Zusammenfassung: Das Long-Format richtig einsetzen

Wir hoffen, dass Ihnen unser Artikel die Themen Dateneingabe und das Prinzip des Wide-Formats näher bringen konnte. Nachdem wir zu Beginn des Artikels die SPSS Dateneingabe beschrieben und die Vorteile und Nachteile der beiden Formate hervorgehoben haben, sollten Sie nun auf Basis unserer Ausführungen in R oder SPSS Excel Daten importieren und im Wide-Format in SPSS Daten importieren können. Weiterhin sollten Sie auf Basis unserer obigen Anleitung fähig sein, nach dem Import von Excel in SPSS bzw. R oder nach der Dateneingabe SPSS dazu zu nutzen, die Daten vom Wide- ins Long-Format zu bringen. Dieses eignet sich besonders für die Analyse von Zeitverläufen oder beispielsweise für die Überprüfung der Mitarbeiterentwicklung im Rahmen einer kontinuierlichen Mitarbeiterbefragung. Für weitere Fragen oder ein tiefergehende Beratung zu diesem Thema stehen Ihnen die professionellen Statistiker von Novustat Ihnen jederzeit zur Verfügung.

Weiterführende Links

[1] http://data.library.virginia.edu/reshaping-data-from-wide-to-long/

[2] http://statistik-dresden.de/archives/2366