Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

SPSS Daten importieren: 7 Schritte für eine gelungene Datenaufbereitung

In diesem Artikel wollen wir Ihnen eine Schritt-für-Schritt Anleitung für die Aufbereitung von Daten in SPSS an die Hand geben und Ihnen zeigen, wie Sie richtig SPSS Daten importieren. Datenaufbereitung ist der Grundbaustein für erfolgreiches Datenmanagement und daher essentiell für die Datenqualität und folglich auch jede Auswertung von Fragebögen. Und jede Analyse ist nur so gut wie die Qualität Ihrer Daten! Eine gründliche Datenaufbereitung kostet zwar anfangs ein wenig Aufwand, dafür sparen Sie aber später ein vielfaches der investierten Zeit.

Richtige Datenaufbereitung für die Auswertung von Fragebögen

Im Wesentlichen lässt sich die Datenaufbereitung in sieben Schritte unterteilen, die im Folgenden näher besprochen werden.

Übersicht Datenaufbereitung
Übersicht der Schritte für die Datenaufbereitung

 

Schritt 1: In SPSS Daten importieren – das richtige Dateiformat entscheidet

Als ersten Schritt müssen Sie Ihre Daten in SPSS importieren. Die folgenden Hinweise sollen Ihnen dabei helfen mögliche Probleme wie fehlerhafte Variablenname oder falsche Werte zu vermeiden. Verschiedene Dateiformate haben dabei unterschiedliche Vor- und Nachteile. Auch sollten Sie bereits von Anfang an darauf achten, ob Sie die Daten im Wide- oder Long-Format darstellen möchten.

DateiformatVorteileNachteile
SPSS-Format (.sav)Einfach zu importierenMöglicherweise Fehler bei der Formatierung, wenn automatisch erstellt
Excel (.xlsx oder .xls)Problemlose Dateneingabe und Korrektur in ExcelImport von komplexen Datensätzen kann zu Problemen bei Formatierung und Erkennung von Datentypen führen
Textdatei (.csv oder .txt)Für erfahrene Benutzer erlaubt dies die vollständigste Kontrolle über den DatenimportInspektion und Import der Daten verhältnismäßig umständlich

 

Liegen die Daten bereits im SPSS-Format vor (.sav) gestaltet sich das Importieren der Daten denkbar einfach.

In SPSS Daten importieren: SPSS-Format
Einlesen von Daten im SPSS-Format (.sav)

 

Aber auch wenn Sie SPSS Daten importieren, sollten diese stets auf Fehler geprüft werden. Dies gilt insbesondere für die Auswertung von Fragebögen, denn manche Plattformen für Online-Umfragen neigen beim Export in das SPSS-Format zu Fehlern.

Liegen Ihre Daten im Excel-Format vor (.xlsx oder .xls) gestaltet sich der Import meist ebenfalls problemlos. Allerdings sollten Sie die Datei vorher in Excel inspizieren um potentielle Probleme zu vermeiden. Achten Sie dabei darauf, dass die erste Zeile die Namen der Variablen enthält und diese keine Sonderzeichen oder Umlaute enthalten. Überprüfen Sie auch, ob die Daten direkt auf der zweiten Zeile beginnen. Erfüllt die Datei diese Kriterien, können Sie die Daten in SPSS importieren (Unterpunkt „Datei -> Datei importieren-> Excel“).

Importieren von Daten im Excel-Format (.xlsx oder .xls)
In SPSS Daten importieren: Excel-Daten

 

Möchten Sie in SPSS Daten importieren, die im Textformat vorliegen (.txt oder .csv), benötigt dies etwas mehr Sorgfalt. Zuerst sollten Sie die Datei in einem Texteditor prüfen. Notieren Sie sich dabei folgende Punkte:

  • Befinden sich die Namen der Variablen in der ersten Zeile?
  • Ist die Dezimalstelle ein Punkt oder Komma?
  • Wie sind die Einträge abgetrennt?Übliche Trennzeichen sind Semikolon oder Komma, aber auch Punkt, Leerzeichen oder Tabstopp ist möglich
In SPSS Daten importieren: CSV-Daten
In diesem Beispiel befinden sich die Variablennamen in der ersten Zeile. Das Dezimalzeichen ist ein Punkt und das Trennzeichen ist ein Semikolon.

 

Nach diesem Schritt geht das importieren der Daten meist leicht von der Hand. Wählen Sie dazu in SPSS „Datei -> Datei importieren“ und dann je nach Endung „CSV-Daten“ (für .csv) oder „Textdaten“ (für .txt).

In SPSS Daten importieren: Text-Daten
Importieren von Daten im Text-Format (.csv oder .txt)

 

Sie können nun die SPSS Daten importieren, indem Sie von SPSS durch die folgenden Schritte geführt werden, die mithilfe Ihrer Notizen kein Problem darstellen sollten.

Schritt 2: Variablen umbenennen und Beschriftungen anlegen

Der nächste Schritt der Datenaufbereitung ist das Benennen und Beschriften Ihrer Variablen. Klar benannte Variablen verhindert Verwirrung beim Auffinden von Variablen und erleichtert das spätere Datenmanagement. SPSS bietet zwei Möglichkeiten Variablen zu identifizieren:

NameEin möglichst kurzer und bündiger Name sollte eine Variable eindeutig identifizieren.
BeschriftungMit der Beschreibung können Sie die Variable vollständig beschreiben. Eine eindeutige Beschreibung von Variablen ist wichtig, damit Sie und andere sich schnell im Datensatz zurechtfinden. Für die Auswertung von Fragebögen können Sie hier häufig die Frage im Wortlaut oder eine sinngemäße Zusammenfassung verwenden.

SPSS Variablennamen codiert

SPSS Variablen Klarnamen
Eindeutige Namen machen das Auffinden relevanter Variablen einfacher

 

Zur Bearbeitung der Namen und Beschriftungen Ihrer Variablen schalten Sie auf die Variablensicht (Schaltfläche unten links). Namen und Beschriftung der Variablen können Sie dann mit Klick auf die jeweiligen Spalten bearbeiten.

SPSS Variablenansicht
Schaltfläche zur Variablenansicht

 

SPSS Datenaufbereitung in der Variablenansicht
Variablen benennen und beschriften Sie in der Variablenansicht

 

Schritt 3: Fehlende Werte definieren

Ein nächster wichtiger Schritt bei der Datenaufbereitung und Datenbereinigung ist der Umgang mit fehlenden Werten. SPSS kennt zwei Arten von fehlenden Werten:

  • Systembedingt fehlenden Werte: Dies sind „leere“ Datenfelder in Ihrem Datensatz und werden von SPSS automatisch als fehlende Werte erkannt.
  • Benutzerdefinierten fehlenden Werte: Fehlende Werte die durch einen numerischen Code gekennzeichnet sind (z.B. „-99“)

Benutzerdefinierte Werte sind bei der Auswertung von Fragebögen z.B. dann sinnvoll, wenn Probanden mit „weiß nicht“, „nicht zutreffend“ oder „möchte hierauf nicht antworten“ auf eine Frage geantwortet haben. Diese Werte sollten natürlich nicht in die Analyse einfließen. Als benutzerdefinierte fehlende Werte können Sie diese von der Analyse ausschließen, aber trotzdem für das Datenmanagement von „gewöhnlichen“ fehlenden Werten unterscheiden.

Fehlende Werte können für jede Variable in der Variablenansicht festgelegt werden. Klicken Sie hierfür auf den entsprechenden Eintrag in der Spalte „Fehlend“.

SPSS Datenaufbereitung fehlender Werte
Fehlende Werte definieren Sie hier

 

Für die Datenaufbereitung fehlende Werte definieren
Bis zu drei Werte können als fehlend definiert werden

 

Schritt 4: Korrekte Variablen-Formate festlegen

Wenn Sie die Variablentypen nicht korrekt definieren, kann die Analyse später nicht korrekt ausgeführt werden. Den Variablentyp für jede Variable können Sie in der Variablenansicht bei Klick auf die Spalte „Typ“ festlegen. Die wichtigsten Typen sind numerisch, Zeichenfolge und Datum. Für gewöhnlich erkennt SPSS den Variablentyp automatisch korrekt, aber insbesondere bei Variablen mit Datum ist es gelegentlich nötig den Typen manuell zu korrigieren.

Schritt 5: Numerische Codes für kategorische Variablen

Am Ende der Datenaufbereitung sollten alle Ihre kategorischen Variablen in numerischer Form vorliegen. Sonst können Sie diese Variablen nicht in der Analyse mit einbeziehen.

Kategorische SPSS Variable
Werte für eine kategorische Variable als Zeichenfolge und in numerischer Form.

 

Wenn manche Ihrer kategorischen Variablen die Kategorien als Zeichenfolge enthalten, müssen Sie diese erst noch in die numerische Form umwandeln. Dies erledigen Sie ganz einfach mit dem „automatisch umcodieren“-Befehl (zu finden im Menüpunkt „Transformieren“).

SPSS Befehl „automatisch umcodieren“
Den Befehl „automatisch umcodieren“ finden Sie unter „Transformieren“

 

Im folgenden Menü müssen Sie alle kategorischen Variablen mit Zeichenfolgen dem Fenster rechts hinzufügen. Für jede dieser Variable müssen Sie dann einen Namen für die neue umcodierte Variable festlegen. Setzen Sie dann einen Haken für „leere Zeichenfolgewerte als benutzerdefiniert fehlend behandeln“. Die restlichen Voreinstellungen können Sie so übernehmen.

Datenaufbereitung durch Automatisches Umcodieren von kategorischen Variablen in SPSS
Beispiel für das automatische Umcodieren von kategorischen Variablen

 

Schritt 6: Variablencodes für kategorische Variablen beschriften

Ihre kategorischen Variablen sollten nun in numerischer Form vorliegen. Damit die Bedeutung der Codes eindeutig dokumentiert ist sollten Sie nun Ihre Variablencodes beschriften, ansonsten kann die Bedeutung der numerischen Codes später unklar sein. Dies können Sie mit einem Klick auf die Spalte „Werte“ in der Variablenansicht tun.

Datenaufbereitung: In SPSS Variablencodes beschriften
Variablencodes beschriften Sie mit Klick auf „Werte“

 

Fügen Sie dann für alle Werte der Variablen eine Beschriftung hinzu.

Beispiel: Variablencodes beschriften
Beispiel für das Beschriften von Variablencodes

 

Schritt 7: Datensatz abspeichern

Sie haben nun Ihre Rohdaten erfolgreich aufbereitet und für die Analyse vorbereitet. Wir empfehlen Ihnen, Ihre Rohdaten nicht zu überschreiben, damit Sie Ihre Arbeitsschritte immer rückgängig machen können. Speichern Sie Ihren aufbereiteten Datensatz daher am besten in einer eigenen Datei ab.

Vom richtigen Datenmanagement profitieren durch gründliche Datenaufbereitung

Sie kennen nun die notwendigen Schritte um Daten für die Auswertung von Fragebögen in SPSS aufzubereiten. Sie können nun SPSS Daten importieren und diese für die Analyse vorbereiten. Sorgfältige Datenaufbereitung ist essentiell für gutes Datenmanagement und führt zu einer enormen Zeit- und Arbeitsersparnis während der Analyse. Für weitere Fragen oder einer tiefergehenden Beratung zu Datenmanagement stehen Ihnen die Experten von Novustat selbstverständlich jederzeit zur Verfügung.

Zum Schluss möchten wir Ihnen noch eine Checkliste mit auf den Weg geben, mit der Sie kontrollieren können ob sie alle Schritte für die Datenaufbereitung erledigt haben.

Alle Daten wurden erfolgreich eingelesen
Alle Variablen eindeutig benannt und beschriftet
Benutzerdefinierte fehlenden Werte definiert (wo notwendig)
Alle Variablentypen korrekt eingestellt
Alle kategorischen Variablen sind numerisch codiert
Alle Variablencodes sind beschriftet
Aufbereiteter Datensatz abgespeichert in eigener Datei

 

Weiterführende Quellen

SPSS TUTORIALS: IMPORTING DATA INTO SPSS

Data Cleaning: Detecting, Diagnosing, and Editing Data Abnormalities

The Ultimate Guide to Data Cleaning