Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

Wie man das optimale Statistikprogramm findet: Statistik Software im Überblick

Wie man das optimale Statistikprogramm findet: Statistik Software im Überblick

Die Auswahl der Statistik Software bedarf vor Studienbeginn genauer Abwägung. Dabei gibt es eine große Auswahl für das Statistikprogramm. Hierbei unterscheidet sich Statistik Software hinsichtlich Kosten, Handhabung und Möglichkeiten teilweise sehr stark. Eine weitere Einschränkung kann das Betriebssystem darstellen. So gibt es unterschiedliche Programme für Statistik mit Mac bzw. Windows oder Linux.

In folgendem Artikel wollen wir ihnen einen Überblick über gängige Statistik Software geben: Die Auswahl reicht von Statistik mit Excel über SPSS, Stata, die Programmiersprache R und PSPP als GNU open source Projekt bis hin zu SAS Software. Dabei besitzt jedes Statistikprogramm Vor- und Nachteile. Eine Abwägung ist deshalb immer auf Basis der Anwendung zu treffen. Wie sie ihr optimales Statistikprogramm finden, zeigen wir Ihnen mit diesem Artikel. Wenn Sie für die Software Ihrer Wahl weiterführende Statistik Hilfe von unseren Fachleuten benötigen, freuen wir uns auf Ihre Nachricht!

Folgende Fragen werden in diesem Artikel beantwortet

  • Kann ich auch Statistik mit Excel durchführen?
  • Welche Möglichkeiten der Datenauswertung Software gibt es?
  • Wodurch unterscheidet sich die Statistik Software: SPSS, Stata, Excel, Programmiersprache R und SAS Software?
  • Welche Statistik Programme gibt es kostenlos und/oder legal für Mac, Linux oder Windows?

Aller Anfang ist … – Statistik mit Excel

Excel ist als Tabellenkalkulation ein Allrounder auf dem Gebiet des Datenhandlings. Excel ist als Bestandteil des Office Paketes auf nahezu allen Rechnern installiert. Deshalb stellt Excel oft die erste Wahl dar, wenn es um Dateneingabe und Verarbeitung geht. Besonders einfach und optisch ansprechend lassen sich Daten visualisieren. Über den Funktionsassistenten sind statistische Kenngrößen wie z.B. arithmetisches Mittel, Standardabweichung etc. einfach und schnell zu berechnen. Funktionen aktualisieren sich dabei automatisch bei einer Änderung der Daten. Selbst einzelne induktive Verfahren wie z.B. t-Test, lineare Regression oder Korrelationsanalyse lassen sich durchführen. Für die Funktionalität und Bedienung gibt es zudem eine umfangreiche Dokumentation (z.B. für die Auswertung von Fragebögen mit Excel) und umfangreiche Hilfe.

Durch die große Bandbreite an Anwendungsmöglichkeiten hat die Statistik mit Excel aber auch Einschränkungen. So ist die Dokumentation der Änderungen für Studienzwecke unzureichend. Außerdem sind viele Verfahren durchführbar, obwohl sie methodisch ungeeignet sind. Auch die Diagramme erfüllen oftmals nicht die Anforderungen für aussagekräftige Darstellungen: Die Aussage einer Graphik kann in Excel oft durch spektakuläre Effekte überdeckt werden. Die Graphik hat dann ein spektakuläres Aussehen, die Aussage ist aber nicht mehr auf den ersten Blick ablesbar. Außerdem sind viele Verteilungen, die die Basis für statistische Tests und p-Werte darstellen, ungenau.

Eine Gegenüberstellung der Vor- und Nachteile ist in der folgenden Tabelle zu finden.

Excel

 

Kosten

 

Ca. 100 € (Einzellizenz)

 

Studentenversion erhältlich?

 

Ja

 

Excel Alternative

 

OpenOffice Calc, Gnumeric, Spread32, Libre OfficeCalc, Apache OpenOffice Calc,…

 

Betriebssystem

 

macOS, Windows

 

Pro

 

Contra

 

Dateneingabe

  • Weit verbreitet, oftmals keine Extrakosten
  • Import und kopieren einfach möglich
  • Fehleranfällig: Eingabe in falschen Formaten möglich, versehentliches Löschen oder Ändern, kein Tracking,
  • unübersichtlich
  • Anfällig für Manipulationen
  • Kein Handling von fehlenden Werten!
 

Datenauswertung

  • Auswertungen können einfach eingefügt werden
  • Auswertungen müssen vom Benutzer in dem Dokument eingefügt werden, keine Trennung von Dateneingabe und Auswertung
  • Oft unübersichtlich
  • Erfordert fortgeschrittenes mathematisches Hintergrundwissen, da viele Funktionen selbst erstellt werden müssen
  • Keine Fehlermeldung bei falscher Anwendung
  • Funktionspalette unübersichtlich und für Laien irreführend (STAB STABW etc.)
 

Visualisierung

  • Umfangreiche Palette an Möglichkeiten
  • Intuitive Bedienung
  • Inhaltlich methodische Aspekte treten gegenüber visuellen Effekten (3D, Farbverläufe,…) in den Hintergrund
  • Auch fehlerbehaftete, falsche Darstellungen möglich
 

Export

  • Einfach innerhalb von Office Anwendungen (Word, Powerpoint,..)
  • Häufig drag & drop möglich
  • Fast alle Statistikprogramme können Excel Dateien einlesen
  • Zusammenarbeit schwierig mit unterschiedlichen Versionen (Darstellungen nicht immer kompatibel)
  • Kein Anwendungsmöglichkeit auf mobilen Endgeräten
 

Sonstiges

 

Fazit:

 

Excel ist weit verbreitet und die Bedienung ist vertraut. Für die Dateneingabe ist Excel für kleine Projekte geeignet, wenn gewisse Regeln beachtet werden. Die Erstellung von aussagekräftigen Graphen verlangt statistisches Know How und viel gesunden Menschenverstand. Für die Auswertung von Daten, die über die Berechnung von Mittelwerten, Standardabweichung und Häufigkeitsauszählungen hinausgehen, ist Excel allerdings ungeeignet. Für solche Projekte sollte man dann doch lieber auf spezialisierte Programme zurückgreifen.

Die Spezialisten unter der Statistik Software: SPSS, Stata, Programmiersprache R und SAS Software

Für die Auswertung von Daten gibt es nicht DAS Statistikprogramm. Auf dem Markt gibt es eine große Vielfalt von Statistik Software, die sich hinsichtlich ihrer Handhabung und Ausrichtung erheblich voneinander unterscheidet. Auch in finanzieller Hinsicht gibt es eine große Spannweite.

SPSS: Vielseitig und weit verbreitet

Das Statistikprogramm SPSS wird in vielen Anwendungsgebieten der Statistik benutzt. SPSS ist eine Abkürzung für Statistical Package for the Social Sciences. Dieses Statistikprogramm wurde 1968 initiiert und 2009 von IBM übernommen. Durch die benutzerfreundlichen Menüfenster (GUI) können methodisch korrekte Auswertungen auch ohne Programmierkenntnisse ausgeführt werden. Zudem steht dem fortgeschrittenen Benutzer auch die Möglichkeit der Programmierung zur Verfügung. Weitere Informationen zum Statistik Programm SPSS finden sie in unserem Glossar. Die folgende Tabelle stellt das Programm kurz vor.

SPSS

 

Kosten

 

Ca. 1750 €/Jahr (Einzellizenz, Basismodul), weitere Module z. B. für data mining kostenpflichtig

 

Studentenversion erhältlich?

 

Ja

 

SPSS Alternative

 

JMP, Minitab, PSPP (kostenfrei!), SOFA Statistics (kostenfrei!), STATA

 

Betriebssystem

 

MAC OS, Windows

 

Pro

 

Contra

 

Dateneingabe

  • Umfangreiche Festlegung mit Labels, Skalierung und fehlenden Werten möglich
  • Eigene Variablenansicht
  • Datenfenster
  • Fehleranfällig: Eingabe in falschen Formaten möglich, versehentliches Löschen oder Ändern, kein Tracking,
  • unübersichtlich
  • Anfällig für Manipulationen
  • Kein Handling von fehlenden Werten!
 

Datenauswertung

  • Eigenes Ausgabefenster
  • Durchgeführte Berechnungen werden protokolliert
  • Warnungen bei falschem Skalenniveau
  • Sehr umfangreiche Ausgabe mit vielen zusätzlichen Berechnungen, die Laien eine Orientierung erschweren
  • Irreführende Bezeichnungen, z. B. Significance statt p-Wert
 

Visualisierung

  • Diagramme können kontextabhängig auch mit Auswertungen angefertigt werden
  • Veränderungen müssen nach der Erstellung der Diagramme separat vorgenommen werden (Farbänderungen, Beschriftungen,..)
 

Export

  • Export der Ausgabedatei als Word oder pdf Datei
  • Diagramme können auch in Graphik Formaten gespeichert werden.
  • U. U. viele Dateien für eine Auswertung
 

Sonstiges

 

Sehr umfangreiche Sekundärliteraur

 

Fazit:

 

SPSS ist ein mächtiges, weit verbreitetes Statistik Programm für macOS und Windows. Alle essentiellen etablierten Verfahren sind enthalten, einige aber nur über kostenpflichtige Erweiterungspakete. Auswertungen können mittels graphischer Fensterführung oder über Syntax durchgeführt werden. Eine kostenlose 30-tägige Testversion ist erhältlich. Vergünstigte Konditionen für Studenten.

STATA: Etabliert in der Wirtschaft

Das Statistikprogramm STATA steht vom Konzept zwischen dem v.a. fensterbasiertem SPSS und der reinen codebasierten Statistik Software wie SAS oder der Programmiersprache R. STATA hat seine Stärken insbesondere auf dem Gebiet der Strukturgleichungsmodelle und bei der Auswertung von Panel Daten. Nähere Informationen zur Datenanalyse finden sie auf unseren Seiten. Deshalb wird das Programm häufig bei Anwendungen im wirtschaftswissenschaftlichen Fragestellungen eingesetzt. Einige Projektbeispiele haben wir auf unseren Seiten für sie zusammengestellt.

STATA

 

Kosten

 

Ca. 1200 € (Einzellizenz)

 

Studentenversion erhältlich?

 

ja

 

STATA Alternative

 

JMP, Minitab, PSPP (kostenfrei!), SOFA Statistics (kostenfrei!), SPSS

 

Betriebssystem

 

Windows, Linux, macOS

 

Pro

 

Contra

 

Dateneingabe

  • GUI Oberfläche
  • Dateneingabe via Editor oder Syntax
  • Definition aller Variablen mit fehlenden Werten möglich
  • Einlesen von Datensätzen
  • Es kann jeweils nur ein Datensatz geöffnet und bearbeitet werden
 

Datenauswertung

  • Sowohl GUI Oberfläche als auch Syntax möglich
  • Etabliert im Bereich Structural Equation Modeling (SEM) und Panel Analysen
  • Datenauswertung in eigenem Ausgabefenster
  • Z. T. etwas längere Rechenzeit als pure syntaxbasierte Statistik Programme
  • Neueste Verfahren sind nicht verfügbar – längere Entwicklungszeit stabiler Funktionen
 

Visualisierung

  • Umfassende Auswahl
 

Export

 

Alle gängigen Formate

 

Sonstiges

 

Vor allem in den Wirtschaftswissenschaften etabliert.

 

Fazit:

 

STATA ist ein etabliertes, stabiles Statistik Programm mit GUI sowie Programmcode. Besonders in wirtschaftswissenschaftlichen Anwendungen sowie der Modellierung von Strukturgleichungsmodellen und Panel Daten wird das Programm häufig verwendet.

Programmiersprache R: Statistik im Befehlston

Mit R wird eine Programmiersprache bezeichnet, die zur Auswertung und Darstellung von Daten verwendet wird. Die Analysen werden in R über Befehle aufgerufen. Es existieren aber auch fenstergesteuerte Oberflächen, die Aufrufe ohne Programmierkenntnisse erlauben. Alle Komponenten des Systems sind open source: Erstellt von Anwendern für Anwender. Kostenlos und transparent. Dadurch können auch neueste Verfahren unmittelbar umgesetzt und verbreitet werden. Einige Beispiele für Projekte, die Novustat für Kunden mit dem Statistikprogramm R gelöst hat, finden sie auf unseren Seiten.

R

 

Kosten

 

Kostenlos

 

Studentenversion erhältlich?

 

Nicht erforderlich

 

R Alternative

 

Matlab, SAS

 

Betriebssystem

 

Linus, Windows, MacOS

 

Pro

 

Contra

 

Dateneingabe

  • Als Datenstring
  • Import
  • Kein Dateneingabefenster
 

Datenauswertung

  • Open source Software
  • Sehr aktuelle Tools
  • Riesiger Katalog mit kostenfreien Programm Bibliotheken
  • Umfangreiche Dokumentation
  • In der Regel keine graphische Oberfläche
  • Längere Einarbeitung
  • Je nach Autor gibt es eine größere Bandbreite, wie die Standards ausgelegt werden
  • Weniger allgemeinverständliche Sekundärliteratur
 

Visualisierung

  • Sehr flexibel
  • Z.T. müssen Programmbibliotheken zusätzlich geladen werden.
 

Export

  • Alle gängigen Formate
 

Sonstiges

 

Für die Installation neuer R packages ist ein online Zugang notwendig.

 

Fazit:

 

Die Programmiersprache R ist ein sehr mächtiges und unterstütztes open source Werkzeug. Sie ist kostenlos für alle Betriebssysteme erhältlich. Die Einarbeitung in die spezifischen Befehle bedarf aber einiger Zeit.

SAS: Der Standard in der Biomedizin

Die Firma SAS ist neben SAP Markführer im Bereich von Business Intellegence. Im Bereich der biomedizinischen Statistik ist die Auswertung der Daten mit der Statistik Software SAS Standard. Das liegt vor allem daran, dass SAS die strengen Regularien der amerikanischen Arzneimittelbehörde erfüllt. SAS bietet eine closed source Software an. Der Code, der hinter den einzelnen Prozeduren steht, ist also nicht offen gelegt. Alle verwendeten Prozeduren sind validiert.

SAS

 

Kosten

 

Für kleinere Endkunden nicht vorgesehen, ca. 7500 €/Jahr für Nutzungsrechte

 

Studentenversion erhältlich?

 

SAS University Edition (kostenfrei)

 

SAS Alternative

 

Keine

 

Betriebssystem

 

Windows (Client Software), Linux (Host/Server Installationen)

 

Pro

 

Contra

 

Dateneingabe

  • In der Regel Datenimport aus anderen Formaten
  • Dateneingabeformulare können speziell angefertigt werden
  • Kein eigenes Dateneingabefenster
 

Datenauswertung

  • Bedienung über Anweisungen in einem SAS Programm
  • Mehrere Bedienfenster (Programmcode, log, Ausgabe)
  • Sehr umfangreiche Hilfe und Dokumentation der Prozeduren
  • Validierte neuere Ansätze z. B. bei Analyse genetischer Daten
  • Umfassende und bewährte Sammlung an Statistik Routinen.
  • Sehr intensive Einarbeitung in die Programmiersprache und die Prozeduren notwendig.
 

Visualisierung

  • Vielfältige Möglichkeiten
  • Alle Parameter können über Programmcode verändert und damit dokumentiert werden.
  • Z. T. sehr aufwändige Generierung
 

Export

 

Alle gängigen Formate

 

Sonstiges

 

SAS bietet das Statistik Programm JMP für Private Nutzer an.

 

Fazit:

 

Das Statistik Programm SAS ist ein Standard in der Biostatistik, insbesondere bei der Auswertung klinischer Studien, da es den FDA (Federal Drug Administation) Regularien genügt. Alle Studien, die in weitestem Sinne mit Arzneimittelzulassung zu tun haben werden mit SAS ausgewertet. Für den Einzelnutzer ist dieses Programm schon allein aufgrund der hohen Anschaffungskosten nicht gedacht. Die Firma SAS Institute bietet für Anwender das Programm JMP an. Dieses Programm ist mit SPSS vergleichbar ist. Darüber hinaus gibt es für Studenten und Hochschulen eine kostenfreie SAS University Edition.

Zusammenfassung

Die Auswahl der richtigen Statistik Software für die Auswertungen hat weitreichende Konsequenzen. Diese Wahl muss deshalb wohlüberlegt sein und den persönlichen Anforderungen gerecht werden. Das verwendete Statistikprogramm muss im Methodenteil angeführt werden. Planen sie deshalb genug Zeit ein, um sich mit einem neuen Programm auseinanderzusetzen. Gerne unterstützen sie auch unsere Experten bei ihrer Datenauswertung und beraten sie unabhängig und professionell.

Entscheidungsbaum zum richtigen Statistikprogramm oder zur richti1gen Statistik Software
Entscheidungsbaum Software Statistik kostenfrei und kommerziell

Weiterführende Quellen:

Limitationen von Excel für die Statistische Auswertung