Die Auswahl der Statistik Software bedarf vor Studienbeginn genauer Abwägung. Dabei gibt es eine große Auswahl für das Statistikprogramm. Hierbei unterscheidet sich Statistik Software hinsichtlich Kosten, Handhabung und Möglichkeiten teilweise sehr stark. Eine weitere Einschränkung kann das Betriebssystem darstellen. So gibt es unterschiedliche Programme für Statistik mit Mac bzw. Windows oder Linux.
In folgendem Artikel wollen wir ihnen einen Überblick über gängige Statistik Software geben: Die Auswahl reicht von Statistik mit Excel über SPSS, Stata, die Programmiersprache R und PSPP als GNU open source Projekt bis hin zu SAS Software. Dabei besitzt jedes Statistikprogramm Vor- und Nachteile. Eine Abwägung ist deshalb immer auf Basis der Anwendung zu treffen. Wie sie ihr optimales Statistikprogramm finden, zeigen wir Ihnen mit diesem Artikel. Wenn Sie für die Software Ihrer Wahl weiterführende Statistik Hilfe von unseren Fachleuten benötigen, freuen wir uns auf Ihre Nachricht!
Folgende Fragen werden in diesem Artikel beantwortet
- Kann ich auch Statistik mit Excel durchführen?
- Welche Möglichkeiten der Datenauswertung Software gibt es?
- Wodurch unterscheidet sich die Statistik Software: SPSS, Stata, Excel, Programmiersprache R und SAS Software?
- Welche Statistik Programme gibt es kostenlos und/oder legal für Mac, Linux oder Windows?
Aller Anfang ist … – Statistik mit Excel
Excel ist als Tabellenkalkulation ein Allrounder auf dem Gebiet des Datenhandlings. Excel ist als Bestandteil des Office Paketes auf nahezu allen Rechnern installiert. Deshalb stellt Excel oft die erste Wahl dar, wenn es um Dateneingabe und Verarbeitung geht. Besonders einfach und optisch ansprechend lassen sich Daten visualisieren. Über den Funktionsassistenten sind statistische Kenngrößen wie z.B. arithmetisches Mittel, Standardabweichung etc. einfach und schnell zu berechnen. Funktionen aktualisieren sich dabei automatisch bei einer Änderung der Daten. Selbst einzelne induktive Verfahren wie z.B. t-Test, lineare Regression oder Korrelationsanalyse lassen sich durchführen. Für die Funktionalität und Bedienung gibt es zudem eine umfangreiche Dokumentation (z.B. für die Auswertung von Fragebögen mit Excel) und umfangreiche Hilfe.
Durch die große Bandbreite an Anwendungsmöglichkeiten hat die Statistik mit Excel aber auch Einschränkungen. So ist die Dokumentation der Änderungen für Studienzwecke unzureichend. Außerdem sind viele Verfahren durchführbar, obwohl sie methodisch ungeeignet sind. Auch die Diagramme erfüllen oftmals nicht die Anforderungen für aussagekräftige Darstellungen: Die Aussage einer Graphik kann in Excel oft durch spektakuläre Effekte überdeckt werden. Die Graphik hat dann ein spektakuläres Aussehen, die Aussage ist aber nicht mehr auf den ersten Blick ablesbar. Außerdem sind viele Verteilungen, die die Basis für statistische Tests und p-Werte darstellen, ungenau.
Eine Gegenüberstellung der Vor- und Nachteile ist in der folgenden Tabelle zu finden.
Excel | ||
Kosten | Ca. 100 € (Einzellizenz) | |
Studentenversion erhältlich? | Ja | |
Excel Alternative | OpenOffice Calc, Gnumeric, Spread32, Libre OfficeCalc, Apache OpenOffice Calc,… | |
Betriebssystem | macOS, Windows | |
Pro | Contra | |
Dateneingabe |
|
|
Datenauswertung |
|
|
Visualisierung |
|
|
Export |
|
|
Sonstiges | ||
Fazit: | Excel ist weit verbreitet und die Bedienung ist vertraut. Für die Dateneingabe ist Excel für kleine Projekte geeignet, wenn gewisse Regeln beachtet werden. Die Erstellung von aussagekräftigen Graphen verlangt statistisches Know How und viel gesunden Menschenverstand. Für die Auswertung von Daten, die über die Berechnung von Mittelwerten, Standardabweichung und Häufigkeitsauszählungen hinausgehen, ist Excel allerdings ungeeignet. Für solche Projekte sollte man dann doch lieber auf spezialisierte Programme zurückgreifen. |
Die Spezialisten unter der Statistik Software: SPSS, Stata, Programmiersprache R und SAS Software
Für die Auswertung von Daten gibt es nicht DAS Statistikprogramm. Auf dem Markt gibt es eine große Vielfalt von Statistik Software, die sich hinsichtlich ihrer Handhabung und Ausrichtung erheblich voneinander unterscheidet. Auch in finanzieller Hinsicht gibt es eine große Spannweite.
SPSS: Vielseitig und weit verbreitet
Das Statistikprogramm SPSS wird in vielen Anwendungsgebieten der Statistik benutzt. SPSS ist eine Abkürzung für Statistical Package for the Social Sciences. Dieses Statistikprogramm wurde 1968 initiiert und 2009 von IBM übernommen. Durch die benutzerfreundlichen Menüfenster (GUI) können methodisch korrekte Auswertungen auch ohne Programmierkenntnisse ausgeführt werden. Zudem steht dem fortgeschrittenen Benutzer auch die Möglichkeit der Programmierung zur Verfügung. Weitere Informationen zum Statistik Programm SPSS finden sie in unserem Glossar. Die folgende Tabelle stellt das Programm kurz vor.
SPSS | ||
Kosten | Ca. 1750 €/Jahr (Einzellizenz, Basismodul), weitere Module z. B. für data mining kostenpflichtig | |
Studentenversion erhältlich? | Ja | |
SPSS Alternative | JMP, Minitab, PSPP (kostenfrei!), SOFA Statistics (kostenfrei!), STATA | |
Betriebssystem | MAC OS, Windows | |
Pro | Contra | |
Dateneingabe |
|
|
Datenauswertung |
|
|
Visualisierung |
|
|
Export |
|
|
Sonstiges | Sehr umfangreiche Sekundärliteraur | |
Fazit: | SPSS ist ein mächtiges, weit verbreitetes Statistik Programm für macOS und Windows. Alle essentiellen etablierten Verfahren sind enthalten, einige aber nur über kostenpflichtige Erweiterungspakete. Auswertungen können mittels graphischer Fensterführung oder über Syntax durchgeführt werden. Eine kostenlose 30-tägige Testversion ist erhältlich. Vergünstigte Konditionen für Studenten. |
STATA: Etabliert in der Wirtschaft
Das Statistikprogramm STATA steht vom Konzept zwischen dem v.a. fensterbasiertem SPSS und der reinen codebasierten Statistik Software wie SAS oder der Programmiersprache R. STATA hat seine Stärken insbesondere auf dem Gebiet der Strukturgleichungsmodelle und bei der Auswertung von Panel Daten. Nähere Informationen zur Datenanalyse finden sie auf unseren Seiten. Deshalb wird das Programm häufig bei Anwendungen im wirtschaftswissenschaftlichen Fragestellungen eingesetzt.
STATA | ||
Kosten | Ca. 1200 € (Einzellizenz) | |
Studentenversion erhältlich? | ja | |
STATA Alternative | JMP, Minitab, PSPP (kostenfrei!), SOFA Statistics (kostenfrei!), SPSS | |
Betriebssystem | Windows, Linux, macOS | |
Pro | Contra | |
Dateneingabe |
|
|
Datenauswertung |
|
|
Visualisierung |
| |
Export | Alle gängigen Formate | |
Sonstiges | Vor allem in den Wirtschaftswissenschaften etabliert. | |
Fazit: | STATA ist ein etabliertes, stabiles Statistik Programm mit GUI sowie Programmcode. Besonders in wirtschaftswissenschaftlichen Anwendungen sowie der Modellierung von Strukturgleichungsmodellen und Panel Daten wird das Programm häufig verwendet. |
Programmiersprache R: Statistik im Befehlston
Mit R wird eine Programmiersprache bezeichnet, die zur Auswertung und Darstellung von Daten verwendet wird. Die Analysen werden in R über Befehle aufgerufen. Es existieren aber auch fenstergesteuerte Oberflächen, die Aufrufe ohne Programmierkenntnisse erlauben. Alle Komponenten des Systems sind open source: Erstellt von Anwendern für Anwender. Kostenlos und transparent. Dadurch können auch neueste Verfahren unmittelbar umgesetzt und verbreitet werden.
R | ||
Kosten | Kostenlos | |
Studentenversion erhältlich? | Nicht erforderlich | |
R Alternative | Matlab, SAS | |
Betriebssystem | Linus, Windows, MacOS | |
Pro | Contra | |
Dateneingabe |
|
|
Datenauswertung |
|
|
Visualisierung |
|
|
Export |
| |
Sonstiges | Für die Installation neuer R packages ist ein online Zugang notwendig. | |
Fazit: | Die Programmiersprache R ist ein sehr mächtiges und unterstütztes open source Werkzeug. Sie ist kostenlos für alle Betriebssysteme erhältlich. Die Einarbeitung in die spezifischen Befehle bedarf aber einiger Zeit. |
SAS: Der Standard in der Biomedizin
Die Firma SAS ist neben SAP Markführer im Bereich von Business Intellegence. Im Bereich der biomedizinischen Statistik ist die Auswertung der Daten mit der Statistik Software SAS Standard. Das liegt vor allem daran, dass SAS die strengen Regularien der amerikanischen Arzneimittelbehörde erfüllt. SAS bietet eine closed source Software an. Der Code, der hinter den einzelnen Prozeduren steht, ist also nicht offen gelegt. Alle verwendeten Prozeduren sind validiert.
SAS | ||
Kosten | Für kleinere Endkunden nicht vorgesehen, ca. 7500 €/Jahr für Nutzungsrechte | |
Studentenversion erhältlich? | SAS University Edition (kostenfrei) | |
SAS Alternative | Keine | |
Betriebssystem | Windows (Client Software), Linux (Host/Server Installationen) | |
Pro | Contra | |
Dateneingabe |
|
|
Datenauswertung |
|
|
Visualisierung |
|
|
Export | Alle gängigen Formate | |
Sonstiges | SAS bietet das Statistik Programm JMP für Private Nutzer an. | |
Fazit: | Das Statistik Programm SAS ist ein Standard in der Biostatistik, insbesondere bei der Auswertung klinischer Studien, da es den FDA (Federal Drug Administation) Regularien genügt. Alle Studien, die in weitestem Sinne mit Arzneimittelzulassung zu tun haben werden mit SAS ausgewertet. Für den Einzelnutzer ist dieses Programm schon allein aufgrund der hohen Anschaffungskosten nicht gedacht. Die Firma SAS Institute bietet für Anwender das Programm JMP an. Dieses Programm ist mit SPSS vergleichbar ist. Darüber hinaus gibt es für Studenten und Hochschulen eine kostenfreie SAS University Edition. |
Zusammenfassung
Die Auswahl der richtigen Statistik Software für die Auswertungen hat weitreichende Konsequenzen. Diese Wahl muss deshalb wohlüberlegt sein und den persönlichen Anforderungen gerecht werden. Das verwendete Statistikprogramm muss im Methodenteil angeführt werden. Planen sie deshalb genug Zeit ein, um sich mit einem neuen Programm auseinanderzusetzen. Gerne unterstützen sie auch unsere Experten bei ihrer Datenauswertung und beraten sie unabhängig und professionell.