Glossar

In unserem Glossar finden Statistik-Studenten und Interessierte zahlreiche Anleitungen, Tipps und Wissenswertes aus der Welt der Statistik. Dieser Bereich wächst noch fleißig, es kommen wöchentlich neue Artikel dazu. Falls Sie Anmerkungen oder Hinweise haben, freuen wir uns über Ihre Email!

Alles rund um SPSS

Allgemeines zu SPSS
Hier erhalten Sie Hinweise zur Geschichte und den Versionen von SPSS sowie Informationen über die Bereiche, in denen SPSS Hilfe leisten kann, die Benutzeroberfläche und auch Unterschiede der SPSS Software im Vergleich zu Excel und R.

Deskriptive Statistik in SPSS

Univariate Statistik
Die univariate Analyse beschreibt Methoden zur SPSS Auswertung einer singulär betrachteten Variablen. Konkret finden sich hier Informationen zur Skalierung von Daten und zu den gängigen Lage- und Streuungsparametern sowie ein Beispiel zur Berechnung und Interpretation des Mittelwerts.

Bivariate Statistik
Hier werden Methoden zur Statistik-Auswertung von Zusammenhängen zwischen zwei Variablen beschrieben. Konkret werden Auswahl und Interpretation von Kennzahlen für Kreuztabellen und Korrelationen in SPSS dargestellt.

Grafische Darstellungen in SPSS
Neben analytischen Funktionen bietet SPSS einen umfangreichen Editor für grafische Darstellungen. Im folgenden Artikel werden schwerpunktmäßig folgende Diagrammtypen behandelt: Balkendiagramm, Histogramm, Streudiagramm, Boxplot in SPSS – diese Funktionen von SPSS sind eine große Statistik Hilfe bei der Auswertung und Präsentation von Daten.

Inferenzielle Statistik in SPSS

Signifikanztests
Hier findet sich eine allgemeine Übersicht zu den Begriffen Nullhypothese und Alternativhypothese sowie zum Begriff der Signifikanz / des p-Wertes. Weiters gibt das Kapitel einen Überblick über unterschiedliche parametrische und nicht-parametrische Testverfahren.

Chi Quadrat Test
Hier werden die beiden Ch Quadrat Testverfahren in SPSS erläutert: Der Verteilungstest prüft die Gleichverteilung der vorliegenden Daten und der Unabhängigkeitstest untersucht, inwieweit zwei Variablen voneinander unabhängig sind.

Test auf Normalverteilung
Hier werden statistische Testverfahren in SPSS zur Überprüfung der Normalverteilung in SPSS vorgestellt: Kolmogorov-Smirnov Test (KS-Test) und Shapiro-Wilk-Test.

Tests auf Unterschied zweier Gruppen in SPSS

Parametrische Tests auf Unterschiede
Dieser Abschnitt widmet sich dem Vergleich von Mittelwerten, konkret dem t-Test SPSS für unabhängige Stichproben und t-Test für verbundene Stichproben.

Varianzanalyse SPSS
Hier wird die Varianzanalyse, auch ANOVA in SPSS genannt, erklärt. Die ANOVA testet mögliche Unterschiede zwischen einem abhängigen Merkmal und einem unabhängigen Merkmal.

Nicht-parametrische Tests auf Unterschiede
Wenn keine Normalverteilung der Daten angenommen werden kann, werden alternativ nicht parametrische Median-Tests eingesetzt: konkret werden der Wilcoxon-Rangtest sowie der Mann-Whitney U-Test vorgestellt.

Tests auf Zusammenhang

Korrelation SPSS
Dieser Abschnitt erklärt die Korrelationsanalyse in SPSS anhand der Korrelationskoeffizienten nach Pearson und Spearman.

Regression SPSS
Der Text thematisiert die Regression allgemein im mathematischen Modell. Neben linearer Regression SPSS werden die multiple Regression SPSS und die logistische Regression SPSS thematisiert.

Multivariate Statistik in SPSS

Clusteranalyse
Hier wird die Clusteranalyse SPSS als Beispiel für ein strukturentdeckendes multuvariates Verfahren vorgestellt.

Diskriminanzanalyse
Die Diskriminanzanalyse in SPSS ist eine multivariate Methode zur Klassifikationsanalyse und ähnelt dem Verfahren der logistischen Regression.

Sonstige statistische Themen

Statistische Daten
Für den Erfolg von statistischen Auswertungen aller Art ist die richtige Wahl der statistischen Daten obligatorisch. Dabei gibt es typische Formate sowie Skalen, welche üblicherweise genutzt werden.

Statistische Tests
Statistische Tests prüfen, ob eine Beobachtung statistisch signifikant ist. Je nach Zielsetzung und Datensatz eignen sich verschiedenste statistische Test-Methoden zur Überprüfung der Signifikanz.

Deskriptive Statistik
Die deskriptive Statistik beschreibt einen Datensatz sowie deren Eigenschaften. Zielsetzung der deskriptiven (beschreibenden) Statistik ist es meist, eine Stichprobe von empirischen Daten zu beschreiben.

Biostatistik
Unter Biostatistik versteht man die Gesamtheit der Methoden mathematischer Statistik in den Biowissenschaften.

Experimentelle Wirtschaftsforschung
Die experimentelle Wirtschaftsforschung führt kontrollierte Versuche, Experimente, Feldversuche in der Realität sowie Auswertung von Umfragen und Auswertungen von Fragebögen durch, um wirtschaftswissenschaftliche Fragestellungen zu untersuchen, Theorien zu entwickeln oder zu überprüfen – z.B. durch statistische Beratung.

Business Analytics
Business Analytics, auch „Business Intelligence“ (BI) genannt, bezeichnet die Auswertung von Geschäftsdaten mithilfe von statistischen Methoden. Die Zielsetzung besteht darin, Firmen auf Basis der Auswertungen bei ihren Entscheidungen zu unterstützen, z.B. mit Statistik-Beratung.

Predictive Analytics
Predictive Analytics (deutsch: vorausschauende Analysen) umfassen diejenigen Verfahren von Datenauswertungen, bei denen es darum geht, künftige Ereignisse vorherzusagen – mit Hilfe von statistischen Verfahren. So sollen durch smarte statistische Datenanalyse möglichst zuverlässige Prognosen erstellt werden.

Statistische Verfahren
Je nachdem welche Zielsetzung und/oder Hypothesen die statistische Auswertung hat, kommen verschiedene statistische Verfahren zum Einsatz.

P Wert Statistik
Als P-Wert bezeichnet man in der Statistik die Größe, welche die statistische Signifikanz einer Beobachtung misst bzw. umgekehrt die Wahrscheinlichkeit dafür, dass man einen Fehler begeht, wenn man eine Hypothese als wahr annimmt. Bei einem P-Wert von 5% ist man sich aufgrund der vorliegenden Daten zu 95% sicher, dass die Hypothese stimmt.

Metaanalyse
Die statistische Metaanalyse fasst die Ergebnisse verschiedener Untersuchungen zu einem gleichen oder ähnlichem Thema zusammen. Zielsetzung ist es, die Ergebnisse dadurch aussagekräftiger und signifikanter zu machen, jedoch gibt es dabei auch einige Dinge zu beachten.

R Statistikprogramm
Das R Statistikprogramm ist kostenlos, verfügt aber um sehr umfangreiche und ständig wachsende Funktionalität. Hier wird beschrieben, was R ist, was es kann, welche Stärken es hat und wie Sie seine Bedienung erlernen können.

Signifikanz Statistik
Die statistische Signifikanz misst, ob eine Beobachtung tatsächlich eine Bedeutung haben könnte oder auch zufällig entstanden sein könnte. Hier wird erklärt: Wovon hängt die statistische Signifikanz ab und wie berechnet man sie?

Signifikanztest
Bei einem Hypothesentest wird eine Hypothese überprüft und entweder die Nullhypothese oder die Gegenhypothese als korrekt angenommen. Anschließend stellt sich die Frage, mit welcher statistischen Signifikanz diese Entscheidung richtig war. Die Signifikanz misst die Wahrscheinlichkeit dafür, dass man die richtige Annahme gemacht hat. Eine 100%ige Sicherheit gibt es jedoch nicht.

Multivariate Statistik
Multivariate Statistiken sind eine Familie von statistischen Verfahren für die Analyse der Abhängigkeiten zwischen mehr als zwei Variablen. Hier werden einige multivariaten Verfahren vorgestellt und wo sie ihren Einsatz finden.

Regression Statistik
Mit Hilfe der Regressionsanalyse lässt sich anhand von Daten vermitteln, welche Variablen einander stark oder weniger stark beeinflussen. Hier wird beschrieben, wie man die statistische Regression zwischen zwei und mehr Variablen sowie die Qualität der Regression berechnet.

Hypothesentest
Ein Hypothesentest ist ein häufig angewendetes statistisches Verfahren, um anhand von Daten zu prüfen, mit welcher Sicherheit man einen Sachverhalt als richtig oder falsch annehmen kann.

Data Mining

Data Mining Definition
Data Mining ist eine Sammlung von Verfahren, um aus Daten Wissen zu erzeugen. Wozu und wie führt man Data Mining durch? Welche Schritte sind dabei durchzuführen? Was macht Data Mining schwierig?

Data Mining Software
Hier werden die Typen von Software-Werkzeugen erklärt, die das Data Mining unterstützen. Außerdem werden einige beispielhafte Werkzeuge kurz beschrieben, und die gängistgen Data-Mining-Werkzeuge sind verlinkt.