In unserem Glossar finden Statistik-Studenten und Interessierte zahlreiche Anleitungen, Tipps und Wissenswertes aus der Welt der Statistik. Dieser Bereich wächst noch fleißig, es kommen wöchentlich neue Artikel dazu. Falls Sie Anmerkungen oder Hinweise haben, freuen wir uns über Ihre Email!

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.

Jetzt unverbindlich anfragen

Alles rund um SPSS

Allgemeines zu SPSS
Hier erhalten Sie Hinweise zur Geschichte und den Versionen von SPSS sowie Informationen über die Bereiche, in denen SPSS Hilfe leisten kann, die Benutzeroberfläche und auch Unterschiede der SPSS Software im Vergleich zu Excel und R.

Deskriptive Statistik in SPSS

Univariate Statistik
Die univariate Analyse beschreibt Methoden zur SPSS Auswertung einer singulär betrachteten Variablen. Konkret finden sich hier Informationen zur Skalierung von Daten und zu den gängigen Lage- und Streuungsparametern sowie ein Beispiel zur Berechnung und Interpretation des Mittelwerts.

Bivariate Statistik
Hier werden Methoden zur Statistik-Auswertung von Zusammenhängen zwischen zwei Variablen beschrieben. Konkret werden Auswahl und Interpretation von Kennzahlen für Kreuztabellen und Korrelationen in SPSS dargestellt.

Grafische Darstellungen in SPSS
Neben analytischen Funktionen bietet SPSS einen umfangreichen Editor für grafische Darstellungen. Im folgenden Artikel werden schwerpunktmäßig folgende Diagrammtypen behandelt: Balkendiagramm, Histogramm, Streudiagramm, Boxplot in SPSS – diese Funktionen von SPSS sind eine große Statistik Hilfe bei der Auswertung und Präsentation von Daten.

Inferenzielle Statistik in SPSS

Signifikanztests
Hier findet sich eine allgemeine Übersicht zu den Begriffen Nullhypothese und Alternativhypothese sowie zum Begriff der Signifikanz / des p-Wertes. Weiters gibt das Kapitel einen Überblick über unterschiedliche parametrische und nicht-parametrische Testverfahren.

Chi Quadrat Test
Hier werden die beiden Chi Quadrat Testverfahren in SPSS erläutert: Der Verteilungstest prüft die Gleichverteilung der vorliegenden Daten und der Unabhängigkeitstest untersucht, inwieweit zwei Variablen voneinander unabhängig sind.

Test auf Normalverteilung
Hier werden statistische Testverfahren in SPSS zur Überprüfung der Normalverteilung in SPSS vorgestellt: Kolmogorov-Smirnov Test (KS-Test) und Shapiro-Wilk-Test.

Tests auf Unterschied zweier Gruppen in SPSS

Parametrische Tests auf Unterschiede
Dieser Abschnitt widmet sich dem Vergleich von Mittelwerten, konkret dem t-Test SPSS für unabhängige Stichproben und t-Test für verbundene Stichproben.

Varianzanalyse SPSS
Hier wird die Varianzanalyse, auch ANOVA in SPSS genannt, erklärt. Die ANOVA testet mögliche Unterschiede zwischen einem abhängigen Merkmal und einem unabhängigen Merkmal.

Nicht-parametrische Tests auf Unterschiede
Wenn keine Normalverteilung der Daten angenommen werden kann, werden alternativ nicht parametrische Median-Tests eingesetzt: konkret werden der Wilcoxon-Rangtest sowie der Mann-Whitney U-Test vorgestellt.

Tests auf Zusammenhang

Korrelation SPSS
Dieser Abschnitt erklärt die Korrelationsanalyse in SPSS anhand der Korrelationskoeffizienten nach Pearson und Spearman.

Regression SPSS
Der Text thematisiert die Regression allgemein im mathematischen Modell. Neben linearer Regression SPSS werden die multiple Regression SPSS und die logistische Regression SPSS thematisiert.

Multivariate Statistik in SPSS

Clusteranalyse
Hier wird die Clusteranalyse SPSS als Beispiel für ein strukturentdeckendes multuvariates Verfahren vorgestellt.

Diskriminanzanalyse
Die Diskriminanzanalyse in SPSS ist eine multivariate Methode zur Klassifikationsanalyse und ähnelt dem Verfahren der logistischen Regression.

Sonstige statistische Themen

Statistische Daten
Für den Erfolg von statistischen Auswertungen aller Art ist die richtige Wahl der statistischen Daten obligatorisch. Dabei gibt es typische Formate sowie Skalen, welche üblicherweise genutzt werden.

Statistische Tests
Statistische Tests prüfen, ob eine Beobachtung statistisch signifikant ist. Je nach Zielsetzung und Datensatz eignen sich verschiedenste statistische Test-Methoden zur Überprüfung der Signifikanz.

Deskriptive Statistik
Die deskriptive Statistik beschreibt einen Datensatz sowie deren Eigenschaften. Zielsetzung der deskriptiven (beschreibenden) Statistik ist es meist, eine Stichprobe von empirischen Daten zu beschreiben.

Experimentelle Wirtschaftsforschung
Die experimentelle Wirtschaftsforschung führt kontrollierte Versuche, Experimente, Feldversuche in der Realität sowie Auswertung von Umfragen und Auswertungen von Fragebögen durch, um wirtschaftswissenschaftliche Fragestellungen zu untersuchen, Theorien zu entwickeln oder zu überprüfen – z.B. durch statistische Beratung.

Business Analytics
Business Analytics, auch „Business Intelligence“ (BI) genannt, bezeichnet die Auswertung von Geschäftsdaten mithilfe von statistischen Methoden. Die Zielsetzung besteht darin, Firmen auf Basis der Auswertungen bei ihren Entscheidungen zu unterstützen, z.B. mit Statistik-Beratung.

Predictive Analytics
Predictive Analytics (deutsch: vorausschauende Analysen) umfassen diejenigen Verfahren von Datenauswertungen, bei denen es darum geht, künftige Ereignisse vorherzusagen – mit Hilfe von statistischen Verfahren. So sollen durch smarte statistische Datenanalyse möglichst zuverlässige Prognosen erstellt werden.

Statistische Verfahren
Je nachdem welche Zielsetzung und/oder Hypothesen die statistische Auswertung hat, kommen verschiedene statistische Verfahren zum Einsatz.

P Wert Statistik
Als P-Wert bezeichnet man in der Statistik die Prüfgröße, welche die statistische Signifikanz einer Beobachtung misst. Der P-Wert ist eine Wahrscheinlichkeitswert der angibt, mit welcher Wahrscheinlichkeit man die Werte der Stichprobe findet, unter der Annahme, dass die Nullhypothese wahr ist.

R Statistikprogramm
Das R Statistikprogramm ist kostenlos, verfügt aber um sehr umfangreiche und ständig wachsende Funktionalität. Hier wird beschrieben, was R ist, was es kann, welche Stärken es hat und wie Sie seine Bedienung erlernen können.

Signifikanz Statistik
Die statistische Signifikanz misst, ob eine Beobachtung tatsächlich eine Bedeutung haben könnte oder auch zufällig entstanden sein könnte. Hier wird erklärt: Wovon hängt die statistische Signifikanz ab und wie berechnet man sie?

Signifikanztest
Bei einem Hypothesentest wird eine Hypothese überprüft und entweder die Nullhypothese oder die Gegenhypothese als korrekt angenommen. Anschließend stellt sich die Frage, zu welchem Signifikanzniveau die Hypothese angenommen wurde.

Multivariate Statistik
Multivariate Statistiken sind eine Familie von statistischen Verfahren für die Analyse der Abhängigkeiten zwischen mehr als zwei Variablen. Hier werden einige multivariaten Verfahren vorgestellt und wo sie ihren Einsatz finden.

Regression Statistik
Mit Hilfe der Regressionsanalyse lässt sich anhand von Daten vermitteln, welche Variablen einander stark oder weniger stark beeinflussen. Hier wird beschrieben, wie man die statistische Regression zwischen zwei und mehr Variablen sowie die Qualität der Regression berechnet.

Hypothesentest
Ein Hypothesentest ist ein häufig angewendetes statistisches Verfahren, um anhand von Daten zu prüfen, mit welcher Sicherheit man einen Sachverhalt als richtig oder falsch annehmen kann.

Data Mining

Data Mining Definition
Data Mining ist eine Sammlung von Verfahren, um aus Daten Wissen zu erzeugen. Wozu und wie führt man Data Mining durch? Welche Schritte sind dabei durchzuführen? Was macht Data Mining schwierig?

Data Mining Software
Hier werden die Typen von Software-Werkzeugen erklärt, die das Data Mining unterstützen. Außerdem werden einige beispielhafte Werkzeuge kurz beschrieben, und die gängistgen Data-Mining-Werkzeuge sind verlinkt.

Medizinische Statistik

Positiver prädiktiver Wert
Der positive prädiktive Wert (PPW) ist ein statistisches Maß, das die Wahrscheinlichkeit angibt, dass eine positive Testergebnis tatsächlich auf das Vorhandensein einer bestimmten Erkrankung oder Bedingung hinweist. Der PPW hängt sowohl von der Prävalenz (Häufigkeit) der Erkrankung in der untersuchten Population als auch von der Empfindlichkeit und Spezifität des Tests ab. Ein hoher PPW bedeutet, dass das Testergebnis wahrscheinlich korrekt ist und eine hohe Wahrscheinlichkeit für das Vorhandensein der Erkrankung oder Bedingung besteht. Der PPW ist ein wichtiges Maß für die klinische Entscheidungsfindung und die Interpretation von diagnostischen Tests.

Teilnutzenwert
Im Bereich der medizinischen Statistik kann der Teilnutzenwert verwendet werden, um den Nutzen eines diagnostischen Tests zu bewerten. Dies kann durch die Bewertung der Sensitivität und Spezifität des Tests sowie der Prävalenz der Erkrankung in der untersuchten Population erfolgen. Der Teilnutzenwert kann dazu beitragen, den Nutzen des Tests für verschiedene Gruppen von Patienten zu bestimmen und eine informierte Entscheidungsfindung in der medizinischen Praxis zu unterstützen.

Difference-in-Differences Methode
Die Difference-in-Differences (DiD) Methode ist eine statistische Methode, die häufig in der medizinischen Statistik eingesetzt wird, um den Einfluss von Interventionen oder Behandlungen auf eine bestimmte Erkrankung oder Bedingung zu bewerten. Dabei wird der Unterschied in den Veränderungen der Outcomes zwischen einer behandelten und einer unbehandelten Gruppe über einen bestimmten Zeitraum hinweg verglichen. Die DiD Methode kann dazu beitragen, Verzerrungen in der Bewertung von Behandlungseffekten zu minimieren und eine präzisere Bewertung von Interventionen in der medizinischen Praxis zu ermöglichen.

Sensitivitätsanalyse
Die Sensitivitätsanalyse ist eine statistische Methode, die in der medizinischen Statistik verwendet wird, um die Robustheit von Ergebnissen einer Analyse gegenüber Veränderungen in den Annahmen oder Parametern zu testen. Durch Änderungen der Parameter können potenzielle Auswirkungen auf die Ergebnisse untersucht werden. Dies kann dazu beitragen, die Stärke der Evidenz zu erhöhen, indem mögliche Schwachstellen in der Analyse aufgedeckt und adressiert werden. Sensitivitätsanalysen sind ein wichtiger Bestandteil der evidenzbasierten Medizin und tragen dazu bei, die Genauigkeit und Zuverlässigkeit von medizinischen Forschungsergebnissen zu verbessern.

Placebo-Test
Ein Placebo-Test ist ein statistischer Test, der in der medizinischen Statistik durchgeführt wird, um den Effekt einer Behandlung im Vergleich zu einem Placebo zu bewerten. Dabei wird eine Gruppe von Patienten mit einem Placebo behandelt, während eine andere Gruppe die tatsächliche Behandlung erhält. Der Unterschied in den Ergebnissen zwischen den beiden Gruppen kann dazu beitragen, den Effekt der Behandlung auf die untersuchte Erkrankung oder Bedingung zu bewerten. Placebo-Tests sind ein wichtiges Instrument zur Bewertung der Wirksamkeit von Medikamenten und Therapien und tragen zur evidenzbasierten Medizin bei.

Qualitative Merkmale im medizinischen Bereich
Qualitative Merkmale im medizinischen Bereich sind Merkmale, die nicht numerisch messbar sind, wie zum Beispiel Geschlecht, ethnische Zugehörigkeit oder Krankheitsdiagnose. In der medizinischen Statistik werden diese Merkmale als kategoriale Variablen bezeichnet und können durch Frequenzverteilungen und Kreuztabellen analysiert werden. Die Analyse qualitativer Merkmale kann dazu beitragen, Unterschiede und Zusammenhänge zwischen verschiedenen Gruppen von Patienten oder zwischen Patienten und Behandlungsergebnissen zu identifizieren. Die Berücksichtigung von qualitativen Merkmalen ist ein wichtiger Aspekt der datenbasierten Entscheidungsfindung in der medizinischen Praxis.

Retrospektive Studien
Retrospektive Studien sind eine Art von Beobachtungsstudien in der medizinischen Statistik, bei denen Daten aus der Vergangenheit analysiert werden. Diese Studien können durch die Verwendung von medizinischen Aufzeichnungen oder Fragebögen durchgeführt werden. Retrospektive Studien können dazu beitragen, Ursache-Wirkungs-Beziehungen zwischen verschiedenen Faktoren und Erkrankungen zu identifizieren und Risikofaktoren zu bewerten. Allerdings können retrospektive Studien anfällig für Verzerrungen und Fehler sein, und die Kausalität von Beziehungen zwischen Variablen ist möglicherweise schwer zu etablieren.

Beobachtungsstudie
Eine Beobachtungsstudie ist eine Art der Studienplanung in der medizinischen Statistik, bei der keine Intervention oder experimentelle Manipulation durchgeführt wird. Stattdessen werden Daten aus einer vorhandenen Bevölkerung oder Kohorte gesammelt und analysiert, um mögliche Zusammenhänge oder Assoziationen zwischen Variablen zu identifizieren. Beobachtungsstudien können dazu beitragen, Fragen zur Häufigkeit und Verteilung von Erkrankungen, Ursachen und Risikofaktoren zu beantworten. Allerdings sind Beobachtungsstudien anfällig für Verzerrungen und Fehler, und es kann schwierig sein, eine Kausalität zwischen Variablen zu etablieren.

Goldstandard (Medizin)
Der Goldstandard in der medizinischen Statistik bezieht sich auf den besten verfügbaren Test oder die beste verfügbare Diagnosemethode, die als Referenz für die Bewertung anderer Tests oder Methoden dient. Der Goldstandard wird oft verwendet, um die Validität und Zuverlässigkeit von neuen oder experimentellen Tests zu bewerten. In der medizinischen Praxis bezieht sich der Goldstandard oft auf eine Diagnosemethode oder eine Behandlung, die allgemein als am effektivsten oder am besten geeignet angesehen wird. Die Verwendung von Goldstandards ist ein wichtiger Aspekt der evidenzbasierten Medizin und der datenbasierten Entscheidungsfindung.

Youden Index
Der Youden-Index ist eine Maßzahl, die zur Bewertung der Leistung eines diagnostischen Tests in der medizinischen Statistik verwendet wird. Er wird durch die Differenz zwischen der Sensitivität und der Komplementär-Spezifität des Tests berechnet und kann Werte von -1 bis 1 annehmen. Ein hoher Wert des Youden-Index zeigt an, dass der Test eine hohe diagnostische Genauigkeit hat, während ein niedriger Wert auf eine geringere Genauigkeit hinweist. Der Youden-Index kann dazu beitragen, die Effektivität von diagnostischen Tests zu bewerten und den besten Schwellenwert für die Interpretation von Testergebnissen zu bestimmen.

Interquartilabstand
Der Interquartilsabstand ist eine Maßzahl, die in der medizinischen Statistik verwendet wird, um die Streuung oder Variabilität einer Gruppe von Daten zu beschreiben. Er wird berechnet, indem man den Wert des 75. Perzentils vom Wert des 25. Perzentils abzieht. Der Interquartilsabstand gibt an, wie weit die mittleren 50% der Daten voneinander entfernt sind und ist weniger anfällig für Ausreißer als die Standardabweichung. Der Interquartilsabstand ist daher eine nützliche Methode, um die Variabilität von Daten in einer Studie zu quantifizieren.

Klinische Relevanz
In der medizinischen Statistik bezieht sich klinische Relevanz darauf, ob die Ergebnisse einer Studie in der klinischen Praxis nützlich sind. Ein statistisch signifikantes Ergebnis ist nicht automatisch klinisch relevant, wenn es beispielsweise nur einen sehr geringen Effekt hat. Klinische Relevanz wird oft anhand von Schwellenwerten bestimmt, die darauf hinweisen, ab welchem Ausmaß eines Effekts oder einer Veränderung ein Eingriff in der Praxis sinnvoll oder notwendig ist. Die Bewertung der klinischen Relevanz ist ein wichtiger Aspekt der evidenzbasierten Medizin.

Bland-Altman-Analyse
Die Bland-Altman-Analyse ist eine Methode zur Bewertung der Übereinstimmung zweier diagnostischer oder messender Verfahren in der medizinischen Statistik. Dabei werden die Differenzen zwischen den Ergebnissen der beiden Verfahren gegen den Mittelwert dieser Ergebnisse aufgetragen. Die Analyse ermöglicht die Identifizierung von systematischen Unterschieden und zufälligen Schwankungen zwischen den Verfahren. Durch die Verwendung von Bland-Altman-Plots können auch Ausreißer und fehlerhafte Messungen erkannt werden. Die Bland-Altman-Analyse ist eine nützliche Methode zur Bewertung der Validität und Reproduzierbarkeit von Messverfahren in der medizinischen Forschung.

McNemar-Test
Der McNemar-Test ist ein statistisches Verfahren in der medizinischen Statistik, das zur Analyse von binären Daten verwendet wird. Es wird insbesondere angewendet, um Unterschiede zwischen zwei korrelierten Stichproben zu ermitteln. Der Test vergleicht die Anzahl der Übereinstimmungen und Nicht-Übereinstimmungen in einer Stichprobe mit einer anderen Stichprobe und ermittelt, ob die Unterschiede signifikant sind. Der McNemar-Test ist besonders nützlich bei der Untersuchung von Veränderungen oder Verbesserungen von Behandlungen, wenn nur eine begrenzte Anzahl von Patienten verfügbar ist.

Interventionsstudie
Eine Interventionsstudie ist ein Forschungsdesign in der medizinischen Statistik, bei dem die Auswirkungen einer spezifischen Intervention auf eine Zielgruppe untersucht werden. Es handelt sich um eine Art von klinischer Studie, bei der eine oder mehrere Gruppen von Teilnehmern einer bestimmten Intervention ausgesetzt werden, während eine Kontrollgruppe keine Intervention erhält. Interventionsstudien werden durchgeführt, um die Wirksamkeit, Sicherheit und Effizienz von Medikamenten, Therapien oder anderen medizinischen Maßnahmen zu bewerten. Dabei werden verschiedene statistische Methoden wie Randomisierung, Verblindung und Placebo-Kontrollen verwendet, um die Validität und Genauigkeit der Ergebnisse zu gewährleisten.

Anzahl der notwendigen Behandlungen
Die Anzahl der notwendigen Behandlungen (Number Needed to Treat, NNT) ist ein Konzept der medizinischen Statistik, das angibt, wie viele Patienten behandelt werden müssen, um einen Erfolg zu erzielen. Eine niedrige NNT bedeutet, dass die Behandlung effektiver ist, während eine hohe NNT darauf hinweist, dass die Behandlung weniger effektiv ist. Die NNT wird oft verwendet, um die Wirksamkeit von Medikamenten oder anderen Therapien zu bewerten und kann dazu beitragen, medizinische Entscheidungen zu treffen und Ressourcen effektiver einzusetzen.

Visuelle Analogskala
Die visuelle Analogskala (VAS) ist ein Messinstrument, das häufig in der medizinischen Statistik verwendet wird, um die Intensität von Symptomen oder die Wirksamkeit von Behandlungen zu bewerten. Die VAS besteht aus einer horizontalen Linie mit zwei Endpunkten, die die Extreme der beurteilten Eigenschaft darstellen. Die Person markiert dann auf der Linie einen Punkt, der ihre Bewertung widerspiegelt. Die VAS ist einfach anzuwenden und hat eine gute Sensitivität, um Unterschiede in der Intensität zu erkennen, weshalb sie oft in klinischen Studien eingesetzt wird.

Karnofsky-Index
Der Karnofsky-Index ist ein Maß für die allgemeine funktionale Fähigkeit von Patienten, die von Gesundheitsdienstleistern verwendet wird, um den Verlauf von Krankheiten zu bewerten und Behandlungen zu planen. Der Index bewertet die Fähigkeit des Patienten, alltägliche Aktivitäten wie Essen, Körperpflege und Bewegung auszuführen, und weist einem Wert von 0 bis 100 Punkten zu, wobei höhere Werte eine bessere Funktionsfähigkeit anzeigen. Der Karnofsky-Index wird häufig in der Onkologie verwendet, um den Verlauf von Krebserkrankungen und die Auswirkungen von Behandlungen auf die Lebensqualität der Patienten zu beurteilen.

Dichotomie
In der medizinischen Statistik bezieht sich Dichotomie auf die Kategorisierung von Daten in nur zwei mögliche Ausprägungen. Ein bekanntes Beispiel ist die Unterscheidung zwischen krank und gesund oder zwischen einer positiven und einer negativen Diagnose. Dichotome Variablen werden häufig zur Beschreibung von Ergebnissen in klinischen Studien verwendet. Die Analyse solcher Variablen erfordert jedoch besondere statistische Verfahren, um eine aussagekräftige Interpretation der Ergebnisse zu gewährleisten.

Alpha-Fehler
In der medizinischen Statistik bezieht sich der Alpha-Fehler auf die Wahrscheinlichkeit, einen falschen positiven Befund zu erhalten. Der Alpha-Fehler ist eine Art von Fehler 1. Art, bei der die Nullhypothese fälschlicherweise abgelehnt wird, wenn sie eigentlich zutreffend ist. Die Wahrscheinlichkeit für den Alpha-Fehler wird durch das gewählte Signifikanzniveau bestimmt. Eine Verringerung des Signifikanzniveaus führt zu einer geringeren Wahrscheinlichkeit für den Alpha-Fehler, erhöht jedoch gleichzeitig die Wahrscheinlichkeit für einen Beta-Fehler.

Residuen
Residuen sind in der medizinischen Statistik die Abweichungen zwischen den beobachteten und den prognostizierten Werten einer abhängigen Variablen. Sie können verwendet werden, um die Güte einer Regressionsanalyse zu überprüfen. Wenn die Residuen zufällig verteilt sind und keine systematischen Muster aufweisen, deutet dies auf eine gute Passung des Modells hin. Andernfalls können Anpassungsprobleme vorliegen, z. B. eine nichtlineare Beziehung zwischen den Variablen oder fehlende Variablen, die in das Modell aufgenommen werden sollten.

Kohortenstudie
In der medizinischen Statistik werden Kohortenstudien verwendet, um den Zusammenhang zwischen einer Exposition (z.B. Rauchen) und dem Auftreten einer Erkrankung zu untersuchen. Hierbei werden Personen, die der Exposition ausgesetzt sind, mit Personen verglichen, die nicht exponiert sind. Es werden Daten über einen längeren Zeitraum gesammelt und ausgewertet, um den Einfluss der Exposition auf das Auftreten der Erkrankung zu ermitteln. Kohortenstudien gelten als eine der stärksten Studiendesigns in der medizinischen Forschung.