Gerne beraten wir Sie auch telefonisch & geben Ihnen eine kostenfreie persönliche Auskunft zu Ihrem Projekt.

X

Statistische Datenauswertung: MANOVA (Varianzanalyse) mit Messwiederholungen in Stata

Ziel dieses Projektes war die datenbasierte statistische Unterstützung einer Kaufentscheidung unseres Kunden aus der Weinindustrie durch MANOVA, der vor der Expansion seines Geschäftes stand und ein weiteres Weingut käuflich erwerben wollte.

Vorbereitung und Herausforderung

In der modernen Welt werden immer mehr Business-Entscheidungen auf der Basis von Ergebnissen und Erkenntnissen aus Datenanalyse getroffen. In diese dieser Projektbeschreibung zeigen wir, welche geschäftsrelevante Insights mit Hilfe von Statistik erzeugt werden können.

Unser Kunde, ein österreichischer Winzer, befand sich vor der Wahl zwischen zwei zum Kauf stehenden Weinbergen. Dabei hat er von jedem Weingut in Laufe einer Woche mehrere (drei) Bodenproben erhoben und diese auf ihre chemische Zusammensetzung analysieren lassen. Unsere Aufgabe bestand darin, die Daten statistisch zu analysieren und dem Kunden dadurch zu helfen, die optimale Kaufentscheidung zu treffen.

Projektverlauf und Auswertung

Bei jeder Analyse ist die Wahl des passenden statistischen Modells eine Hauptherausforderung und zugleich ein wichtiger Erfolgsfaktor.

Für die Projektsituation, bei der zwei Weingüter miteinander verglichen und die Bodenproben mehrmals genommen wurden, ist die Varianzanalyse (engl. MANOVA, Multivariate Analysis Of Variance) mit Messwiederholungen ein optimales Modell. Da es um mehrere chemische Merkmale geht, gibt es in diesem Fall multiple abhängige Variablen (y), die von zwei unabhängigen Variablen (Faktoren, x für Weingut und t für Zeitpunkt) beeinflusst werden:

Zweifaktorielles MANOVA Design mit Messwiederholungen.
Abb. 1: Zweifaktorielles MANOVA Design mit Messwiederholungen

Die obenstehendenn Variablen sind Bodenproben, die drei Mal genommen wurden. Dadurch, dass diese an den gleichen Stellen genommen wurden, sind die y-Variablen miteinander korreliert. In dieser Situation hat MANOVA mehr statistische Power als separat durchgeführte ANOVA Modelle und kontrolliert den α-Fehler I Art. Genauso wie bei der klassischeren Varianzanalyse, müssen vor der Durchführung der MANOVA einige Voraussetzungen geprüft werden, wie z.B. die Normalität der Residuen in jeder Gruppe, die Homogenität der Varianzen und Abweiseinheit der Ausreißer – diese Checks sind Bestandteile von vielen statistischen Softwarepaketen.

Die Statistiksoftware Stata verfügt über bereits vorprogrammierte Werkzeuge für die (M)ANOVA Analyse. Im untenstehenden Code zeigen wir die Modellschätzung und Prüfung der oben aufgelisteten Voraussetzungen:

Im Rahmen der MANOVA wird für die Hypothesenprüfung der F-Test herangezogen, wobei bei dem signifikanten Ergebnis (p-Wert < 0.05 bei α=5%) kann man davon ausgehen, dass zwischen den Gruppen nachgewiesene Unterschiede bestehen.

Ergebnis und Lieferung

Am Ende des Projektes konnten wir dem Kunden ein statistisches Modell und Ergebnisse inklusive der Stata Codierung sowie eine ausführliche und detaillierte Interpretation präsentieren. So sehen Sie zum Beispiel die Stata F-Test Ausgabe, aus der ersichtlich wird, dass die Ergebnisse höchstsignifikant sind:

Stata MANOVA Ausgabe: F-Tests (multivariat)
Abb. 2: Stata MANOVA Ausgabe: F-Tests (multivariat).

Darüber hinaus haben wir eine Vielzahl von Visualisierungen erstellt, wie z.B. den untenstehenden Boxplot, um die Interpretation der Ergebnisse zu vereinfachen.

Boxplot der abhängigen Variablen für drei Zeitpunkte
Abb. 3: Boxplot der abhängigen Variablen für drei Zeitpunkte.

Wir sind somit gezielt auf die für den Kunden relevanten Aspekte eingegangen und konnten statistisch belegen, dass ein Weingut tatsächlich bessere Bodenprobenwerte aufweist, als das andere, was für die finale Kundenentscheidung über den Kauf entscheidend war.