Data Mining kann aus den vorhandenen Daten nicht nur Schlussfolgerungen über die Vergangenheit ziehen wie z.B. „Wer einmal pro Woche Sport treibt, hatte um 4% seltener die Krankheit X“
Sondern auch mit den entsprechenden Methoden Vorhersagen über die Zukunft machen wie: „Wer Krankheit X noch nicht hat und jetzt sofort beginnt, einmal wöchentlich Sport zu treiben, wird mit 3% geringerer Wahrscheinlichkeit an Krankheit X erkranken“.
Ähnliche Vorhersagen interessieren natürlich in allen Bereichen des Data Mining, z.B. auch im Marketing (Wer wird was kaufen?), Finanzwesen (Wer wird seinen Kredit mit welcher Wahrscheinlichkeit zurück bezahlen?), bei Versicherungen, im Gesundheitswesen (Vorhersage von „Patientenkarrieren“), Verkehrswesen, Produktion und im Management. Die Methoden des Predictive Modeling im Data Mining können jedoch auch Schlussfolgerungen in die Vergangenheit zurück unterstützen wie z.B. die Aufdeckung von Verbrechen.
Sollten Sie Unterstützung bei einem Data Mining Projekt benötigen, helfen unsere Statistiker Ihnen gerne weiter. Nutzen Sie einfach unser Kontaktformular für eine kostenlose Beratung & ein unverbindliches Angebot – oder rufen Sie uns an.
Die Herausforderungen des Predictive Modeling im Data Mining
Vorhersagen sind grundsätzlich schwierig. Eine einfache Extrapolation in die Zukunft genügt hierzu nicht. Unter anderem müssen die vorhersehbaren Veränderungen im Umfeld mit einberechnet werden. Eine Hauptschwierigkeit liegt auch in der Vollständigkeit, Qualität und Konsistenz der zugrunde liegenden Daten. Aus unsauberen Daten kann selbst das beste Predictive Data Mining Verfahren keine verlässige Prognose berechnen.
Was sind mögliche Methoden beim Predictive Modeling?
Die passenden Data Mining Methoden für die Vorhersage sollte mit größter Sorgfalt ausgewählt werden. Deshalb ist die Wahl der Methode erst nach einer gründlichen Data Mining Beratung möglich.
Beliebte Methoden sind folgende:
- Diverse Bayes-Verfahren, z.B. der Naive Bayes-Algorithmus und der Adaptive Bayes Netzwerk (ABN) Algorithmus,
- Decision trees (Entscheidungsbaum),
- Support Vector Machines,
- Clustering,
- Regeln,
- Zeitserien (Time Series),
- Verschiedene Regressionsverfahren wie z.B. die Methode der kleinsten Fehlerquadrate,
- Neuronale Netze und künstliches Lernen.
Es können auch die Ergebnisse verschiedener Verfahren durch gewichtetes Summieren oder durch Meta-Learning in einem neuronalen Netz miteinander kombiniert werden.
Novustat unterstützt Ihr Predictive Modeling Projekt
Damit Sie trotz dieser Herausforderungen die bestmöglichen und gültigen Prognosen für die Zukunft erstellen können, sollten Sie sich durch Experten unterstützen lassen, denn vier Augen sehen mehr als zwei. Unsere Data Mining Experten stehen Ihnen gerne mit Rat und Tat zur Seite, bei der Datenexploration, dem Aufstellen und Prüfen der Hypothesen über die Zukunft sowie dem Deployment, d.h. die Anwendung der Vorhersage auf neue Daten. Wir erstellen Ihre Auswertung oder begutachten sie und stehen Ihnen für alle Schritte als Diskussionspartner zur Verfügung.