Data Mining wird auch als intelligente Datenanalyse bezeichnet. Dabei werden nicht nur Daten aus der Vergangenheit analysiert und interpretiert, sondern auch Vorhersagen für die Zukunft getroffen.

Sollten Sie Unterstützung bei einem Data Mining Projekt benötigen, helfen Ihnen unsere Statistiker gerne weiter. Nutzen Sie einfach unser Kontaktformular für eine kostenlose Beratung & ein unverbindliches Angebot – oder rufen Sie uns an.

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.

Jetzt unverbindlich anfragen

Unser Data Mining Service im Detail

Wir unterstützen gerne Ihr Data Mining Projekt mit folgenden Dienstleistungen:

  • Data Mining Beratung: Wir unterstützen Sie in allen Phasen der Planung und Durchführung Ihres speziellen Data Mining-Projektes.
  • Predictive Modeling: Aufgrund der Data Mining-Ergebnisse erstellen wir Prognosen. Zielführendes Vorgehen verlangt hierbei hohe Expertise und geht weit über eine einfache Extrapolation in die Zukunft hinaus.
  • Data Mining Methoden: Welche Data Mining Methode und welches Werkzeug ist für Ihre Fragestellung am besten geeignet? Wie explorieren Sie Ihre Daten optimal? Wie finden Sie Muster in Ihren Daten? Wir unterstützen Sie bei der Auswahl des bestmöglichen Verfahrens oder wenden es in Ihrem Auftrag an.
  • Big Data Mining: Damit Ihr Data Mining auch bei hohen und komplexen Datenmengen noch effizient funktioniert, helfen wir bei der Skalierung Ihrer Verfahren.
  • Data Mining Deployment: Das Data Mining dient nicht nur dem Wissenszuwachs, sondern vor allem einem praktischen Zweck: Die gewonnenen Ergebnisse müssen nutzbringend angewendet werden, beispielsweise durch Segmentierung der Kunden in Kategorien, die jeweils verschieden behandelt werden sollen, oder um eine angemessene Reaktion auf künftige Entwicklungen zu fundieren. Wir helfen Ihnen gerne, für das Data Mining Deployment ein erfolgssicheres Konzept zu erstellen und umzusetzen.
  • Visualisierung & Aufbereitung: Data Mining produziert große Mengen an Ergebnissen. Wir übernehmen deren übersichtliche, anschauliche und zielgruppengerechte Darstellung.

Die Phasen des Data Mining

Beim Data Mining exploriert man Daten iterativ, das heißt, man tastet sich an die Ergebnisse heran. Man unterscheidet dabei folgende Phasen, welche beliebig oft wiederholt werden können:

1. Datenauswahl und -bereinigung: Die zu analysierenden Daten werden selektiert und gegebenenfalls vorhandene unvollständige oder nicht plausible Datensätze beseitigt. Gegebenenfalls werden die Daten in ein anderes Format umgewandelt.

2. Datenexploration: Für große Datenmengen ist eine systematische Suche zu zeitaufwändig, weswegen heuristische Suchverfahren Verwendung finden. Hierbei surft man durch die Daten, zoomt an interessanten Stellen heran und dann wieder heraus und betrachtet die Daten aus verschiedenen Perspektiven um konkrete Erwartungen bestätigt zu finden oder sich durch die Ergebnisse überraschen zu lassen. Die Datenexploration wird durch Visualisierungstools unterstützt, welche die bildliche Darstellung der Daten und ihrer Eigenschaften in mehreren Dimensionen, Farben und Formen ermöglichen. Verfahren der künstlichen Intelligenz können Zusammenhänge aufzeigen, die dem menschlichen Auge verborgen bleiben.

3. Modellbildung: Bei der Exploration entdeckt man Muster, Zusammenhänge und Korrelationen von Daten. Diese sind entweder optisch sichtbar oder werden durch Verfahren der Datenanalyse oder künstlicher Intelligenz offenbart. Um festzustellen, ob die gefundenen Datenbeziehungen auch tatsächlich vorhanden und statistisch signifikant sind, werden die zugrundeliegenden Vermutungen und Hypothesen mathematisch ausgedrückt, etwa durch Wenn-dann-Schlussfolgerungen, komplexe Logikformeln, Korrelationen zwischen Variablen, mathematische Formeln, Kategorien oder Entscheidungsbäume.

4. Evaluation: Nun werden die Hypothesen anhand der vorhandenen oder auch weiterer Daten unter Einsatz der üblichen statistischen Verfahren geprüft.

5. Anwendung:Die gefundenen Muster werden dazu genutzt, um beispielsweise Prognosen zu erstellen oder Marketingstrategien zu entwickeln.

Womit befasst sich das Data Mining?

Statistische Verfahren dienen dem Zweck, genau vordefinierte Hypothesen zu überprüfen oder vermutete Korrelationen zwischen zwei und mehr Variablen nachzuweisen. Das Data Mining muss hingegen auch explorativ einsetzbar sein, d.h. ohne festgelegte Erwartungen zu bestätigen oder zu widerlegen.
Data Mining Verfahren sind effizienter als die klassischen statistischen Auswertungen und können Korrelationen zwischen allen Daten suchen, Cluster von irgendwie ähnlichen Datensätzen entdecken und zeitliche oder geografische Muster finden. Hierfür werden spezielle Verfahren, effiziente (z.B. parallelisierte und verteilte) Algorithmen, Verfahren der Datenvisualisierung und künstliche Intelligenz zum Einsatz gebracht.

Wo wird Data Mining eingesetzt?

Data Mining kann große Datenmengen (z.B. Big Data) effizient durchsuchen und dabei nicht nur solche Korrelationen finden, die man bereits vermutet hat, sondern auch ganz unerwartete. Damit ist es das ideale Verfahren, um Datenschätze zu heben, die Firmen im Verlauf ihrer Geschäftstätigkeit unbeabsichtigt oder durch Webseiten-Tracking gezielt ansammeln.
Zu den regelmäßig anfallenden Informationen gehören die Stamm- und Bewegungsdaten der Kunden, mit denen sich ermitteln lässt, in welchem Postleitzahlen-Gebiet besonders viele oder nur wenige Kunden wohnen, wer wieviel und was bestellt, wie zuverlässig die Rechnungen bezahlt werden, in welchen Monaten welches Produkt am häufigsten gekauft wird, welche Produkte immer dieselben Kunden kaufen und so weiter. So lassen sich Kunden-Kategorien bilden und gezielt Werbemaßnahmen und Rabatte lancieren, die nur für einzelne Marktsegmente gelten sollen.
Weitere interessante Daten sind solche, die bei der Produktion und Qualitätssicherung von Produkten entstehen: Wie lange dauert die Herstellung eines Produkts von der Anlieferung des Materials bis zur Auslieferung an den Kunden? Welcher Arbeitsschritt dauert am längsten? Welchen Durchsatz hat welcher Schritt und wo wird die Produktivität durch Engpässe begrenzt? Wo entsteht am meisten Ausschuss?
Das Tracking einer Webseite erzeugt zusätzliche Informationen darüber, wie Besucher auf diese gelangt sind (z.B. über welche Werbeanzeigen oder -mails, Webportale oder Suchmaschinen), was sie interessiert und was nicht, auf welche Stichworte sie klicken und welche Unterseiten sie am aufmerksamsten lesen. Damit erhalten Unternehmen eine direkte, unverfälschte Rückmeldung zur Wirksamkeit von Werbemaßnahmen und der Attraktivität von Webseiten-Inhalten.
Obgleich Data Mining vor allem mit gewerblichen Anwendungen in Verbindung gebracht wird, können auch wissenschaftliche Daten und Studien von diesem Verfahren enorm profitieren und neue Erkenntnisse zutage fördern, seien es Strahlungen aus dem Weltall oder Daten eines Teilchenbeschleunigers, Patientendaten eines Krankenhauses oder Herztöne aus der EKG-Aufzeichnung.
Tatsächlich bestehen unendlich viele Anwendungsmöglichkeiten von Data Mining, das jede Art von Daten strukturieren und Erkenntnisse hervorbringen kann.