Data Mining

Was ist Data Mining?

Beim Data Mining handelt es sich um die Analyse vorhandener Datenbestände, beispielsweise zum Auffinden von Trends, Mustern und Zusammenhängen. Die zugrunde liegenden Informationen befinden sich in Datenbanken und Data-Warehouses. Die Automatisierung der Geschäftsprozesse und das automatische Aufzeichnen und Verwenden von Daten führen zu immer weiter wachsenden Datenbeständen.

Typische Vorgänge für diese automatischen Datenerfassungen sind Scannerkassen in Supermärkten, Kreditkarten-Transaktionen und sogar Telefongespräche. Hinzu kommen die technischen Fortschritte, was die Datenspeicherung betrifft, die sinkenden Preise der Speichermedien und die steigende Performance der Datenbanksysteme. Das Data Mining gehört zu den Verfahren, mit denen aus der ständig wachsenden Datenmenge und -Vielfalt anhand von Algorithmen, Statistiken, künstlicher Intelligenz und Programmen notwendiges Wissen extrahiert wird.

Data Crunching und Data Mining

Data Crunching zeigt dem Unternehmen, was ist. Data Mining sagt, was morgen zu tun ist.

Anwendungsgebiete des Data Mining

Im direkten Vergleich zum Controlling gibt das Data Mining nicht nur den Status Quo des Unternehmens an, sondern ist in der Lage, Prognosen für zukünftige Szenarien zu erstellen. Für einen Online-Shop bedeutet dies zum Beispiel, aufgrund der gesammelten Daten zu Kunden, Produkten, zum Kunden- und Einkaufsverhalten Schlüsse zu ziehen, um den Verkauf und das Verhalten der Besucher effizienter zu gestalten.

Darüber hinaus kann Data Mining bestimmte Sachverhalte erklären oder beschreiben. Versicherungen und Banken nutzen die Möglichkeit, Risikoanalysen durchzuführen. Auch in der Verbrechensbekämpfung und in der Medizin wird Data Mining eingesetzt.

Die Analyse virtueller Warenkörbe zielt häufig auf die Conversion-Optimierung ab. Auch lassen sich Merkmale bestimmen, die den Erfolg einer Website oder eines Online-Shops aufzeigen. Zu den weiteren Anwendungszielen gehören:

  • die Klassifizierung und Gruppierung der Daten anhand gemeinsamer Merkmale
  • die Segmentierung des Marktes bzw. der Märkte
  • die Erstellung von Kundenprofilen, beispielsweise hinsichtlich des Affiliate Marketing
  • Prognosen zu Vertragslaufzeiten, Produktpreisen und Produktnachfragen
  • die Analyse von Abhängigkeiten und Abweichungen
  • Fehlerdiagnosen, beispielsweise im Verkaufsprozess

Einen sehr hohen Stellenwert genießt Data Mining hinsichtlich des Cross Selling, das auch Amazon als Verkaufstool nutzt. Häufig können dem Kunden zusätzliche Artikel zu dem gewählten Produkt angeboten werden, wodurch die Umsatzzahlen steigen. Bei der Programmierung der Algorithmen sind bestimmte Faktoren zu berücksichtigen, zum Beispiel saisonale Differenzen.

Analyseverfahren im Data Mining

Beim Data Mining werden folgende Analyseverfahren eingesetzt:

Nach dem Aufstellen von Hypothesen und Lösungsansätzen können Richtlinien bzw. Regeln für die Datenauswertung abgeleitet werden. Neben einfachen Wenn-Dann-Bedingungen sind auch komplexe Abfrageserien bis hin zu neuronalen Netzen erstellt werden.
In der Regel erfolgt der Zugriff auf die vorhandenen Daten über Schnittstellen. Gleichzeitig werden die Daten in Segmente unterteilt und in eigene Datenbanken eingearbeitet. Diese Verfahrensweise kann beispielsweise auch mit Google Analytics realisiert werden.
Die ermittelten Ergebnisse und Lösungen werden von Programmen anhand geeigneter Verfahren weiter durchsucht, um die optimalen Ergebnisse zu bestimmen.
Jedes per Data Mining entdeckte Muster wird hinsichtlich seiner Relevanz bewertet und eingestuft. So können beispielsweise Abweichungen von einem bestimmten Regelfall wichtige Hinweise auf Komplikationen in Unternehmensprozessen geben.
Jedes per Data Mining entdeckte Muster wird hinsichtlich seiner Relevanz bewertet und eingestuft. So können beispielsweise Abweichungen von einem bestimmten Regelfall wichtige Hinweise auf Komplikationen in Unternehmensprozessen geben.

Algorithmen reagieren häufig sensibel auf gewisse Eigenschaften der Daten. Dazu gehören zum Beispiel so genannte Ausreißer, ein- oder ausgeschlossene Datenwerte oder die Datencodierung selbst. Algorithmen sind zum Teil sehr speziell modelliert und passen nicht zu jedem Verwendungszweck. Das Unternehmen muss daher zwingend seine Daten beherrschend, um die richtigen Modelle erstellen zu können.

Data Mining versus Big Data

Die Begriffe Data Mining und Big Data sind sorgfältig voneinander zu trennen. Big Data bearbeitet extrem große Datenmengen, deren Verarbeitung mit herkömmlichen Methoden und Werkzeugen nicht effizient ist. Data Mining befasst sich zwar ebenfalls mit großen Mengen an Daten, kann dabei jedoch die technischen Grenzen des Big Data deutlich überschreiten.

Big Data liefert große Datenmengen und stellt für die Verarbeitung geeignete technische Plattformen zur Verfügung. Das Data Mining arbeitet mit eben diesen Daten, um Erkenntnisse daraus zu gewinnen. Die Fortschritte im Bereich der Big-Data-Technologie und die immer leistungsfähigere und preiswerte Hardware ermöglichen einen stetig steigenden Nutzen aus strukturierten und nicht strukturierten Datenmengen. Daraus ergeben sich immer bessere Resultate hinsichtlich der Datenrelevanz.

Sonderform Text Mining

Text Mining nutzt im Grundsatz die selben Verfahren. Allerdings wird hier nicht auf strukturierte Datensätze zugegriffen, sondern in erster Linie auf unstrukturierte Textdaten. Mit Text Mining lässt sich Wissen aus komplexen Textbeständen extrahieren, ohne dass der Anwender sich detailliert mit den Inhalten des Textes befassen muss. So kann eine große Anzahl von Fachartikeln nach wesentlichen Inhalten für Projekte durchsucht werden. Da viele relevante Informationen innerhalb eines Unternehmens in Textform vorliegen, ist Text Mining hinsichtlich seiner Bedeutung nicht zu unterschätzen.

Data Mining und SEO

Für die Suchmaschinenoptimierung ist Data Mining ein wertvolles Werkzeug. Unternehmen benötigen ein ausgeprägtes Wissen darüber, was ihre Kunden wünschen und wie sie diese Wünsche erfüllen können. Die Analyse der Zielgruppen auf Vorlieben, Bedürfnisse und Abneigungen ist heutzutage starken statistischen Schwankungen unterworfen. Die Kluft zwischen den Angeboten der Unternehmen und den Werten und Anforderungen der Kunden scheint sich stetig zu erweitern.

Wo früher “Einweg-Botschaften” in Form von Werbung per Radio, Fernsehen und Zeitung ausreichen mussten, bietet das Social Media den Kunden heute unendlich viele Möglichkeiten, mit den Unternehmen direkt zu kommunizieren und Feedback zu Produkten und Dienstleistungen zu geben. Die Unternehmen können dieses Kommunikationsfeld nur kontrollieren, indem sie enge Verbindungen gegenüber ihren Kunden entwickeln und echtes Vertrauen zu ihren Angeboten aufbauen. Um diese Ziele zu erreichen, benötigen die Unternehmen Daten, die außerdem klar interpretiert werden müssen.

Darüber hinaus zeigt sich beispielsweise der Keyword Planer als effektives Tool, um Webseiten-Content zu optimieren und die Anzahl der Besucher sowie deren Verweildauer signifikant zu erhöhen. Der Keyword Planer weist nicht nur die relevanten Keywords aus, sondern erlaubt zusätzlich einen Zugriff auf Suchbegriffe, die direkt oder indirekt mit dem Keyword in Zusammenhang stehen.
Anhand der Datensammlung von Google kann das Unternehmen außerdem weitere Faktoren ermitteln, zum Beispiel die Stärke der Mitbewerber. Zugriffszahlen und hochwertige Informationen zur Konkurrenz müssen bekannt sein, soll die eigene Website gut positioniert werden. Data Mining kann per Webanalyse-Tools zusätzlich zur Optimierung herangezogen werden.

Fazit

Data Crunching ist der Anfang, Data Mining die Konsequenz. Wer Daten zukunftsweisend deuten und handlungsleitend interpretieren möchte, kommt um Data Mining nicht herum.


Sie haben noch Fragen?

Kontaktieren Sie uns

Free Account erstellen


Weitere Inhalte