Data Crunching

Was bedeutet Data Crunching?

Bei Data Crunching handelt es sich um einen Begriff aus der Informationswissenschaft. Er bedeutet übersetzt zunächst nichts anderes als Datenverarbeitung. Bezeichnet wird damit eine Methode zur automatisierten Verarbeitung von großen Mengen an Daten und Informationen. Dabei umfasst Data Crunching sowohl die Vorbereitung wie auch die Modellierung des hierfür eingesetzten Systems bzw. der genutzten Anwendung.

Ziel ist es, die Daten so aufzubereiten und zu strukturieren, dass diese anschließend mit Algorithmen und automatisierten Programmabläufen bearbeitet werden können. Data Crunching bezeichnet somit solche Daten, die beriets in ein System importiert und von diesem bearbeitet wurden. In diesem Bereich werden häufig auch die Begriffe Data Wrangling oder Data Munging verwendet. Im Unterschied zum Data Crunching erfolgt die Bearbeitung hierbei allerdings manuell bzw. halbautomatisch.

Hintergrund von Data Crunching

 

Big Data gewinnt in der heutigen Zeit immer mehr an Bedeutung. Um am Markt erfolgreich zu sein müssen Unternehmen und Organisationen auf Basis großer Datenmengen fundierte Entscheidung treffen. Data Crunching nimmt hierbei eine wichtige Rolle ein. Zu den wichtigsten Anwendungsbereichen gehören Finanzwesen, Kriminalistik, Biologie, Medizin, Physik sowie die Webanalyse. Je nach Einsatz werden beim Data Crunching unterschiedliche Programmiersprachen und Systeme genutzt. Früher waren dies in erster Linie Shell, Excel oder Batch, mittlerweile kommen hauptsächlich die Sprachen Java, Ruby oder Phyton zum Einsatz.

Die Ordnung der Daten

Data Crunching ist die Antwort auf Big Data. Es geht darum, in großen Mengen importierte Daten zu strukturieren.

Wie funktioniert Data Crunching?

Beim Crunching geht es ausschließlich um die korrekte Verarbeitung von Daten. Die generierten Datensätze und Formate müssen anschließend vom genutzten System weiterverarbeitet werden können. Für die Visualisierung oder Analyse der verwendeten Daten kommen dagegen speziell auf den jeweiligen Bereich zugeschnittene Programme zum Einsatz. Der Prozess erfolgt deshalb vor der eigentlichen Analyse. Wie die Analyse kann auch Crunching Data iterativ sein. Dies ist insbesondere bei neuen Daten oder Fehlern der Fall. Die einzelnen Abläufe werden dann solange wiederholt, bis sich das gewünschte Ergebnis einstellt.

Einsatz in der Praxis

Der Ablauf erfolgt beim Data Crunching im Wesentlichen in drei Schritten:

  • Einlesen der Rohdaten
  • Übertragung in das gewünschte Format
  • Ausgabe der entsprechend formatierten Daten

Die Daten können nun je nach Bedarf analysiert und weiterverarbeitet werden. Der große Vorteil dieser Aufteilung liegt in der Möglichkeit, die Daten für verschiedene Szenarien einsetzen zu können.

Mögliche Einsatzzwecke von Crunching:

  • Übertragung von einem Format in ein anderes beispielsweise von Plain Text in XML Datensätze.
  • Weitererarbeitung der vererbten Daten im selben Programmcode.
  • Das Extrahieren der Rohdaten zur späteren Weiterverarbeitung.
  • Korrektur von Fehlern in den Datensätzen.

Verwendung im Online Marketing

In den Bereichen SEO, Webdesign, Webanalyse und Online Marketing kommt es sehr häufig zu Problemfällen, welche sich mittels Data Crunching lösen lassen. Vor allem große Online Shops stehen vor der Herausforderung, riesige Datenmengen sinnvoll zu bearbeiten. So kommt es beispielsweise vor, dass mehrere 10.000 Datensätze von einer relationalen Datenbank in ein anderes Format übertragen werden müssen.

Dies ist erforderlich, damit die Produkte anschließend im Frontend des Shops den Kunden präsentiert werden können. Data Crunching ist hier bei den einsetzbaren Möglichkeiten zumeist die erste Wahl. Insbesondere was die Herausforderungen beim Umgang mit Big Data betrifft, wird das Crunching von großen Datenmengen immer wichtiger. Je größer die Menge an zu verarbeitenden Daten ist, desto mehr Zeit lässt sich durch das Crunching einsparen.

Ohne Daten ist alles nichts

Eine sinnvolle Aufbereitung durch Data Crunching ist im Internet-Handel elementar. Page Impressions, Kaufabrüche, Suchanfragen, verwendete Filter liefern aggregiert Hinweise auf Nutzerverhalten und Kundenwünsche und gewinnen durch anschließendes Data Mining eminent strategischen Wert.

Weitere Einsatzmöglichkeiten

Durch die Kombination mit den richtigen Programmen können umfangreiche Programmabläufe wesentlich vereinfachen. Zugleich haben Unternehmen die Möglichkeit Daten detailliert und auf den jeweiligen Bedarf zugeschnitten auszuwerten. Eine weitere Einsatzmöglichkeit ist die
Identifizierung von Stammkunden direkt aus der Bestellhistorie heraus. Durch die Einteilung in unterschiedliche Zielgruppen können diese anschließend individuell mit Werbebriefen angeschrieben werden. Natürlich lassen sich auch Kunden herausfiltern, die seit längerer Zeit keine Bestellung mehr getätigt haben. Hier können dann beispielsweise besondere Aktionen oder Gutscheine beworben werden.

Fazit

Ein professionell geführter Retailer steht bei einem kontinuierlichen Wachstum unweigerlich vor stetig wachsenden Datenmengen. Auch andere Online-Unternehmen im Ecommerce werden mit regelrechten Daten-Tsunamis überflutet. Wer heute noch diesen Daten-Massen produktiv Herr werden möchte, kommt um Data Crunching nicht herum.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenlose SEO Analyse


Weitere Inhalte

Kostenloses SEO Tool Performance Suite