Data Crunching

Was bedeutet Data Crunching?

Bei Data Crunching handelt es sich um einen Begriff aus der Informationswissenschaft. Er bedeutet übersetzt zunächst nichts anderes als Datenverarbeitung. Bezeichnet wird damit eine Methode zur automatisierten Verarbeitung von großen Mengen an Daten und Informationen. Dabei umfasst Data Crunching sowohl die Vorbereitung wie auch die Modellierung des hierfür eingesetzten Systems bzw. der genutzten Anwendung.

Ziel ist es, die Daten so aufzubereiten und zu strukturieren, dass diese anschließend mit Algorithmen und automatisierten Programmabläufen bearbeitet werden können. Data Crunching bezeichnet somit solche Daten, die beriets in ein System importiert und von diesem bearbeitet wurden. In diesem Bereich werden häufig auch die Begriffe Data Wrangling oder Data Munging verwendet. Im Unterschied zum Data Crunching erfolgt die Bearbeitung hierbei allerdings manuell bzw. halbautomatisch.

Hintergrund von Data Crunching

Big Data gewinnt in der heutigen Zeit immer mehr an Bedeutung. Um am Markt erfolgreich zu sein müssen Unternehmen und Organisationen auf Basis großer Datenmengen fundierte Entscheidung treffen. Data Crunching nimmt hierbei eine wichtige Rolle ein. Zu den wichtigsten Anwendungsbereichen gehören Finanzwesen, Kriminalistik, Biologie, Medizin, Physik sowie die Webanalyse. Je nach Einsatz werden beim Data Crunching unterschiedliche Programmiersprachen und Systeme genutzt. Früher waren dies in erster Linie Shell, Excel oder Batch, mittlerweile kommen hauptsächlich die Sprachen Java, Ruby oder Phyton zum Einsatz.

Wie funktioniert Data Crunching?

Beim Crunching geht es ausschließlich um die korrekte Verarbeitung von Daten. Die generierten Datensätze und Formate müssen anschließend vom genutzten System weiterverarbeitet werden können. Für die Visualisierung oder Analyse der verwendeten Daten kommen dagegen speziell auf den jeweiligen Bereich zugeschnittene Programme zum Einsatz. Der Prozess erfolgt deshalb vor der eigentlichen Analyse. Wie die Analyse kann auch Crunching Data iterativ sein. Dies ist insbesondere bei neuen Daten oder Fehlern der Fall. Die einzelnen Abläufe werden dann solange wiederholt, bis sich das gewünschte Ergebnis einstellt.

Einsatz in der Praxis

Der Ablauf erfolgt beim Data Crunching im Wesentlichen in drei Schritten. Als Erstes werden zunächst die Rohdaten eingelesen. Anschließend erfolgt die Übertragung in das gewünschte Format. Zum Abschluss werden die Daten im entsprechenden Format ausgegeben. Die Daten können nun je nach Bedarf analysiert und weiterverarbeitet werden. Der große Vorteil dieser Aufteilung liegt in der Möglichkeit, die Daten für verschiedene Szenarien einsetzen zu können.

Mögliche Einsatzzwecke von Crunching:

  • Übertragung von einem Format in ein anderes beispielsweise von Plain Text in XML Datensätze.
  • Weitererarbeitung der vererbten Daten im selben Programmcode.
  • Das Extrahieren der Rohdaten zur späteren Weiterverarbeitung.
  • Korrektur von Fehlern in den Datensätzen.

Verwendung im Online Marketing

In den Bereichen SEO, Webdesign, Webanalyse und Online Marketing kommt es sehr häufig zu Problemfällen, welche sich mittels Data Crunching lösen lassen. Vor allem große Online Shops stehen vor der Herausforderung riesige Datenmenge sinnvoll zu bearbeiten. So kommt es beispielsweise vor, dass mehrere 10.000 Datensätze von einer relationalen Datenbank in ein anderes Format übertragen werden müssen. Dies ist erforderlich, damit die Produkte anschließend im Frontend des Shops den Kunden präsentiert werden können. Data Crunching ist hier bei den einsetzbaren Möglichkeiten zumeist die erste Wahl. Insbesondere was die Herausforderungen beim Umgang mit Big Data betrifft, wird das Crunching von großen Datenmengen immer wichtiger. Je größer die Menge an zu verarbeitenden Daten ist, desto mehr Zeit lässt sich durch das Crunching einsparen.

Weitere Einsatzmöglichkeiten

Durch die Kombination mit den richtigen Programmen können umfangreiche Programmabläufe wesentlich vereinfachen. Zugleich haben Unternehmen die Möglichkeit Daten detailliert und auf den jeweiligen Bedarf zugeschnitten auszuwerten. Eine weitere Einsatzmöglichkeit ist die Identifizierung von Stammkunden direkt aus der Bestellhistorie heraus. Durch die Einteilung in unterschiedliche Zielgruppen können diese anschließend individuell mit Werbebriefen angeschrieben werden. Natürlich lassen sich auch Kunden herausfiltern, die seit längerer Zeit keine Bestellung mehr getätigt haben. Hier können dann beispielsweise besondere Aktionen oder Gutscheine beworben werden.


Sie haben noch Fragen?

Kontaktieren Sie uns

Kostenlose SEO Analyse


Weitere Inhalte