IT-ExpertenDie Datengräber

Gefragt und gefürchtet: Computerspezialisten ermitteln für Firmen die Wünsche ihrer Kunden. von Moritz Baumstieger

Wenn Inga Wolf erklären möchte, was sie beruflich macht, beginnt sie zu malen. Ein Häuschen, in dem eine kleine Figur steht. "Ein Tante-Emma-Laden", sagt Inga Wolf. Unter das Häuschen kommt ein großes Viereck, in ihm viele kleine Kästchen. "Und das ist ein großer Supermarkt, so ein Wellblech-Palast im Gewerbegebiet." Die kleinen Kästchen, das sind die Kassen.

Tante Emma, erklärt Wolf, wusste, was Herr Meier gerne für einen Wein trinkt und dass Frau Schneider immer darauf achtet, was gerade im Angebot ist. Man kannte sich eben. Das gehe im Supermarkt nicht, "und außerdem: Vielleicht lag Tante Emma ja bei Herrn Meier und Frau Schneider richtig – aber wusste sie, was jüngere Kunden gerne im Sortiment gehabt hätten?"

Anzeige

Inga Wolf weiß das auch nicht, aber wenn sie will, kann sie es ausrechnen. Im Auftrag des Daten-Dienstleisters Emnos hilft sie Supermarktketten auf der ganzen Welt dabei, Tante Emma in ihrer größten Stärke sogar noch zu übertreffen: den Kunden zu kennen, mit seinen Gewohnheiten und Wünschen. Dazu verlässt sie sich auf Zahlen: Über das große Viereck für den Supermarkt hat sie noch ein kleineres gemalt. Den Kassenbon, mit vielen Details. Neben dem Geld lassen die Kunden viele Daten an der Kasse – von der Nummer der Kundenkarte über Datum und Uhrzeit des Einkaufs bis hin zur Kennung der Artikel.

Die Datengräber wissen, wie die Pizzen angeordnet werden müssen

Informationen wie diese sammeln viele Firmen und Institutionen seit langer Zeit: Internetseiten dokumentieren das Surfverhalten und was ihre User einstellen, Handelsketten die aktuellen Regalbestände, Staumelder horten Verkehrsdaten. Viele erhoben solche Daten bislang, ohne richtig zu wissen, was sie damit anfangen sollen – die Menge der Informationen war zu groß, ihre Ordnung zu gering. Das ändert sich nun: "Big Data" – so bezeichnet man diese ungeheuren Mengen an Informationen – ist in der IT-Branche ein neues Modewort geworden. Auf der Cebit, die nächsten Dienstag in Hannover beginnt, ist Big Data eines der fünf wichtigen Trendthemen. Experten rechnen 2013 mit einem Umsatzzuwachs von 38 Prozent bei den Datenanalysten.

Um die Informationsflut sinnvoll auszuwerten, braucht man Spezialisten wie Inga Wolf und ihren Kollegen Harald Dietrich. Man nennt ihren Beruf Data Miner, angelehnt an die Bergleute, die Stollen ins Gestein treiben, um an Rohstoffe zu gelangen. Eine Ausbildung oder ein spezielles Studium gibt es dafür bisher nicht, die Data Miner nähern sich ihren Aufgaben aus verschiedenen Richtungen. "Man kann das als Student auch kaum üben", sagt Harald Dietrich, "welche Universität hat schon so riesige reale Datensätze zur Verfügung, mit denen man ein wenig rechnen könnte?" Bei Emnos arbeiten deshalb Software-Ingenieure, Physiker, Betriebswissenschaftler und sogar Geografen.

Emnos ist eine Tochter des Unternehmens Loyalty Partner, das mit der Payback-Karte Kunden an bestimmte Handelsketten zu binden versucht. Ähnliche Karten gibt es mittlerweile in vielen Ländern. Weil für das Rabattsystem jede Transaktion aufgezeichnet wurde, fielen exakte Informationen über das Einkaufsverhalten an. Seit 2003 analysiert Emnos die gesammelten Daten für seine Kunden "mit dem Ziel, Produkte ideal auszuwählen, zu platzieren, ihren Preis festzulegen und die Werbung zu optimieren".

Leserkommentare
  1. "In den Datenbergen verstecken sich jede Menge interessante Informationen und Zusammenhänge – und die Jagd darauf hat gerade erst begonnen."

    Ich mache ein Experiment: Vor mir habe ich ein weißes Blatt, darauf steht "Zeit-Online", darunter stehen viele farbige Kästchen, das sind die Leserkommentare, manche rot, d.h. Kritik, manche grün, also Zustimmung und andere schwarz, sie passen mir nicht.

    Auffällig die vielen schwarzen Kästchen, die wenigsten sind grün.

    Was bedeutet das? Irgendwie hat da jemand etwas falsch gemacht. Denn die schwarzen Kästchen bedeuten, der Leser ist unzufrieden, Payback bedeutet einen Leser weniger, einen ehemaligen Leser, der diese Botschaft an Dritte weitergibt.

    Fazit: auch mit einfachen Mitteln könnte man "Data-Mining" betreiben wie Tante Emma, denn die Schwäche von Emnos ist, dass unbekannte Erwartungen nicht erfasst werden.

    Eine genauere Analyse ergibt, der Kunde will Fakten, keine spekulative "Erzählungen", die seine Meinung lenken.

    2 Leserempfehlungen
  2. Data-Mining erfordert gründliche Kenntnisse in der Stochastik, und Stochastik ist das mit Abstand härteste Themengebiet das ich kennengelernt habe. Schwieriger zu verstehen als andere Gebiete der Mathematik.

    Fazit: Es wird nie genug Bewerber für solche Stellen geben und wer einen sicheren Job und gutes Einkommen will, der spezialisiert sich in Data-Mining.

    Reaktionen auf diesen Kommentar anzeigen
    • DDW
    • 22. April 2013 10:05 Uhr

    Wenn man Bayessche Netze versteht, dann hat man von Seiten der Stochastik schon 90% geschafft. Und das ist nicht wirklich schwierig.

    Den Rest macht man mit Maschinellem Lernen. Speziell supervised und unsupervised Learning. Damit schafft man schon eine Menge. Etwas komplexer ist das reinforcement Learning.

    Der Vorteil den man heute hat besteht in der immensen Rechenleistung, die schon in einem Desktop Rechner zur Verfügung steht. Man kann auf die schnelle seine Modelle berechnen lassen und gegebenenfalls anpassen. Früher ging das zwar auch schon. Zwischen einzelnen Durchläufen lagen dann allerdings Stunden oder die teuren Anlagen standen nicht zur Verfügung.

    Zudem stehen die benötigten Rechenprogramme als Open Source Software zur Verfügung. Und die eigentlichen Algorithmen sind auch erforscht (zumindest soweit um sie anwenden zu können) und bereits in Software gegossen. Dass man ein wenig Hand anlegen muss und das ganze nicht mit Excel bewältigt bekommt versteht sich von selbst. Aber "low-level" war einmal.

  3. sehr wichtig ist vor allem die Diskrete Mathematik, Statistik (damit man das ganze im kleinen versteht, SQL aber vorallem NOSQL, die entsprechenden Programme Mongo z.B., C und/oder Java. Und ein sehr gutes Verständnis für Datenbankstrukturen wäre auch ganz hilfreich. Aber das wichtigste Problemlösungsorientiertes Denken was man z.B. als Physiker oder Elektrotechniker lernt.

    Kann man nicht Studieren kann man sich aber im Studium zusammensuchen ;)

    Eine Leserempfehlung
    Reaktionen auf diesen Kommentar anzeigen

    ich glaube, die wesentliche Qualifikation für Data Miner ist die Kunst, die richtigen Fragen zu stellen und die richtigen Daten auszuwählen.

  4. Ja, in einer Welt, die zahlengläubig ist, sind Data MIner sicher gefragt. ich habe auch die ERfahrung gemacht, dass Daten oft einfach nur gesammelt und aufgehäuft werden, ohne dass daraus jemand eine Halndlungsrelevanz ableitet. Dann hat man viele schöne Listen, was sich wann wie oft verkauft hat, aber niemand kann sagen, welche Folgen das für eine Ladengestaltung haben könnte. Dies hinzubekommen, ist wirklich eine Kunst. Zumal der Auftrag an den Data Miner oft lautet: "Machen Sie mal einen Report". Die Fragestellung dazu darf man sich dann gerne selber ausdenken. Das ganze Fachgebiet steckt im Grunde noch in den Kinderschuhen. Man muss hier wirklich extrem interdisziplinär unterwegs sein, um ein guter Data Miner zu sein. Oft muss man sich die Rohdaten aus verschiedenen Quellen zusammentelefonieren, weil noch nie jemand eine Gesamtsicht gemacht hat. Ich finde den Beruf extrem faszinierend.

    Eine Leserempfehlung
  5. ich glaube, die wesentliche Qualifikation für Data Miner ist die Kunst, die richtigen Fragen zu stellen und die richtigen Daten auszuwählen.

    • DDW
    • 22. April 2013 10:05 Uhr

    Wenn man Bayessche Netze versteht, dann hat man von Seiten der Stochastik schon 90% geschafft. Und das ist nicht wirklich schwierig.

    Den Rest macht man mit Maschinellem Lernen. Speziell supervised und unsupervised Learning. Damit schafft man schon eine Menge. Etwas komplexer ist das reinforcement Learning.

    Der Vorteil den man heute hat besteht in der immensen Rechenleistung, die schon in einem Desktop Rechner zur Verfügung steht. Man kann auf die schnelle seine Modelle berechnen lassen und gegebenenfalls anpassen. Früher ging das zwar auch schon. Zwischen einzelnen Durchläufen lagen dann allerdings Stunden oder die teuren Anlagen standen nicht zur Verfügung.

    Zudem stehen die benötigten Rechenprogramme als Open Source Software zur Verfügung. Und die eigentlichen Algorithmen sind auch erforscht (zumindest soweit um sie anwenden zu können) und bereits in Software gegossen. Dass man ein wenig Hand anlegen muss und das ganze nicht mit Excel bewältigt bekommt versteht sich von selbst. Aber "low-level" war einmal.

    Antwort auf "Schwierig aber wahr"
  6. ne du das ist ja kein BWL Studium, sonst würde es ja mehr von den Leuten geben. Ich versuch zurzeit in die Richtung zu gehen beim Studieren und man lernt schnell das da inhaltlich deutlich mehr drin steckt. Man muss verschiedenste Bereiche können und Fähigkeiten besitzen.

  7. 8. Naja,

    wer sich dafür verkauft.....

    Welchen Sinn und Zweck hat dieser Job eigentlich? Das Menschen in ein Kaufrausch geraten und jede Menge unnützen Zeug kaufen? Würde man eigentlich jemanden direkt bezahlen, der einem sagt, was er umbedingt will? Tja, mit sowas tut man es (oder wer zahlt hier die Zeche für solch einen Schwachsinn?).

    Willkommen in der verblödeten Republik und die ZO macht auch noch mit!

    2 Leserempfehlungen
    Reaktionen auf diesen Kommentar anzeigen

    Hallo,
    leider wurde der Themenbereich des Data Minings hier relativ einseitig erläutert, es gibt weitere, meiner Meinung nach auch interessantere Einsatzmöglichkeiten.
    Hierzu zählen zum Beispiel Betrugsanalysen, Risikoanalysen, die Auswertung von Prozessdaten in Unternehmen und viele weitere Einsatzmöglichkeiten.

    Den Sinn der beschriebenen Tätigkeiten können Sie im Artikel nachlesen. Solange eine Tätigkeit für ein Unternehmen rentabel ist (heißt Kosten einspart oder Gewinn/Umsatz erhöht) wird es dieser nachgehen. Wenn Sie das nicht gut finden, müssen Sie ja bei dem Unternehmen nicht einkaufen. Es geht hier ja nicht darum, zusätzliche Daten zu erheben, sondern die bereits vorhandenen zu nutzen. Dass Unternehmen Verkaufszahlen speichern, dürfte jedem klar sein. Dies muss selbstverständlich im Einklang mit dem dt. Datenschutzgesetz stehen, aber solange dies eingehalten wird, ist daran nichts verwerfliches zu sehen.
    Wenn Sie damit wiederum nicht einverstanden sind, gehen Sie wählen oder selber in die Politik.

    Um auf den im Bericht angemerkten Mangel an spezialisierten Studiengängen einzugehen: Zum einen ist Data Mining an vielen Hochschulen Teil eines Informatik- oder Wirtschaftsinformatik Studiengangs, zum anderen bietet zum Beispiel die Uni Magdeburg den Masterstudiengang Data and Knowledge Engineering an:
    http://www.uni-magdeburg.de/unimagdeburg/en/Education/Study+Guide/Study+...

Bitte melden Sie sich an, um zu kommentieren

  • Artikel Auf einer Seite lesen
  • Schlagworte Telekommunikation | Information
Service