"Die Digitalisierung aller Lebensbereiche bringt gigantische Datenmengen hervor. Aktuell umfasst das digitale Universum rund 4,4 Zettabyte – zwei Ziffern mit 20 Nullen dahinter. Bis 2020 soll sich dieser Wert verzehnfachen, also auf 44 Billionen Gigabyte anschwellen." Die Datev ist ein Softwarehaus und IT-Dienstleister für Steuerberater, Wirtschaftsprüfer und Rechtsanwälte sowie deren Mandanten. Außerdem ist Kempf Präsident des Branchenverbands Bitkom, der sich für die Unternehmen aus dem IT-Bereich einsetzt.  

"Big Data" klingt futuristisch. Wofür steht der Begriff?
Unsere Branche liebt diesen Begriff, aber er führt in die Irre, da er nur die große Datenmenge beschreibt. Wichtiger sind jedoch die Verfahren, um dieser Datenmenge Herr zu werden. Ich spreche deshalb lieber von "Big Data-Analytics" und meine damit das Verarbeiten, Auswerten und Analysieren sowohl strukturierter als auch unstrukturierter Daten. In der Vergangenheit haben wir vor allem strukturierte Daten betrachtet, Zahlen etwa oder Adressen. Inzwischen aber, und das ist wirklich revolutionär, können wir auch unstrukturierte Daten auswerten: Textdateien gehören zu dieser Kategorie, Fotos, Videos oder Geopositionsdaten.  

Viele Menschen fühlen sich ausspioniert, wenn sie beim Surfen im Netz personalisierte Werbung entdecken und ihnen klar wird, dass diese Hinweise das Ergebnis einer Datenanalyse ihres Kaufverhaltens in Online-Warenhäusern sind.
Da muss man sich zunächst natürlich überlegen: Stört mich das oder nicht? Einerseits kann ich Advertising-Blocker verwenden, die dann zuverlässig solche Werbeeinblendungen ausfiltern. Andererseits könnte es aber durchaus hilfreich sein, wenn ich eine Taucheruhr kaufen möchte, weitere Empfehlungen zu meiner ursprünglichen Auswahl zu erhalten. Wenn man jede Art der Datenpreisgabe aber generell vermeiden möchte, muss man sich am besten vor dem Surfen überlegen, wo man seine Daten nur anonymisiert oder nicht mehr auswertbar zur Verfügung stellt.  

Wie geht das praktisch?
Zum Beispiel durch das Löschen von Cookies, denn die Spuren, die man im Netz hinterlässt, werden in Cookies gesammelt. Oder ich kann anonyme Surfprogramme nutzen wie über das Portal Tor, das Verbindungsdaten verschlüsselt. Wenn ich meine E-Mails verschlüssele, muss ich mir außerdem keine Sorgen machen, wenn jemand mitliest. Generell aber scheint es mir so zu sein, dass viele Nutzer sehr oberflächlich oder sogar sorglos mit ihren eigenen Daten im Internet umgehen – und sich dann wundern, wenn andere ihre Spuren in einer professionellen Form auswerten. In aller Regel ist Datenschutz mit höheren Kosten und einem Verlust an Bequemlichkeit verbunden.  

Soziale Netzwerke wie Facebook oder der Nachrichtendienst Twitter lassen das Datenaufkommen explodieren. Ist es aus Sicht von Unternehmen sinnvoll, Datenströme aus Social-Media-Aktivitäten zu analysieren?
Das wird sicher zu unterschiedlichen Zwecken getan und kann Sinn machen. Wenn Sie beispielsweise ein T-Shirt mit dem Konterfei des gerade beliebtesten Fußballspielers auf den Markt bringen wollen, kann es hilfreich sein, auf Social- Media-Plattformen zu ergründen, wie gefragt dieser Spieler wirklich ist. Es gibt aber auch so manche Mär – zum Beispiel, dass Personalabteilungen großer Unternehmen soziale Netzwerke nach Fotos betrunkener Jugendlicher durchforsten, die sich als Bewerber beim Unternehmen vorstellen. Mit Verlaub: Das ist großer Unsinn. Aber stellen Sie sich vor, ein Unternehmen stellt einen jungen Menschen ein, ohne in sozialen Netzwerken zu recherchieren. Und dann zeigt sich, dass er ein im Netz bekannter gewaltbereiter Aktivist der rechten oder linken Szene ist. Das wäre geradezu fahrlässig. Klar ist aber, dass nur öffentlich zugängliche Informationen ausgewertet werden können und dürfen.   

Tauschen Unternehmen die Big Data-Analysen untereinander aus?
Der Branchenverband Bitkom hat gerade eine Umfrage zum Einsatz von Big Data ausgewertet. Dabei hat sich gezeigt, dass es das systematische Auswerten von Social- Media-Daten durch große Unternehmen – mit dem Ziel, diese Daten danach flächendeckend zu verkaufen – noch nicht gibt. In den USA als Land mit einem anderen Rechtskontext ist es deutlicher leichter, einen solchen Austausch zu betreiben. Hierzulande gibt es Adressdatenhandel, den gibt es in der analogen Welt aber genauso.  

Inwiefern kann der Einzelne von Big Data-Analysen profitieren? 
Generell muss man sich bei der Bewertung von Big Data-Analytics von der Vorstellung lösen, dass es allein um Konsumentendaten geht. Der größte Benefit liegt sicherlich in den Bereichen Gesundheit, Verkehr oder Energie. Mit den Folgen der politisch beschlossenen Energiewende werden wir beispielsweise nur dann eine sichere Versorgung garantieren können, wenn wir in kürzester Zeit in der Lage sind, Stromangebot und Stromnachfrage dynamisch zuzuordnen. Dafür muss man die Daten der Verbraucher analysieren. Oder stellen Sie sich vor, jemand erhält eine Krebsdiagnose. Da kann es von sehr großem Vorteil sein, wenn man bei der Diagnose nicht auf die Einschätzung eines einzelnen Facharztes angewiesen ist, sondern wenn durch Big Data- Analysen das Krankheitsbild mit anderen gegengespiegelt wird – bis hin zur Genomsequenzierung. Wenn wir damit zu deutlich besseren Therapievorschlägen kommen, empfinde ich das als erheblichen Fortschritt. Solche Analysen im medizinischen Bereich funktionieren anonym, es wird kein Persönlichkeitsrecht verletzt.