Bei Apple und Facebook können Mitarbeiterinnen künftig ihre Eizellen einfrieren lassen. Überraschend an der Nachricht war vor allem, dass ausgerechnet Google nicht mitmacht. Das Unternehmen aus Mountain View hat dafür ein anderes Programm in petto, es heißt Google Genomics: Nutzer, Krankenhäuser und Universitäten können ihre DNA-Datensätze auf die Server von Google hochladen.

Anders als die Moonshots genannten spektakulären Google-Projekte wie die digitale Kontaktlinse oder das selbstfahrende Auto ging Google Genomics fast unbemerkt im März 2014 online. Derzeit befindet sich das Programm in der Betaphase. Nutzer können sich bereits anmelden und das Programm ausprobieren.

Es ist nicht das erste Genom-Projekt mit Google-Beteiligung. Das Unternehmen hatte einst mehr als zehn Millionen Dollar Risikokapital in 23andMe gesteckt. Die Firma bot Erbgut-Analysen für 99 Dollar an, bis die US-Gesundheitsbehörde ihr das untersagte. Mitbegründet wurde 23andMe von Anne Wojcicki, der Ehefrau von Google-Gründer Sergey Brin.

Mit Google Genomics möchte Google laut Promo-Video nun Data Science und Life Science zusammenbringen. Konkreter gesagt: Das menschliche Genom soll einfacher lesbar werden und Instituten und anderen Nutzern zur Verfügung stehen. Dabei geht es um riesige Datenmengen: Das Genom eines Menschen ist nach der Entschlüsselung ein rund 100 Gigabyte großer Datensatz. Um solche Datenmengen schnell und effektiv durchsuchen zu können, sind besondere Algorithmen notwendig. Google nutzt dabei einige Techniken, die bereits aus anderen Projekten des Unternehmens bekannt sind, wie zum Beispiel Big Query. Dem Unternehmen kommt dabei vor allem die Arbeit an der eigenen Suchmaschine zugute. Auch dort geht es um sehr große Datensätze, die schnell durchsucht werden müssen.

Im Ergebnis sollen Nutzer, Krankenhäuser und Universitäten in der Genom-Datenbank von Google Genomics stöbern können, sei es zu Forschungszwecken oder um ihre Erbgutdaten mit denen von anderen vergleichen zu können. Der eigene Datensatz ist dementsprechend auch anderen Nutzern von Google Genomics zugänglich. Ob anonymisiert oder pseudonymisiert, sagt Google auf der Projektseite nicht.

Im Promo-Video gibt Jonathan Bingham, Produktmanager von Google Genomics, einige Anwendungsbeispiele: So ließe sich im Vergleich der Genomdatensätze die genetische Vielfalt von ethnischen Gruppen und deren Herkunft feststellen. Künftig könnten sich aber auch Merkmale für Krankheiten darstellen lassen.

Erbgut nur für Mitglieder

Das wird auch der Hauptanwendungsbereich der Genomdatenbank. Mit Google Genomics ließen sich die Erbanlagen von gesunden und kranken Menschen vergleichen. Bislang ist das ein langes und teures Verfahren und wird bei der Behandlung von Patienten kaum angewandt. Die Algorithmen und Rechenkraft von Google könnte diese Arbeit erheblich erleichtern.

Ein weiteres Ziel ist, neben der Analyse selbst, einen Standard für die Auswertung von Erbgut zu entwickeln. Bevor das Google-Genomics-Projekt startete, trat Google der Global Alliance for Genomics and Health bei. Das ist eine Allianz aus IT-Unternehmen, Pharmakonzernen und Universitäten, sie beschäftigt sich unter anderem mit eben diesem Standardisierungsprozess.

Google Genomics ist kein kostenloser Google-Dienst. Nach den Kosten für die Ergbut-Entschlüsselung – auch 23andMe-Konkurrenten bieten das für 99 Dollar an – kommen auf den Nutzer auch jährlich etwa 25 Dollar für den Speicherplatz in der Cloud zu. Ob die Mitglieder der Global Alliance for Genomics and Health die Datensätze kostenfrei nutzen können, ist nicht klar. In der ersten Ankündigung des Genom-Projekts hieß es jedoch, man wolle die globale Forschergemeinschaft unterstützen.

Sicherheit der Cloud ungewiss

Ein viel größeres Problem könnte der Datenschutz sein. Es gibt wohl kaum sensiblere Daten als die über das eigene Erbgut. Aber auf der Projektseite ist lediglich ein allgemeiner Verweis auf den Safe-Harbor-Pakt zu finden. Der regelt die Übermittlung von personenbezogenen Nutzerdaten aus Europa nach Amerika. Der Safe-Harbor-Pakt beinhaltet jedoch nur eine Selbstkontrolle und verpflichtet Unternehmen keineswegs, die gleichen Standards wie im europäischen oder deutschen Datenschutz einzuhalten. 

Nach Angaben von Technological Review liegen bereits 3.500 Genomdatensätze aus öffentlichen Projekten auf Googles Servern.