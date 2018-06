Nick Goldman und Ewan Birney sind zwei Spinner im besten Sinne. Künftige Generationen werden sich vielleicht erinnern, wie die beiden einst den Grundstein zur Archivierung des Menschheitswissens legten. Alles begann in einer Hamburger Kneipe mit einer launigen Bierrunde der beiden – an deren Ende vollgekritzelte Servietten in die Taschen gestopft wurden. Goldmans und Birneys Gesprächsthema: Wie lassen sich künftig die Unmengen an Daten sicher langfristig speichern, die etwa an ihrem Arbeitsplatz entstehen, dem Europäischen Bioinformatik-Institut? Die Antwort fanden sie in einem Molekül, das beide in und auswendig kennen: Desoxyribonukleinsäure – DNA.

Digitale Daten in einem Biomolekül zu lagern, ist keine absurde Idee. Und auch nicht neu. Erstmals wurde 1988 eine Botschaft in ein DNA-Fragment eingebaut. Seither haben Wissenschaftler immer mal wieder damit experimentiert. Schließlich ist DNA der Speicher des Erbguts. Die Bau- und Schaltpläne aller Kreaturen hat die Natur in die mikroskopisch kleine Struktur gepresst.

Die Vorteile des biologischen Speichermediums sind mannigfaltig. "DNA ist außergewöhnlich stabil. Es kann Tausende von Jahren unter einfachen Bedingungen und kaum Energieaufwand überstehen", sagt Goldman. Das Biomolekül lässt sich selbst noch aus uralten Mammutknochen extrahieren, die rein zufällig trocken, kühl und in Dunkelheit die Jahrtausende überdauerten, sagt Ewan Birney.

DNA Was ist DNA? DNA ist die aus dem Englischen stammende Abkürzung von Desoxyribonukleinsäure. Im Deutschen spricht man daher auch von DNS. Im Normalzustand kommt sie als Doppelhelix in jeder Zelle des Menschen vor. Auf diesem Strang ist das komplette Erbgut des Menschen als Code aus Basenpaaren gespeichert.

Diese vier Genbausteine – symbolisiert durch die Buchstaben A, T, G und C – sind die Basen Adenin, Thymin, Guanin und Cytosin. Deren Buchstaben ergeben einen einzigartigen Code, ganz ähnlich wie die Striche maschinenlesbarer Etiketten im Supermarkt. Was ist RNA? Damit die Informationen der DNA auch umgesetzt werden, muss sie abgelesen werden. Bei diesem Vorgang entstehen Ribonukleinsäuren (RNA), darunter bestimmte Boten-RNA, die den Bau von Proteinen (Eiweiß-Molekülen) regulieren. So werden Informationen aus der DNA im Organismus in die Tat umgesetzt. Proteine wiederum steuern nicht nur die Biochemie des Körpers. Organe, Knochen, Muskeln, Haut und Gewebe des Menschen formen sich, weil Proteine in ihren Zellen das Sagen haben.

In künstlich hergestellter DNA könnte demnach das digitalisierte Wissen der Welt gelagert werden. Das Molekül besteht vorwiegend aus einer unvorstellbar langen Abfolge der Buchstaben ACGT. Jeder Buchstabe steht für eine Base. Die Sequenz daraus bestimmt, was Zellen letztlich Leben einhaucht. Was wäre also, wenn man den ACGT-Code selbst benutzte, um darin Informationen, Bücher, Fotos, Filme und Musik zu speichern? Jede digitale Information beruht heute auf einem binären Schlüssel der Zahlen 0 und 1. "Ebenso gut kann sie auch in lange Reihen der Buchstaben A, C, G und T umgewandelt werden", sagt Nick Goldman.

Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn. Nick Goldman, Bioinformatiker

Ihm, seinem Kollegen Ewan Birney und ihren Arbeitsgruppen ist dies gelungen. Im Magazin Nature stellen sie ihre Methode vor, codierte DNA zu synthetisieren und als Datenträger zu verwenden. Ein paar Beispiele kommen in der Arbeit vor: In Schnipseln des Moleküls hinterlegten die Forscher Daten für ein Foto ihres Instituts, ein Textdokument mit allen 154 Sonetten von Shakespeare und ein PDF-Dokument der Studie, in der die berühmten Genetik-Pioniere James Watson und Francis Crick einst die Struktur der DNA beschrieben. Schließlich kamen noch die Daten einer Mp3-Datei mit einem Ausschnitt der berühmtesten Rede des Bürgerrechtlers Martin Luther King hinzu: "I Have a Dream".

Auf ein Gramm DNA passen Daten von einer Million CDs

Ihre Datensequenz als ACGT-Code schickten Goldman und Birney der kalifornischen Firma Agilent Technologies, die ihre teuren Maschinen anschmiss. Die spuckten entsprechende DNA-Moleküle aus. Anschließend wurden diese gefriergetrocknet. "Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn", sagt Goldman. Ein darin verschlüsseltes Sonett von Shakespeare wiegt 0,3 Pikogramm oder 0,0000000000003 Gramm. Die verschwindend geringe Menge DNA schickte das kalifornische Unternehmen per Post zurück nach Europa. Und hier zeigte sich, dass sich die Informationen daraus zurückgewinnen lassen. In einem Heidelberger Labor wurden die DNA-Fragmente innerhalb von zwei Wochen ausgelesen. Am Computer konnten die Forscher die Daten entschlüsseln – "mit einer Genauigkeit von 100 Prozent", sagt Goldman.

Sven Stockrahm Sven Stockrahm ist Redakteur im Ressort Wissen von ZEIT ONLINE. Seine Profilseite finden Sie hier.

DNA zu synthetisieren und zu sequenzieren ist kein fehlerloses Unterfangen. Besonders häufig verlesen sich die Apparate, wenn sie natürliches Erbgut von Lebewesen bearbeiten, worin identische Buchstaben aufeinander folgen. Etwa TT oder AA. Im erdachten Speichercode kommt daher niemals ein Buchstabe direkt hintereinander vor. Zudem wird jedes Bit an Information vierfach gespeichert. Daraus resultieren Hunderte identische DNA-Schnipsel. Fehlerhaft ausgelesene Fragmente werden somit vom Rauschen der Vielzahl an korrekten Sequenzen überlagert.

Was also steht dem Siegeszug des DNA-Speichers im Wege? Noch viel. "Heute ist es noch atemberaubend teuer, DNA zu synthetisieren", sagt Ewan Birney. Bliebe das so, wäre die Technologie erst in mehreren hundert Jahren kosteneffizient. Derzeit müsste man geschätzte 12.400 US-Dollar hinblättern, um ein Megabyte Information in DNA zu synthetisieren. Sie auszulesen koste etwa 220 US-Dollar pro Megabyte.