Nick Goldman begutachtet ein Proberöhrchen. Darin findet sich mit digitalen Informationen beladene synthetische DNA. © European Molecular Biology Laboratory

Nick Goldman und Ewan Birney sind zwei Spinner im besten Sinne. Künftige Generationen werden sich vielleicht erinnern, wie die beiden einst den Grundstein zur Archivierung des Menschheitswissens legten. Alles begann in einer Hamburger Kneipe mit einer launigen Bierrunde der beiden – an deren Ende vollgekritzelte Servietten in die Taschen gestopft wurden. Goldmans und Birneys Gesprächsthema: Wie lassen sich künftig die Unmengen an Daten sicher langfristig speichern, die etwa an ihrem Arbeitsplatz entstehen, dem Europäischen Bioinformatik-Institut? Die Antwort fanden sie in einem Molekül, das beide in und auswendig kennen: Desoxyribonukleinsäure – DNA.

Digitale Daten in einem Biomolekül zu lagern, ist keine absurde Idee. Und auch nicht neu. Erstmals wurde 1988 eine Botschaft in ein DNA-Fragment eingebaut. Seither haben Wissenschaftler immer mal wieder damit experimentiert. Schließlich ist DNA der Speicher des Erbguts. Die Bau- und Schaltpläne aller Kreaturen hat die Natur in die mikroskopisch kleine Struktur gepresst.

Die Vorteile des biologischen Speichermediums sind mannigfaltig. "DNA ist außergewöhnlich stabil. Es kann Tausende von Jahren unter einfachen Bedingungen und kaum Energieaufwand überstehen", sagt Goldman. Das Biomolekül lässt sich selbst noch aus uralten Mammutknochen extrahieren, die rein zufällig trocken, kühl und in Dunkelheit die Jahrtausende überdauerten, sagt Ewan Birney.

In künstlich hergestellter DNA könnte demnach das digitalisierte Wissen der Welt gelagert werden. Das Molekül besteht vorwiegend aus einer unvorstellbar langen Abfolge der Buchstaben ACGT. Jeder Buchstabe steht für eine Base. Die Sequenz daraus bestimmt, was Zellen letztlich Leben einhaucht. Was wäre also, wenn man den ACGT-Code selbst benutzte, um darin Informationen, Bücher, Fotos, Filme und Musik zu speichern? Jede digitale Information beruht heute auf einem binären Schlüssel der Zahlen 0 und 1. "Ebenso gut kann sie auch in lange Reihen der Buchstaben A, C, G und T umgewandelt werden", sagt Nick Goldman.

Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn.
Nick Goldman, Bioinformatiker

Ihm, seinem Kollegen Ewan Birney und ihren Arbeitsgruppen ist dies gelungen. Im Magazin Nature stellen sie ihre Methode vor, codierte DNA zu synthetisieren und als Datenträger zu verwenden. Ein paar Beispiele kommen in der Arbeit vor: In Schnipseln des Moleküls hinterlegten die Forscher Daten für ein Foto ihres Instituts, ein Textdokument mit allen 154 Sonetten von Shakespeare und ein PDF-Dokument der Studie, in der die berühmten Genetik-Pioniere James Watson und Francis Crick einst die Struktur der DNA beschrieben. Schließlich kamen noch die Daten einer Mp3-Datei mit einem Ausschnitt der berühmtesten Rede des Bürgerrechtlers Martin Luther King hinzu: "I Have a Dream".

Auf ein Gramm DNA passen Daten von einer Million CDs

Ihre Datensequenz als ACGT-Code schickten Goldman und Birney der kalifornischen Firma Agilent Technologies, die ihre teuren Maschinen anschmiss. Die spuckten entsprechende DNA-Moleküle aus. Anschließend wurden diese gefriergetrocknet. "Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn", sagt Goldman. Ein darin verschlüsseltes Sonett von Shakespeare wiegt 0,3 Pikogramm oder 0,0000000000003 Gramm. Die verschwindend geringe Menge DNA schickte das kalifornische Unternehmen per Post zurück nach Europa. Und hier zeigte sich, dass sich die Informationen daraus zurückgewinnen lassen. In einem Heidelberger Labor wurden die DNA-Fragmente innerhalb von zwei Wochen ausgelesen. Am Computer konnten die Forscher die Daten entschlüsseln – "mit einer Genauigkeit von 100 Prozent", sagt Goldman.

DNA zu synthetisieren und zu sequenzieren ist kein fehlerloses Unterfangen. Besonders häufig verlesen sich die Apparate, wenn sie natürliches Erbgut von Lebewesen bearbeiten, worin identische Buchstaben aufeinander folgen. Etwa TT oder AA. Im erdachten Speichercode kommt daher niemals ein Buchstabe direkt hintereinander vor. Zudem wird jedes Bit an Information vierfach gespeichert. Daraus resultieren Hunderte identische DNA-Schnipsel. Fehlerhaft ausgelesene Fragmente werden somit vom Rauschen der Vielzahl an korrekten Sequenzen überlagert.

Was also steht dem Siegeszug des DNA-Speichers im Wege? Noch viel. "Heute ist es noch atemberaubend teuer, DNA zu synthetisieren", sagt Ewan Birney. Bliebe das so, wäre die Technologie erst in mehreren hundert Jahren kosteneffizient. Derzeit müsste man geschätzte 12.400 US-Dollar hinblättern, um ein Megabyte Information in DNA zu synthetisieren. Sie auszulesen koste etwa 220 US-Dollar pro Megabyte.

Eine Lösung für Bibliotheken, Regierungen und Unternehmen?

"Unsere Studie ist der Machbarkeitsbeweis, dass sich auf DNA im Prinzip alles speichern lässt", sagt Birney. Auf einem Gramm DNA haben derzeit die Daten von einer Million CDs Platz. Die Datenmenge sei beliebig erweiterbar: Theoretisch ließen sich alle derzeit existierenden digitalen Informationen platzsparend auf DNA lagern. Das seien etwa drei Zettabyte oder 3.000 Milliarden Milliarden Bytes. Das World Wide Web macht etwa die Hälfte dieser Masse aus. Derzeit benötigt ein Zettabyte mehr Speicherplatz als auf allen verfügbaren Festplatten der Welt zusammen bereitsteht.

Es ist so, als hätten wir gerade das Buch erfunden und überlegen nun, wie wir eine Bibliothek daraus zusammenstellen.
Nick Goldman, Bioinformatiker

Noch können all diese Daten nicht so archiviert werden, dass sie für Jahrzehnte sicher seien, sagt Nick Goldman. Zudem entstünden in Forschung und Wissenschaft täglich mehr Informationen. DNA-Festplatten könnten in der Zukunft eine bezahlbare Lösung sein. Dies sei vor allem für Bibliotheken, Regierungen und Unternehmen interessant, die heute noch kilometerlange Magnetbänder für die Nachwelt archivieren. "DNA ist die Grundlage allen Lebens", sagt Goldman. Daher werde es auch technologisch fortgeschrittenen Zivilisationen in ferner Zukunft möglich sein, darauf gespeicherte Daten auszulesen.

Gefährlich für Lebewesen sind die Datenspeicher nicht

Die Wissenschaftlergruppen von Birney und Goldman arbeiten derzeit daran, ihren Verschlüsselungsalgorithmus zu verfeinern, um noch mehr Daten in weniger DNA-Moleküle zu packen. Zudem wollen sie eine DNA-basierte Datenbank aufbauen. "Es ist so, als hätten wir gerade das Buch erfunden und überlegen nun, wie wir eine Bibliothek zusammenstellen", sagt Goldman. Wie sich die Staubpartikel-großen Bio-Festplatten lagern lassen, ist auch noch offen. In kleinen Proberöhrchen? Auf Glasplättchen? Und schließlich in einem Bunker im kühlen Skandinavien für die nächste Ewigkeit? Am Ende muss auch sichergestellt sein, dass keine Putzkraft die DNA-Partikel mit unschätzbaren Datenmengen einfach aufwischt.

Eine Gefahr geht von den DNA-Schnipseln übrigens nicht aus. Weder können sie zufällig ins Erbgut von Lebewesen gelangen, noch lassen sich Zellen damit zum Leben erwecken. Wer die Datenträger verschluckt, verdaut sie. Das passiert täglich auch mit der DNA, die wir mit tierischen und pflanzlichen Nahrungsmitteln aufnehmen. Umweltfreundlich sind die biologisch abbaubaren Datenträger allemal.

Mehrere Firmen hätten Interesse an Birneys und Goldmans Idee bekundet. Ob sie die Fachsimpelei eines Kneipenabends tatsächlich in eine funktionierende Geschäftsidee verwandeln werden, ist Gesprächsstoff für die nächste Runde Bier.