DNA-SpeicherungDas Erbgut wird zum Datenspeicher der Zukunft

Forscher haben Texte, Fotos und Musik fehlerfrei in künstlich hergestellter DNA gesichert. Kühl gelagert kann der Bio-Speicher Jahrtausende überdauern. von 

Nick Goldman begutachtet ein Proberöhrchen. Darin findet sich mit digitalen Informationen beladene synthetische DNA.

Nick Goldman begutachtet ein Proberöhrchen. Darin findet sich mit digitalen Informationen beladene synthetische DNA.   |  © European Molecular Biology Laboratory

Nick Goldman und Ewan Birney sind zwei Spinner im besten Sinne. Künftige Generationen werden sich vielleicht erinnern, wie die beiden einst den Grundstein zur Archivierung des Menschheitswissens legten. Alles begann in einer Hamburger Kneipe mit einer launigen Bierrunde der beiden – an deren Ende vollgekritzelte Servietten in die Taschen gestopft wurden. Goldmans und Birneys Gesprächsthema: Wie lassen sich künftig die Unmengen an Daten sicher langfristig speichern, die etwa an ihrem Arbeitsplatz entstehen, dem Europäischen Bioinformatik-Institut? Die Antwort fanden sie in einem Molekül, das beide in und auswendig kennen: Desoxyribonukleinsäure – DNA.

Digitale Daten in einem Biomolekül zu lagern, ist keine absurde Idee. Und auch nicht neu. Erstmals wurde 1988 eine Botschaft in ein DNA-Fragment eingebaut. Seither haben Wissenschaftler immer mal wieder damit experimentiert. Schließlich ist DNA der Speicher des Erbguts. Die Bau- und Schaltpläne aller Kreaturen hat die Natur in die mikroskopisch kleine Struktur gepresst.

Anzeige

Die Vorteile des biologischen Speichermediums sind mannigfaltig. "DNA ist außergewöhnlich stabil. Es kann Tausende von Jahren unter einfachen Bedingungen und kaum Energieaufwand überstehen", sagt Goldman. Das Biomolekül lässt sich selbst noch aus uralten Mammutknochen extrahieren, die rein zufällig trocken, kühl und in Dunkelheit die Jahrtausende überdauerten, sagt Ewan Birney.

Was ist DNA?

DNA ist die aus dem Englischen stammende Abkürzung von Desoxyribonukleinsäure. Im Deutschen spricht man daher auch von DNS. Im Normalzustand kommt sie als Doppelhelix in jeder Zelle des Menschen vor. Auf diesem Strang ist das komplette Erbgut des Menschen als Code aus Basenpaaren gespeichert.

Diese vier Genbausteine – symbolisiert durch die Buchstaben A, T, G und C – sind die Basen Adenin, Thymin, Guanin und Cytosin. Deren Buchstaben ergeben einen einzigartigen Code, ganz ähnlich wie die Striche maschinenlesbarer Etiketten im Supermarkt.

Damit die Informationen der DNA auch umgesetzt werden, muss sie abgelesen werden. Bei diesem Vorgang entstehen RNA Ribonukleinsäuren, darunter bestimmte Boten-RNA, die den Bau von Proteinen regulieren – so werden Informationen aus der DNA im Organismus in die Tat umgesetzt.

Proteine wiederum steuern nicht nur die Biochemie des Körpers. Organe, Knochen, Muskeln, Haut und Gewebe des Menschen formen sich, weil Proteine in ihren Zellen das Sagen haben.

In künstlich hergestellter DNA könnte demnach das digitalisierte Wissen der Welt gelagert werden. Das Molekül besteht vorwiegend aus einer unvorstellbar langen Abfolge der Buchstaben ACGT. Jeder Buchstabe steht für eine Base. Die Sequenz daraus bestimmt, was Zellen letztlich Leben einhaucht. Was wäre also, wenn man den ACGT-Code selbst benutzte, um darin Informationen, Bücher, Fotos, Filme und Musik zu speichern? Jede digitale Information beruht heute auf einem binären Schlüssel der Zahlen 0 und 1. "Ebenso gut kann sie auch in lange Reihen der Buchstaben A, C, G und T umgewandelt werden", sagt Nick Goldman.

Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn.

Nick Goldman, Bioinformatiker

Ihm, seinem Kollegen Ewan Birney und ihren Arbeitsgruppen ist dies gelungen. Im Magazin Nature stellen sie ihre Methode vor, codierte DNA zu synthetisieren und als Datenträger zu verwenden. Ein paar Beispiele kommen in der Arbeit vor: In Schnipseln des Moleküls hinterlegten die Forscher Daten für ein Foto ihres Instituts, ein Textdokument mit allen 154 Sonetten von Shakespeare und ein PDF-Dokument der Studie, in der die berühmten Genetik-Pioniere James Watson und Francis Crick einst die Struktur der DNA beschrieben. Schließlich kamen noch die Daten einer Mp3-Datei mit einem Ausschnitt der berühmtesten Rede des Bürgerrechtlers Martin Luther King hinzu: "I Have a Dream".

Auf ein Gramm DNA passen Daten von einer Million CDs

Ihre Datensequenz als ACGT-Code schickten Goldman und Birney der kalifornischen Firma Agilent Technologies, die ihre teuren Maschinen anschmiss. Die spuckten entsprechende DNA-Moleküle aus. Anschließend wurden diese gefriergetrocknet. "Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn", sagt Goldman. Ein darin verschlüsseltes Sonett von Shakespeare wiegt 0,3 Pikogramm oder 0,0000000000003 Gramm. Die verschwindend geringe Menge DNA schickte das kalifornische Unternehmen per Post zurück nach Europa. Und hier zeigte sich, dass sich die Informationen daraus zurückgewinnen lassen. In einem Heidelberger Labor wurden die DNA-Fragmente innerhalb von zwei Wochen ausgelesen. Am Computer konnten die Forscher die Daten entschlüsseln – "mit einer Genauigkeit von 100 Prozent", sagt Goldman.

Sven Stockrahm
Sven Stockrahm

Sven Stockrahm ist Redakteur im Ressort Wissen bei ZEIT ONLINE. Seine Profilseite finden Sie hier.

DNA zu synthetisieren und zu sequenzieren ist kein fehlerloses Unterfangen. Besonders häufig verlesen sich die Apparate, wenn sie natürliches Erbgut von Lebewesen bearbeiten, worin identische Buchstaben aufeinander folgen. Etwa TT oder AA. Im erdachten Speichercode kommt daher niemals ein Buchstabe direkt hintereinander vor. Zudem wird jedes Bit an Information vierfach gespeichert. Daraus resultieren Hunderte identische DNA-Schnipsel. Fehlerhaft ausgelesene Fragmente werden somit vom Rauschen der Vielzahl an korrekten Sequenzen überlagert.

Was also steht dem Siegeszug des DNA-Speichers im Wege? Noch viel. "Heute ist es noch atemberaubend teuer, DNA zu synthetisieren", sagt Ewan Birney. Bliebe das so, wäre die Technologie erst in mehreren hundert Jahren kosteneffizient. Derzeit müsste man geschätzte 12.400 US-Dollar hinblättern, um ein Megabyte Information in DNA zu synthetisieren. Sie auszulesen koste etwa 220 US-Dollar pro Megabyte.

Leserkommentare
  1. Wie kann man garantieren, dass die Kühlung eine Million Jahre hält? In dem man einen Kühlschrank baut, der mit Atommüll läuft?

    Außerdem, immer wenn jemand "DNA" schreibt, dann setzt der Verstand aus. Man setze

    A = 00
    T = 01
    C = 10
    G = 11

    Yep, ein Quarter-Byte.

    Reaktionen auf diesen Kommentar anzeigen

    Es gibt doch genug permanent kalte Orte auf der Welt. Das Saatgut-Lager auf Spitzbergen muss nur ein paar zusätzliche Stollen graben...

    Jeden buchstaben in 2 Bits zu übersetzen, wäre nicht sinnvoll, da es ja ein problem beim Lesen gibt, wenn zwei Mal hintereinander der selbe Buchstabe kommt, daher besser:

    A = 0
    C = 0
    G = 1
    T = 1

    Oder eine beliebige Permutation davon.

  2. Es gibt doch genug permanent kalte Orte auf der Welt. Das Saatgut-Lager auf Spitzbergen muss nur ein paar zusätzliche Stollen graben...

    Eine Leserempfehlung
  3. Jeden buchstaben in 2 Bits zu übersetzen, wäre nicht sinnvoll, da es ja ein problem beim Lesen gibt, wenn zwei Mal hintereinander der selbe Buchstabe kommt, daher besser:

    A = 0
    C = 0
    G = 1
    T = 1

    Oder eine beliebige Permutation davon.

  4. Redaktion

    Lieber Statist,

    es sind Pikogramm. Sie haben es richtig. Die Angabe der Grammzahl mit 13 Nachkommastellen im Text war korrekt, nicht aber die Bezeichnung Pik-T-ogramm.

    Vielen Dank!

    Antwort auf "0,3 Piktogramm"
  5. Mir ging es in meinem Kommentar darum, darauf hinzuweisen, daß der Satz:

    "Die Sequenz daraus bestimmt, was Zellen letztlich Leben einhaucht."

    aus biologischer Sicht ganz einfach falsch ist, da es umgekehrt die bereits lebende Zelle ist, die dem Code der DNA erst in eine "lebende Expression" erlaubt.

    D. h. die von Ihnen aufgeworfene Frage, ob die synthetische Erschaffung einer Zelle relevant für die synthetische Biologie ist, ist im Kontext dieser Frage irrelevant. :-)

  6. ... ist es immer noch ein weiter Weg.

    Um die als Beispiel genannte Augenfarbe bei einem Erwachsenen zu ändern reicht ja das einmalige Ändern der DNA nicht aus, sondern es müssten am lebenden Organismus mindestens alle Zellen der Iris verändert werden, um eine Änderung im Phänotyp zu bewirken.

    Von einer solchen Möglichkeit sind wir so weit entfernt, dass ich die Diskussion von Konsequenzen für Mensch und Gesellschaft einfach absurd finde.

    Antwort auf "Technologiefolgen:"
    Reaktionen auf diesen Kommentar anzeigen

    Wir erneuern alle Zellen unsere Lörpers (Ausnahme Neuronen, Knochen, Zähne) innerhalb nur eines Jahres.

    Die erneuerung der AUgenfarbe würde vielleicht biszu einem Jahr dauern, aber findet von sich aus statt.

    Und wieso sollten alle erneuerten Zellen nach dem veränderten Bauplan der einen eingebrachten Zelle gebildet werden?
    Ich bin kein Fachmann, aber soweit ich weiß geschieht diese Erneuerung durch einfache Zellteilung, und selbst wenn sich die Zelle, die die neue Augenfare trägt, ordentlich vermehren sollte, würde das im Vergleich zu den zigtausenden "normalen" Zellen der Iris kaum ins Gewicht fallen.

    • JCO
    • 24. Januar 2013 19:08 Uhr

    Wenn ich das richtig verstehe, dann kann man den DNS Speicher nur sequenziell auslesen. D.h. wenn man ein Buch lesen will, muss man erst die gesamte Bibliothek dekodieren. Und dann ist das auch noch destruktiv. Was soll das ganze dann? Kann mich jemand vielleicht aufklaeren?

    Reaktionen auf diesen Kommentar anzeigen

    es handelt sich ja hier eher um eine Machbarkeitsstudie als um eine in absehbarer Zeit durchführbare Möglichkeit zur günstigen Massenspeicherung, wie auch Computer im letzten Jahrhundert Räume gefüllt haben und sehr teuer waren.
    Destruktiv ist das Ablesen tatsächlich. Allerdings kann man von einer teuer synthetisierten DNA durch PCR (verhätlnismäßig!) billig Kopien erschaffen und diese dann zum destruktiven Ablesen verwenden, sofern man nicht andere Möglichkeiten zum Ablesen findet. Man muss auch nicht unbedingt die gesamte DNA entschlüsseln. Für das Ablesen der DNA brauchen die Enzyme (DNA-Polymerasen) Einspringpunkte (im Grunde kurzem, spezifische, komplementäre DNA-Sequenzen die Hydroxidgruppen für die ablesende DNA-Polymerase bereit stellen), je nachdem welche Daten von Interesse sind, könnte man also beim Synthetisieren der DNA vor den jeweiligen Datensatz einen dieser Einspringpunkte setzen.
    Ich habe das alles sehr salopp formuliert, weil es nur um das Prinzip geht. Bei Interesse sind Wikipediaartikel evtl. für Sie zum genaueren Verstehen des Prinzips interessant:

    Polymerase-Kettenreaktion
    DNA-Polymerase
    Primer

    • nik--
    • 25. Januar 2013 0:44 Uhr

    „Weder können sie zufällig ins Erbgut von Lebewesen gelangen“

    Vielleicht wäre genau das aber notwendig für eine nachhaltige Speichermethode. Letztlich dreht sich das Thema doch um diese Punkte
    1) Wie kann man nachhaltig speichern
    2) Wie kann man sicher gehen, dass das Wissen, das irgendwo etwas gespeichert ist, bewahrt bleibt

    Zu 1: Die natürliche Reproduktion von DNA kann man als sehr nachhaltig bezeichnen. Problematisch ist natürlich die Neigung zur Mutation
    Zu 2: Es ist ziemlich wahrscheinlich, dass sich die Menschheit immer mit ihrem eigenen Körper beschäftigen wird.

    Bleiben weitere Probleme:
    3) Nachhaltige Datenformate
    4) Nachhaltige Lesemethoden
    Eine komprimierte Datei oder ein PDF von heute kann schon morgen nicht mehr lesbar sein, das Wissen des Algoritmus kann verloren gehen o.ä. Das gleiche gilt für das Verfahren des mikroskopischen Auslesens. Kurzum: Die Datendichte heute ist deutlich höher als die von Hieroglyphen auf großen Steintafeln, dabei deutlich empfindlicher (das berühmte umgekippte Bit) und nicht allein durch unsere natürliche Sensorik auszulesen. (Siehe alte Schriften: vom semantischen noch ganz zu schweigen).

    So gesehen ist ein ewig haltbares Format vielleicht die komplett falsche Herangehensweise, auch wenn man sich „die ganze Bibliothek mal aufräumen“ jetzt auch nicht als sonderlich attraktive Aufgabe vorstellen mag :)

Bitte melden Sie sich an, um zu kommentieren

  • Artikel Auf einer Seite lesen
  • Quelle ZEIT ONLINE
  • Schlagworte Martin Luther | DNA | Datenspeicher | Datenträger | Erbgut | Francis Crick
Service