DNA-SpeicherungDas Erbgut wird zum Datenspeicher der Zukunft

Forscher haben Texte, Fotos und Musik fehlerfrei in künstlich hergestellter DNA gesichert. Kühl gelagert kann der Bio-Speicher Jahrtausende überdauern. von 

Nick Goldman begutachtet ein Proberöhrchen. Darin findet sich mit digitalen Informationen beladene synthetische DNA.

Nick Goldman begutachtet ein Proberöhrchen. Darin findet sich mit digitalen Informationen beladene synthetische DNA.   |  © European Molecular Biology Laboratory

Nick Goldman und Ewan Birney sind zwei Spinner im besten Sinne. Künftige Generationen werden sich vielleicht erinnern, wie die beiden einst den Grundstein zur Archivierung des Menschheitswissens legten. Alles begann in einer Hamburger Kneipe mit einer launigen Bierrunde der beiden – an deren Ende vollgekritzelte Servietten in die Taschen gestopft wurden. Goldmans und Birneys Gesprächsthema: Wie lassen sich künftig die Unmengen an Daten sicher langfristig speichern, die etwa an ihrem Arbeitsplatz entstehen, dem Europäischen Bioinformatik-Institut? Die Antwort fanden sie in einem Molekül, das beide in und auswendig kennen: Desoxyribonukleinsäure – DNA.

Digitale Daten in einem Biomolekül zu lagern, ist keine absurde Idee. Und auch nicht neu. Erstmals wurde 1988 eine Botschaft in ein DNA-Fragment eingebaut. Seither haben Wissenschaftler immer mal wieder damit experimentiert. Schließlich ist DNA der Speicher des Erbguts. Die Bau- und Schaltpläne aller Kreaturen hat die Natur in die mikroskopisch kleine Struktur gepresst.

Anzeige

Die Vorteile des biologischen Speichermediums sind mannigfaltig. "DNA ist außergewöhnlich stabil. Es kann Tausende von Jahren unter einfachen Bedingungen und kaum Energieaufwand überstehen", sagt Goldman. Das Biomolekül lässt sich selbst noch aus uralten Mammutknochen extrahieren, die rein zufällig trocken, kühl und in Dunkelheit die Jahrtausende überdauerten, sagt Ewan Birney.

Was ist DNA?

DNA ist die aus dem Englischen stammende Abkürzung von Desoxyribonukleinsäure. Im Deutschen spricht man daher auch von DNS. Im Normalzustand kommt sie als Doppelhelix in jeder Zelle des Menschen vor. Auf diesem Strang ist das komplette Erbgut des Menschen als Code aus Basenpaaren gespeichert.

Diese vier Genbausteine – symbolisiert durch die Buchstaben A, T, G und C – sind die Basen Adenin, Thymin, Guanin und Cytosin. Deren Buchstaben ergeben einen einzigartigen Code, ganz ähnlich wie die Striche maschinenlesbarer Etiketten im Supermarkt.

Damit die Informationen der DNA auch umgesetzt werden, muss sie abgelesen werden. Bei diesem Vorgang entstehen RNA Ribonukleinsäuren, darunter bestimmte Boten-RNA, die den Bau von Proteinen regulieren – so werden Informationen aus der DNA im Organismus in die Tat umgesetzt.

Proteine wiederum steuern nicht nur die Biochemie des Körpers. Organe, Knochen, Muskeln, Haut und Gewebe des Menschen formen sich, weil Proteine in ihren Zellen das Sagen haben.

In künstlich hergestellter DNA könnte demnach das digitalisierte Wissen der Welt gelagert werden. Das Molekül besteht vorwiegend aus einer unvorstellbar langen Abfolge der Buchstaben ACGT. Jeder Buchstabe steht für eine Base. Die Sequenz daraus bestimmt, was Zellen letztlich Leben einhaucht. Was wäre also, wenn man den ACGT-Code selbst benutzte, um darin Informationen, Bücher, Fotos, Filme und Musik zu speichern? Jede digitale Information beruht heute auf einem binären Schlüssel der Zahlen 0 und 1. "Ebenso gut kann sie auch in lange Reihen der Buchstaben A, C, G und T umgewandelt werden", sagt Nick Goldman.

Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn.

Nick Goldman, Bioinformatiker

Ihm, seinem Kollegen Ewan Birney und ihren Arbeitsgruppen ist dies gelungen. Im Magazin Nature stellen sie ihre Methode vor, codierte DNA zu synthetisieren und als Datenträger zu verwenden. Ein paar Beispiele kommen in der Arbeit vor: In Schnipseln des Moleküls hinterlegten die Forscher Daten für ein Foto ihres Instituts, ein Textdokument mit allen 154 Sonetten von Shakespeare und ein PDF-Dokument der Studie, in der die berühmten Genetik-Pioniere James Watson und Francis Crick einst die Struktur der DNA beschrieben. Schließlich kamen noch die Daten einer Mp3-Datei mit einem Ausschnitt der berühmtesten Rede des Bürgerrechtlers Martin Luther King hinzu: "I Have a Dream".

Auf ein Gramm DNA passen Daten von einer Million CDs

Ihre Datensequenz als ACGT-Code schickten Goldman und Birney der kalifornischen Firma Agilent Technologies, die ihre teuren Maschinen anschmiss. Die spuckten entsprechende DNA-Moleküle aus. Anschließend wurden diese gefriergetrocknet. "Das Ergebnis ist ein winziges Partikel in einem Proberöhrchen, kleiner als ein Sandkorn", sagt Goldman. Ein darin verschlüsseltes Sonett von Shakespeare wiegt 0,3 Pikogramm oder 0,0000000000003 Gramm. Die verschwindend geringe Menge DNA schickte das kalifornische Unternehmen per Post zurück nach Europa. Und hier zeigte sich, dass sich die Informationen daraus zurückgewinnen lassen. In einem Heidelberger Labor wurden die DNA-Fragmente innerhalb von zwei Wochen ausgelesen. Am Computer konnten die Forscher die Daten entschlüsseln – "mit einer Genauigkeit von 100 Prozent", sagt Goldman.

Sven Stockrahm
Sven Stockrahm

Sven Stockrahm ist Redakteur im Ressort Wissen bei ZEIT ONLINE. Seine Profilseite finden Sie hier.

DNA zu synthetisieren und zu sequenzieren ist kein fehlerloses Unterfangen. Besonders häufig verlesen sich die Apparate, wenn sie natürliches Erbgut von Lebewesen bearbeiten, worin identische Buchstaben aufeinander folgen. Etwa TT oder AA. Im erdachten Speichercode kommt daher niemals ein Buchstabe direkt hintereinander vor. Zudem wird jedes Bit an Information vierfach gespeichert. Daraus resultieren Hunderte identische DNA-Schnipsel. Fehlerhaft ausgelesene Fragmente werden somit vom Rauschen der Vielzahl an korrekten Sequenzen überlagert.

Was also steht dem Siegeszug des DNA-Speichers im Wege? Noch viel. "Heute ist es noch atemberaubend teuer, DNA zu synthetisieren", sagt Ewan Birney. Bliebe das so, wäre die Technologie erst in mehreren hundert Jahren kosteneffizient. Derzeit müsste man geschätzte 12.400 US-Dollar hinblättern, um ein Megabyte Information in DNA zu synthetisieren. Sie auszulesen koste etwa 220 US-Dollar pro Megabyte.

Leserkommentare
  1. Interessant, wie schnell man bei einem Artikel über Datenspeichermethoden in der Diskussion bei deutscher Geschichte landet - Godwin’s Law...

    Eine Leserempfehlung
    Antwort auf "Technologiefolgen:"
    Reaktionen auf diesen Kommentar anzeigen

    Ich dachte es geht um die Zukunft. Aber bitte.

    • Nibbla
    • 24. Januar 2013 13:26 Uhr
    Eine Leserempfehlung
  2. Ihre Gedankengänge sind extrem Seltsam.
    Wie kommt man nach Lesen dieses Artikels darauf so etwas zu schreiben?

    Ich sehe da keinerlei Zusammenhang, können sie ihre innere Argumentationskette/Assoziationskette bitte erläutern?

    • pch
    • 24. Januar 2013 13:31 Uhr

    schon schwierig, auch für Kommentatoren...

    Übrigens sind das auch keine Verschlüsselungs-, sondern Kompressionsalgorithmen.

    Antwort auf "1 Zettabyte"
  3. Ich dachte es geht um die Zukunft. Aber bitte.

    Antwort auf "Godwin’s Law"
    Reaktionen auf diesen Kommentar anzeigen

    Mein Kommentar bezog sich auf einen anderen Kommentar, in dem es plötzlich um Genmanipulation statt Datenspeicherung ging. Ethische Bedenken mit Bezug zu deutscher Geschichte sind in diesem Zusammenhang gänzlich fehl am Platz und das wollte ich nur zum Ausdruck bringen.
    Ich bin also vollkommen ihrer Meinung, dass es sich hier eigentlich um ein spannendes Stück Grundlagenforschung mit faszinierenden Zukunftsperspektiven handelt.

    • Statist
    • 24. Januar 2013 13:37 Uhr

    ich habe gestutzt, und dann extra noch mal nachgeschaut

    http://de.wikipedia.org/w...ätze_für_Maßeinheiten

    und immernoch fürchte ich, dass ich Recht habe: Pikogramm wäre es gewesen.

    Andererseits erstaunt mich das notwendige Gewicht der DNA.... alle Atome, welche in DNA verbaut sind, wiegen (pro mol) 1-100g (hier schon nach oben abgeschätzt). bei 6x10^23 Teilchen, sagen wir einer durchschnittlichen rel. Teilchenmasse von ca 10 g/mol und 3x10^-13 g ergeben sich, so ich mich nicht verrechne, immernoch Ax10^8 Atome. Eine durchaus erstaunliche Menge - selbst dafür.

    Wenn man bedenkt, dass man, so man denn irgendwann das Lesen irgendwann in den Griff bekommt, pro Perovskit-Elementarzelle (15 Atome) theoretisch 6 Zustände speichern könnte..... Allerdings würde für die Erhaltung des Zustands wohl einiges an Energie benötigt.

    Immerhin sind solche Ansätze wie der hier Vorgestellte Schritte in die richtige Richtung. Insofern freue ich mich, dass man sie schon heute - wenn auch unter immensen Kosten - realisieren kann.

    Reaktionen auf diesen Kommentar anzeigen
    Redaktion

    Lieber Statist,

    es sind Pikogramm. Sie haben es richtig. Die Angabe der Grammzahl mit 13 Nachkommastellen im Text war korrekt, nicht aber die Bezeichnung Pik-T-ogramm.

    Vielen Dank!

  4. Verabschieden sie sich von der Vergangenheit, die ist vorbei.
    Was Sie glauben zu wissen ist längst passe.

    Sie leben in der Zukunft mann,science fiction ist heute!

    Schon mal was von Biobricks gehört?
    Die (Gen-) Bausteine von Bakterien sind heute Teil einer OpenSource Bewegung die daraus massgeschneidertes Leben für Technische Applikation baut:

    http://en.wikipedia.org/w...

    Oder von DNA Hacking?
    http://spectrum.ieee.org/...

    Alles wird Anders!

    Antwort auf "falsche Aussage"
    Reaktionen auf diesen Kommentar anzeigen

    ...bezieht sich auf diesen Kommentar.

    • mousso
    • 24. Januar 2013 13:47 Uhr

    Wenn wir schon mal beim Kritisieren sind... Piktogramme sind m.E. die Dinger, die uns in Flughaefen den Weg weisen. Bei dem Gewicht des Shakespeare-Sonetts soll es wohl eher Picogramm (10 hoch -15 kg) heissen.
    Bei der Gelegenheit (wenn es auch zugegebenermassen irrelevant ist): Zetta... ist 10 hoch 18, d.h. Milliarden Milliarden. Also sind 3 Zettabyte nicht 3000, sondern "nur" drei Milliarden Milliarden Byte.

Bitte melden Sie sich an, um zu kommentieren

Service