Insight Innovation: Revolution in der Datenspeicherung: Eine Million Filme in einem Millimeter DNA
Robert Grass (rechts) und Wendelin Stark (links) wollen Daten künftig in der DNA speichern.
Foto: HandelsblattZürich. Fossilien faszinieren Robert Grass, Chemieingenieur und Professor an der Eidgenössischen Technischen Hochschule (ETH) Zürich. Die versteinerten Schnecken oder Pflanzen zeigen dem Wissenschaftler, wie beispiellos die Speicherkraft der Natur ist. Denn Fossilien bewahren über viele Tausende Jahre biologische Informationen wie das Erbgut, die DNA, von Pflanzen und Tieren, auf.
Warum nicht die Speicherkraft für digitale Daten nutzen? Das hört sich nach Science-Fiction an. Ist es aber nicht: Die Kombination von Biologie und Informatik wird Realität und führt mit Biocomputern oder neuartigen mRNA-Medikamenten zur „Bio-Revolution“, wie es McKinsey in seinem neuen Trendbericht nennt. „Die Idee, DNA als Speichermedium zu nutzen, ist so alt wie das Wissen über Aussehen und biologische Funktion von DNA“, sagt Forscher Grass.
Zusammen mit seinem Kollegen Wendelin Stark leistete Grass beispiellose Pionierarbeit. Sie schafften es, Daten in künstliche DNA zu übertragen und diese in einer mikroskopisch kleinen Schutzhülle aus Glas zu konservieren. „Lange Zeit bestand das Problem, dass synthetische DNA innerhalb von einem Jahr kaputtgegangen ist“, sagt Grass. Doch die „künstlichen Fossilien“ der ETH-Forscher haben das Problem behoben.
Die Technologie hat das Potenzial, gewaltige Datenmassen auf kleinstem Raum zu speichern und über lange Zeiträume zu sichern, ohne Strom oder Ersatzteile zu benötigen. Setzt sie sich durch, fände das gesammelte Wissen ganzer Bibliotheken Platz in einer Petrischale.
Die revolutionäre Form der Datenspeicherung weckt das Interesse von Tech-Unternehmen wie Microsoft oder Festplattenhersteller Seagate. Nach Einschätzung des IT-Analysehaus Gartner wächst die Masse der gespeicherten Daten zwischen 2020 und 2030 jedes Jahr um knapp 35 Prozent – verdoppelt sich also alle drei Jahre.
Das Wachstum der Speicherkapazität hält demnach nicht Schritt – diese nimmt lediglich um 19 Prozent pro Jahr zu. Bereits ab dem Jahr 2025 könnte die weltweit installierte Speicherkapazität nicht mehr ausreichen, um der Datenmassen Herr zu werden. Mithilfe von DNA als Speichermedium wären all diese Probleme ausgeräumt.
Netflix-Filme in wenigen Millilitern aufbewahren
Bislang sind Anwendungen in der Praxis noch selten: So haben die ETH-Forscher im Auftrag von Netflix eine Million Kopien der Pilotfolge der Serie „Biohackers“ in wenigen Milliliter pinker Flüssigkeit gespeichert. Auch ein Album der Band Massive Attack ist in Molekülform verewigt.
Wie ist das möglich? Die Grundlagen bildeten in den Fünfzigerjahren die Molekularbiologen James Watson und Francis Crick. Sie lösten das Rätsel um den Bauplan des Lebens: DNA sind lange Ketten chemischer Moleküle und enthalten die Erbinformation aller Lebewesen. Sie bestehen aus vier verschiedenen chemischen Bausteinen: Adenin, Cytosin, Guanin und Thymin, abgekürzt A, C, T und G. Die Nukleinbasen können inzwischen auch künstlich im Labor hergestellt und zu Ketten aneinandergereiht werden – so entsteht künstliche DNA.
Darauf basieren die DNA-Speicher. Sie haben nichts mehr gemein mit den magnetischen Festplatten oder Halbleiterlaufwerken von Computern. Stattdessen werden die Informationen in flüssigen chemischen Verbindungen – genauer: DNA – gespeichert. Daten, die als Binärcode, also Nullen und Einsen, gespeichert sind, lassen sich mithilfe von Algorithmen in eine Abfolge aus As, Cs, Ts und Gs übersetzen.
Die von Grass und Stark entwickelte Konservierung spielt dabei eine wichtige Rolle. Das Verfahren ähnelt einem Bernstein, der eine Mücke einschließt und vor dem Verfall bewahrt.
Die ETH-Wissenschaftler haben in Simulationen gezeigt, dass die so gespeicherten Informationen mehrere Jahrhunderte überstehen können. Zum Auslesen der Daten können die DNA-Speicher mit einer Fluoridlösung behandelt werden, die das Glas auflöst, ohne die DNA zu beschädigen.
Das Verfahren ermöglicht einen revolutionären Vorgang: Die Dichte des DNA-Speichers übertrifft bei Weitem alle physischen Datenträger. Der DNA Data Storage Alliance zufolge beträgt die Speicherkapazität von einem Kubikmillimeter DNA neun Terabyte. Magnetische Festplatten mit dieser Kapazität sind mehrere Hunderttausend Mal größer. „DNA wird Speicherkapazitäten in einem nie da gewesenen Maßstab ermöglichen“, verspricht die DNA Storage Society.
Ungeahnte Märkte tun sich auf. Erste frühe Anwendungen der Technologie von den ETH-Forschern gibt es bereits: als unsichtbares Etikett.
Transparente Lieferketten durch DNA-Markierung
Christoph Wild muss sicher sein können, dass seine Ware aus korrekten Quellen kommt. Wild leitet Argor-Heraeus, eine der größten Goldraffinerien der Welt. Jeden Tag verarbeitet sein Unternehmen mehrere Tonnen Gold zu Barren, Münzen und Halbzeugen für die Uhren- und Luxusindustrie. Das Gold kommt aus Minen auf der ganzen Welt in die Raffinerie im kleinen Tessiner Ort Mendrisio an der schweizerisch-italienischen Grenze. Wild sagt: „Viele Kunden aus der Luxusgüterindustrie, aber immer mehr auch von Banken wollen ganz genau wissen: Woher kommt das Gold?“
Die Antwort steht üblicherweise auf Lieferscheinen aus Papier. Doch Wild räumt ein: „Die klassischen Rückverfolgungsmethoden für die Herkunft von Gold sind nicht zu hundert Prozent fälschungssicher.“ Seit einiger Zeit verwendet Argor-Heraeus für die Produktion bestimmter Goldbarren DNA-Marker, die auf Basis der Technologie der ETH-Forscher Grass und Stark entwickelt wurden. Minen, die eng mit Argor-Heraeus zusammenarbeiten, tragen eine geringe Menge künstlicher DNA auf das Edelmetall auf. Darauf können beispielsweise Name und Standort der Mine gespeichert sein.
Die Herkunft von Gold könnte künftig mit DNA-Markern transparenter gemacht werden.
Foto: dpaIn der Raffinerie werden die DNA-Marker auf dem Gold ausgelesen, bevor das Metall auf speziellen Fertigungsstraßen zu Barren weiterverarbeitet wird. So werde „die Herkunft des Edelmetalls forensisch überprüfbar“, sagt Wild. Der DNA-Marker funktioniert dabei ähnlich wie ein Barcode – nur, dass dieser direkt auf das Gold aufgetragen wird und zudem unsichtbar und fälschungssicher ist. Der Prozess ist jedoch noch zu teuer. „Noch ist der Markt nicht bereit, die Kosten vollumfänglich zu tragen“, sagt Wild.
Die Zürcher Kantonalbank, die das nachverfolgbare Gold von Argor-Heraeus verkauft, verlangt einen Preisaufschlag von 0,25 Prozent oder umgerechnet rund 120 Euro für einen Kilobarren im Wert von über 49.000 Euro. Das scheint nicht besonders viel zu sein – doch im Wettbewerb um Profikunden zählt jeder Cent.
Der Argor-Heraeus-Chef beobachtet, dass immer mehr Kundengruppen Gold mit einer zweifelsfrei belegbaren Lieferkette nachfragen: „Dieser Trend wird sich durchsetzen.“ Und er könnte weitere Branchen etwa in der Luxusgüterindustrie erfassen.
Erste Start-ups setzen die Technologie um
Die beiden Anwendungen – Datenspeicherung und die Möglichkeit, DNA-Marker auf Produkte anzubringen – brachten den beiden ETH-Forschern vor wenigen Wochen den Europäischen Erfinderpreis ein. Einerseits hänge die Idee, Daten auf künstlicher DNA zu speichern, entscheidend davon ab, ob diese etwa vor Hitze oder Luft geschützt werden können, so die Jury. Andererseits zeige das Start-up Haelixa schon heute die Anwendbarkeit der Technologie in der Praxis.
Das Züricher Start-up Haelixa, eine Ausgründung der ETH Zürich, will mit der DNA-Marker-Technologie auch die Herkunft von Diamanten oder Kaschmir nachverfolgbar machen.
Für die Hersteller von Premiumrohstoffen ist eine zweifelsfreie Herkunft ein entscheidendes Verkaufsargument. Die Markierungen sind sehr robust: So kann Baumwolle auf dem Feld markiert und durch alle Verarbeitungsstufen nachverfolgt werden – in Zeiten von Fairtrade oder Bioprodukten ein wichtiges Unterscheidungsmerkmal im Markt.
Hohe Kosten bleiben eine Hürde
Doch gibt es noch einige Probleme zu überwinden, bis sich die Technologie im Markt bewähren kann. „Wenn Sie heute ein Megabyte Daten auslesen wollen, bekommen Sie vor morgen kein Ergebnis“, so Grass. Im digitalen Zeitalter der Echtzeit ist das eine kleine Ewigkeit.
Auch fehlt laut Grass die Möglichkeit, die Daten im großen Maßstab in DNA zu kodieren und wieder auslesen zu können. „Die Kosten stehen in keinem Verhältnis“, sagt Grass. Allein die Sequenzierung der DNA, also der wichtigste Prozess, um die gespeicherten Daten auszulesen, kostet Schätzungen der DNA Storage Alliance zufolge derzeit 1300 Dollar pro einem Gigabyte. Angesichts der großen Speicherkapazität von DNA kommen schnell schwindelerregende Summen zusammen.
Biotechfirmen wie Illumina arbeiten intensiv daran, die Kosten für die DNA-Sequenzierung zu drücken. Bis 2030 könnten sie um 90 Prozent sinken, erwartet die DNA Storage Alliance. Doch auch dann dürfte die Technologie ihren Kostenvorteil gegenüber herkömmlichen Massenspeichern erst ab einer Dauer von 25 Jahren ausspielen.
Daher eignet sich die Technologie vor allem für große Datenarchive, die nur selten abgerufen werden – beispielsweise Geschäftsdaten, die aus gesetzlichen Gründen aufbewahrt werden müssen. In dem Bereich sei der Bedarf riesig, so die DNA Storage Alliance.
Die Anzahl der sogenannten „kalten Daten“ wachse schneller als die Menge der Daten, die innerhalb von Millisekunden verfügbar sein müssen. Je länger die Daten gesichert sein müssen und je seltener auf sie zugegriffen wird, desto schneller könne die DNA-Technologie einen Kostenvorteil gegenüber herkömmlichen Speichermethoden bieten.
Kein Eingriff in die Natur
Ein ganz besonderes Problem ist bei der Technologie noch zu berücksichtigen: Sie darf nicht zu natürlich sein. Die ETH-Forscher müssen die Molekülketten künstlicher DNA deutlich kürzer halten als die Vorbilder in der Natur. „So gehen wir sicher, dass die synthetische DNA keine biologische Bedeutung hat.“
Theoretisch könnte es sein, dass die Wissenschaftler durch zufällige Aneinanderreihung von chemischen Bausteinen DNA erschaffen, die tatsächlich in der Lage wäre, tierisches oder menschliches Erbgut zu verändern. „Die Wahrscheinlichkeit dafür ist extrem klein“, betont Grass. Trotzdem müssen die als DNA gespeicherten Daten toxikologischen Tests unterzogen werden. Kein Forscher experimentiert leichtfertig mit dem Bauplan des Lebens – auch wenn es nur darum geht, Fossilien aus Daten zu erschaffen.