Przechowywanie danych w DNA brzmi jak science fiction, ale leży w niedalekiej przyszłości. Profesor Tom de Greef spodziewa się, że pierwsze centrum danych DNA zostanie uruchomione w ciągu pięciu do dziesięciu lat. Dane nie będą przechowywane jako zera i jedynki na dysku twardym, ale w parach zasad tworzących DNA: AT i CG. Takie centrum danych miałoby formę laboratorium, wielokrotnie mniejszego niż obecne. De Greef już to wszystko sobie wyobraża. W jednej części budynku nowe pliki będą kodowane poprzez syntezę DNA. Kolejna część będzie zawierała duże pola kapsułek, każda kapsuła zapakowana w plik. Robotyczne ramię wyjmie kapsułkę, odczyta jej zawartość i odłoży ją z powrotem.
Mówimy o syntetycznym DNA. W laboratorium zasady są sklejane razem w określonej kolejności, tworząc syntetycznie wytworzone nici DNA. Pliki i zdjęcia, które są obecnie przechowywane w centrach danych, można następnie przechowywać w DNA. Na razie technika ta nadaje się tylko do przechowywania archiwalnego. Wynika to z faktu, że odczyt przechowywanych danych jest bardzo kosztowny, dlatego chcesz jak najmniej przeglądać pliki DNA.
Duże, energochłonne centra danych stały się przestarzałe
Przechowywanie danych w DNA ma wiele zalet. Na przykład plik DNA można przechowywać znacznie bardziej kompaktowo, a żywotność danych jest również wielokrotnie dłuższa. Ale co być może najważniejsze, ta nowa technologia sprawia, że duże, energochłonne centra danych stają się przestarzałe. A to jest desperacko potrzebne, ostrzega De Greef, „ponieważ za trzy lata wygenerujemy na całym świecie tyle danych, że połowy z nich nie będziemy w stanie przechowywać”.
Wraz z doktorantem Basem Bögelsem, firmą Microsoft i grupą partnerów uniwersyteckich De Greef opracował nową technikę, dzięki której innowacja w zakresie przechowywania danych za pomocą syntetycznego DNA jest skalowalna. Wyniki opublikowano dzisiaj w czasopiśmie Nature Nanotechnology. De Greef pracuje na Wydziale Inżynierii Biomedycznej i Instytucie Złożonych Systemów Molekularnych (ICMS) na TU Eindhoven i jest profesorem wizytującym na Uniwersytecie Radboud.
Skalowalny
Pomysł wykorzystania nici DNA do przechowywania danych pojawił się w latach 80. XX wieku, ale był wówczas zdecydowanie zbyt trudny i kosztowny. Stało się to technicznie możliwe trzy dekady później, kiedy synteza DNA zaczęła nabierać tempa. George Church, genetyk z Harvard Medical School, rozwinął ten pomysł w 2011 roku. Od tego czasu synteza i odczyt danych stały się wykładniczo tańsze, ostatecznie wprowadzając technologię na rynek.
W ostatnich latach De Greef i jego grupa zajmowali się głównie odczytywaniem przechowywanych danych. Na razie jest to największy problem, z jakim boryka się ta nowa technika. Stosowana obecnie metoda PCR, zwana „losowym dostępem”, jest bardzo podatna na błędy. W związku z tym można czytać tylko jeden plik na raz, a ponadto jakość danych pogarsza się za każdym razem, gdy plik jest odczytywany. Nie do końca skalowalny.
Oto jak to działa: PCR (reakcja łańcuchowa polimerazy) tworzy miliony kopii potrzebnego fragmentu DNA poprzez dodanie startera z pożądanym kodem DNA. Na przykład testy koronowe w laboratorium opierają się na tym: nawet niewielka ilość materiału koronawirusowego z nosa jest wykrywalna po wielokrotnym skopiowaniu. Ale jeśli chcesz czytać wiele plików jednocześnie, potrzebujesz wielu par starterów wykonujących swoją pracę w tym samym czasie. Powoduje to wiele błędów w procesie kopiowania.
Każda kapsułka zawiera jeden plik
Tutaj do gry wchodzą kapsułki. Grupa De Greefa opracowała mikrokapsułkę z białek i polimeru, a następnie zakotwiczyła jeden pilnik w kapsułce. De Greef: „Te kapsułki mają właściwości termiczne, które możemy wykorzystać na naszą korzyść”. Powyżej 50 stopni Celsjusza kapsułki zamykają się samoistnie, dzięki czemu proces PCR odbywa się oddzielnie w każdej kapsułce. Nie ma więc miejsca na błędy. De Greef nazywa to „termo-ograniczoną PCR”. W laboratorium do tej pory udało mu się odczytać 25 plików jednocześnie bez znaczącego błędu.
Jeśli następnie ponownie obniżysz temperaturę, kopie odłączą się od kapsułki, a zakotwiczony oryginał pozostanie, co oznacza, że jakość oryginalnego pliku nie ulegnie pogorszeniu. De Greef: „Obecnie po trzech odczytach mamy stratę 0,3 procent, w porównaniu do 35 procent przy istniejącej metodzie”.
Możliwość wyszukiwania za pomocą fluorescencji
I to nie wszystko. De Greef jeszcze bardziej ułatwił przeszukiwanie biblioteki danych. Każdy pilnik ma fluorescencyjną etykietę, a każda kapsułka ma swój własny kolor. Urządzenie może następnie rozpoznać kolory i oddzielić je od siebie. To prowadzi nas z powrotem do wyimaginowanego ramienia robota na początku tej historii, które w przyszłości zgrabnie wybierze żądany plik z puli kapsuł.
Rozwiązuje to problem odczytu danych. De Greef: „Teraz pozostaje tylko czekać, aż koszty syntezy DNA jeszcze bardziej spadną. Technika będzie wtedy gotowa do zastosowania”. W rezultacie ma nadzieję, że Holandia wkrótce będzie mogła otworzyć swoje inauguracyjne centrum danych DNA – po raz pierwszy na świecie.