Учёные разработали ДНК-хранилище объёмом до 200 МБ с доступом к отдельным файлам

Исследователи из команды Microsoft Research и Вашингтонского университета нашли способ без ошибок извлекать отдельные файлы из закодированной в ДНК информации объёмом до 200 МБ. Учёные опубликовали работу в Nature Biotechnology, но с тех пор методика продвинулась ещё дальше. Система хранения предлагает случайный доступ уже к 400 МБ данных.

ДНК-хранилище

Для хранения данных в ДНК учёные преобразуют бинарный код в последовательности из четырёх азотистых оснований, из которых состоит ДНК, — А, С, G и T (аденин, цитозин, гуанин и тимин). Зашифрованные последовательности синтезируются и хранятся в пробирках.

Сложнее получить доступ к отдельным файлам. Каждый раз ради одного файла расшифровывать весь объём информации неэффективно, поэтому учёные разработали новый алгоритм дешифрования.

Случайный доступ

Исследователи работали с тридцатью пятью файлами, ранжированными по размеру от 29 КБ до 44 МБ. Они зашифровали каждый файл в большое количество отрывков ДНК, состоящих из 150 оснований. В результате получилась библиотека из 13 миллионов уникальных ДНК-последовательностей.

Каждый отрывок начинался с закодированного адреса, указывающего на его расположение в файле. Отрывки, принадлежащие одному и тому же файлу, ограничены одной и той же короткой ДНК-нитью, являющейся стартовой точкой для цепной реакции полимеразы.

Когда нужно прочитать информацию из ДНК-последовательности, учёные восстанавливают только те отрывки ДНК, которые принадлежат выбранному файлу.

Получается, что новый алгоритм дешифрования вначале собирает одинаково выглядящие последовательности. Затем, используя статистические методы и коррекцию ошибок, восстанавливает оригинальные ДНК-цепочки, преобразуемые в цифровую информацию.

Источник: IEEE Spectrum

Подобрали три теста для вас:
— А здесь можно применить блокчейн?
Серверы для котиков: выберите лучшее решение для проекта и проверьте себя.
Сложный тест по C# — проверьте свои знания.

Также рекомендуем: