Учёные разработали ДНК-хранилище объёмом до 200 МБ с доступом к отдельным файлам
Новости
Исследователи из команды Microsoft Research и Вашингтонского университета нашли способ без ошибок извлекать отдельные файлы из закодированной в ДНК информации объемом до 200 МБ.
1К открытий1К показов
Исследователи из команды Microsoft Research и Вашингтонского университета нашли способ без ошибок извлекать отдельные файлы из закодированной в ДНК информации объёмом до 200 МБ. Учёные опубликовали работу в Nature Biotechnology, но с тех пор методика продвинулась ещё дальше. Система хранения предлагает случайный доступ уже к 400 МБ данных.
ДНК-хранилище
Для хранения данных в ДНК учёные преобразуют бинарный код в последовательности из четырёх азотистых оснований, из которых состоит ДНК, — А, С, G и T (аденин, цитозин, гуанин и тимин). Зашифрованные последовательности синтезируются и хранятся в пробирках.
Сложнее получить доступ к отдельным файлам. Каждый раз ради одного файла расшифровывать весь объём информации неэффективно, поэтому учёные разработали новый алгоритм дешифрования.
Случайный доступ
Исследователи работали с тридцатью пятью файлами, ранжированными по размеру от 29 КБ до 44 МБ. Они зашифровали каждый файл в большое количество отрывков ДНК, состоящих из 150 оснований. В результате получилась библиотека из 13 миллионов уникальных ДНК-последовательностей.
Каждый отрывок начинался с закодированного адреса, указывающего на его расположение в файле. Отрывки, принадлежащие одному и тому же файлу, ограничены одной и той же короткой ДНК-нитью, являющейся стартовой точкой для цепной реакции полимеразы.
Когда нужно прочитать информацию из ДНК-последовательности, учёные восстанавливают только те отрывки ДНК, которые принадлежат выбранному файлу.
Получается, что новый алгоритм дешифрования вначале собирает одинаково выглядящие последовательности. Затем, используя статистические методы и коррекцию ошибок, восстанавливает оригинальные ДНК-цепочки, преобразуемые в цифровую информацию.
1К открытий1К показов