Дослідники Ізраїльського технологічного інституту (Technion) розробили інноваційний метод, що базується на штучному інтелекті, який дозволяє значно прискорити процес пошуку інформації, збереженої у ДНК. Завдяки цьому новому підходу, час читання даних скоротився з кількох днів до всього 10 хвилин, при цьому покращилася точність.
Про це розповідає ProIT
Молекули ДНК є основою збереження генетичної інформації у живих організмах, складені з чотирьох типів нуклеотидів, позначених літерами A, C, G і T. На відміну від традиційних комп’ютерних технологій, де дані кодуються лише двійковими цифрами, зберігання інформації на основі ДНК дозволяє значно розширити можливості комбінацій.
Переваги зберігання даних у ДНК
Зберігання інформації в ДНК може забезпечити тривале збереження даних на сотні тисяч років та вражаючу щільність — в 100 мільйонів разів вищу, ніж у традиційних цифрових носіях. Однак, зберігання даних у ДНК супроводжується низкою технологічних викликів. Синтез та секвенування ДНК є часовими процесами, що підлягають помилкам, таким як видалення, вставка або заміна даних.
Для подолання цих труднощів, нове дослідження, опубліковане в журналі Nature Machine Intelligence, впроваджує комплексне обчислювальне рішення для корекції помилок у системах зберігання ДНК. Дослідники використали вдосконалені алгоритми та методи кодування, що дозволяє зменшити час пошуку та читання даних до 10 хвилин.
Система DNAformer
Розроблений у Technion метод під назвою DNAformer базується на трансформерній моделі, натренованій на змодельованих даних, створених за допомогою спеціального симулятора. Цей метод здатен реконструювати точні послідовності ДНК з помилкових копій, використовуючи спеціальний код для виправлення помилок, адаптований для роботи з ДНК.
Крім того, механізм додаткового запасу безпеки виявляє шуми в послідовностях ДНК, що можуть заважати точній інтерпретації даних, і застосовує алгоритмічні інструменти для покращення обробки. В кінці процесу інформація переводиться у цифровий формат.
Новий підхід дозволяє зчитувати 100 МБ даних зі швидкістю, що у 3200 разів перевищує найсучасніші методи, без втрати точності. Це було продемонстровано на наборі даних, що містить 24-секундний аудіозапис слів астронавта Ніла Армстронга, а також текст, що обговорює переваги ДНК як метод зберігання даних.
Дослідники планують адаптувати систему DNAformer для різних потреб, підкреслюючи її масштабованість, що дозволяє оптимізувати технологію для великих програм зберігання даних у відповідь на ринкові вимоги.