Анализ генома на месте

Способность читать геном — всю ДНК организма — обладает огромным потенциалом для понимания здоровья и болезней человека.

Исследователи из Института медицинских исследований Гарвана и UNSW Sydney опубликовали метод перевода анализа генома в автономный режим путем адаптации компьютерного алгоритма, который может выполнять точный анализ — с гораздо меньшим объемом компьютерной памяти, чем в современных программах. Алгоритм ученых может позволить идентифицировать инфекционные заболевания в отдаленных местах или у постели больного, используя вычислительную память таких маленьких устройств, как смартфон.

Они опубликовали свои выводы в научных отчетах 13 марта 2019 года.

Геномика без границ

Устройства, которые могут секвенировать целые геномы, такие как секвенаторы Oxion Nanopore Technologies MinION, сегодня достаточно малы, чтобы прикреплять их к смартфону, и уже использовались для отслеживания вируса Эбола в Новой Гвинее и вируса Зика в Бразилии.

Такие устройства способны создавать более терабайта данных за 48 часов, но их использование было ограничено, поскольку сравнение или «выравнивание» ДНК из неизвестного образца с эталонной базой данных известных геномов требует большого объема вычислений. До сих пор этот процесс был возможен только на высокопроизводительных компьютерных рабочих станциях или при подключении к Интернету.

Теперь доктор Мартин Смит, руководитель группы геномных технологий в Центре клинической геномики при Институте Гарвана Гарвана, и его команда опубликовали вычислительный метод, позволяющий уменьшить объем памяти, необходимый для выравнивания геномных последовательностей с 16 ГБ до 2 ГБ, что делает возможным для анализа на месте, используя память, доступную в типичном смартфоне.

«Мы нацелены на то, чтобы сделать геномные технологии более доступными для улучшения здоровья людей. Их становится все меньше, но они все еще должны функционировать в отдаленных районах, поэтому мы создали метод, который может анализировать геномные данные в режиме реального времени только на мобильном устройстве. устройство", объясняет доктор Смит.

Разделяй и властвуй

Команда адаптировала программу Minimap2, которая совмещает секвенирование «чтения» с эталонной библиотекой известных геномов. Эталонная библиотека обычно сортируется или индексируется, что помогает быстро сопоставить считывания секвенирования с соответствующими позициями в эталонном геноме.

«До сих пор проблема заключалась в том, что для справочного индекса требуется слишком много компьютерной памяти», — объясняет доктор Смит. «Мы применили подход, заключающийся в том, чтобы разделить справочную библиотеку на более мелкие сегменты, для чего мы отображали показания ДНК. Как только мы закончили сопоставлять меньшие сегменты, мы объединяем результаты вместе и выделяем шум, почти как создание панорамы путем сшивания вместе меньшие фотографии."

«Другие алгоритмы, которые используют аналогичный подход для разделения эталонных данных, производят много ложных и дублирующих отображений — точно так же, как перекрывающиеся фотографии на панораме. В этом исследовании мы настраивали параметры и выбирали лучшие отображения по нескольким небольшим показателям. Этот подход дал нам ту же точность, что и текущий стандартный геномный анализ, который ранее требовал памяти, доступной в высокопроизводительных компьютерах », — говорит доктор Смит.

Команда доктора Смита сравнила точность их алгоритма со стандартными рабочими процессами геномики. Их результаты не только воспроизвели 99,98% выравниваний, но и с помощью меньших сегментов индекса команда могла отобразить дополнительно 1% чтений последовательности.

Доктор Смит с оптимизмом смотрит на свои технологии. «Потенциал легкого портативного геномного анализа огромен — мы надеемся, что однажды эта технология будет применена в контексте микробных инфекций в отдаленных районах или в руках врачей у постели больного», — говорит он. Доктор Смит.