Нейросети научили искать левозакрученную ДНК
Ученые из НИУ ВШЭ нашли способ повысить точность поиска Z-ДНК — скрученных влево участков молекулы. Для этого они использовали нейросети и набор данных из более чем 30 тысяч экспериментов, проведенных разными лабораториями по всему миру. Подробности исследования опубликованы в журнале Scientific Reports.
Исследователи НИУ «Высшая школа экономики» использовали нейросети для поиска одного из вариантов строения ДНК — Z-ДНК, который представляет собой двойную спираль, закрученную влево, а не вправо. Однако даже для нейросетей поиск Z-ДНК остается непростой задачей, так как экспериментальных данных недостаточно. Поэтому ученые решили проверить, повысится ли точность работы нейросетей, если предоставить им также омиксные данные — информацию о том, как регулируется активность генов и синтез белков в клетках.
«Результаты работы важны потому, что с помощью нейронных сетей мы не только воспроизвели эксперименты, но и предсказали потенциальные места образования Z-ДНК в геноме. Обилие сигналов Z-ДНК говорит о том, что они активно используются для включения и выключения генов. Это более быстрый сигнал, нежели мотивы в самом геноме. Например, исследования группы ученых из Австралии показали, что Z-ДНК служит сигналом при обучении подавлять страх. Видимо, Z-ДНК эволюционно появилась в тех случаях, когда требуется быстрая реакция на события. Мы планируем инициировать совместные проекты с экспериментальными группами, чтобы проверить предсказания», — рассказала руководитель исследования Мария Попцова.
Участки Z-ДНК встречаются в клетках различных организмов, возникают при определенных условиях и могут сочетаться с другими вариантами структуры в одной молекуле. Ученые предполагают, что Z-ДНК может регулировать транскрипцию и повышать вероятность мутаций. Возможно, ее образование связано с некоторыми заболеваниями и играет роль во врожденном иммунном ответе. Чтобы больше узнать о Z-ДНК, необходимо научиться находить ее местоположение в геноме. В последние годы для этого используются методы машинного обучения.
Исследователи сравнили три типа нейросетей: сверточные, рекуррентные и сочетание первых двух. Сверточные чаще всего используются для обработки изображений, рекуррентные — для анализа последовательностей. Авторы работы оценили 151 модель, лучшие результаты показала одна из рекуррентных нейросетей — DeepZ. Ее ученые и использовали для предсказаний новых участков Z-ДНК в геноме человека. Авторы разметили всю последовательность генома человека, определив для каждого нуклеотида вероятность того, что он окажется внутри участка Z-ДНК. Последовательность из нескольких нуклеотидов, у которых вероятность превышала некое пороговое значение, пометили как потенциальный искомый участок.
Понравился материал? Добавьте Indicator.Ru в «Мои источники» Яндекс.Новостей и читайте нас чаще.
Пресс-релизы о научных исследованиях, информацию о последних вышедших научных статьях и анонсы конференций, а также данные о выигранных грантах и премиях присылайте на адрес science@indicator.ru.