Российские ученые представили крупнейший каталог нуклеотидных замен, определяющих активность генов человека
Многие некодирующие участки генома служат посадочными площадками для специальных белков — факторов транскрипции, — которые управляют работой генов. Замены нуклеотидов в пределах этих посадочных площадок могут влиять на их взаимодействие с факторами транскрипции и таким образом нарушать активность генов — из-за этого развивается ряд патологий. Путем масштабного компьютерного анализа авторы составили каталог из сотни тысяч геномных вариантов, влияющих на посадку факторов транскрипции в различных типах клеток. Исследование поддержано грантами РНФ, статья опубликована в журнале Nature Communications.
Все белки организма закодированы в определенных участках ДНК — генах. Как уже существующие в популяции геномные варианты, так и произошедшие всего поколение назад мутации могут приводить к изменению последовательности белка, его структуры и функции. В ряде случаев это может вызвать развитие и усугубление различных заболеваний. Считывание информации, а по факту синтез РНК на основе ДНК, называется транскрипцией. На основе рибонуклеиновой копии будут синтезироваться белки, определяющие признаки клетки и, в конечном счете, организма. Если это происходит не в то время и не в том месте или не происходит, когда необходимо, возникают патологии. С развитием экспериментальных и компьютерных методов стало понятно, что здесь большую роль играют не только гены, но и так называемые некодирующие последовательности. К ним относятся особые «регуляторные» участки ДНК — специфичные посадочные площадки для управляющих транскрипцией белков, называемых факторами транскрипции. Замена всего одного нуклеотида («буквы») приводит к появлению нового варианта с другими «посадочными» свойствами, а значит, и активность чтения подконтрольного гена изменяется.
«Для нас важнейшая цель — выявить тройки "регулятор – ген – тип клеток", связанные с определенной нуклеотидной заменой. Несмотря на то, что регуляция транскрипции изучается уже более 50 лет, сегодня доступна только верхушка айсберга: известна лишь небольшая часть регуляторных вариантов, которые влияют на посадку конкретных факторов транскрипции в определенных типах клеток. Это связано с тем, что эксперименты проводят на культивируемых клетках. С одной стороны, они сохраняют свойства исходных тканей, включая распространенные генетические вариации. С другой стороны, мы сталкиваемся с уникальными особенностями, например глобально измененной копийностью хромосом, что существенно осложняет статистический анализ», — рассказывает руководитель проекта по гранту РНФ Иван Кулаковский, доктор биологических наук, старший научный сотрудник Института белка РАН.
Российские исследователи из Института белка РАН (Пущино), ИОГен РАН имени Н. И. Вавилова (Москва) и МФТИ (Долгопрудный) провели масштабный вычислительный анализ опубликованных экспериментов по картированию взаимодействий регуляторных белков и ДНК. С помощью продвинутого статистического подхода удалось единым образом проанализировать результаты нескольких тысяч экспериментов для разнообразных типов клеток. Полученная карта содержит сотни тысяч событий так называемого аллель-специфичного связывания, когда разница в один нуклеотид в конкретном участке пары хромосом (аллельный вариант) приводит к тому, что регуляторный белок предпочтительно связывается с одной хромосомой из пары. Сопоставление с данными о генетике различных заболеваний показало: те варианты, которые приводят к потере связывания регуляторного белка (или, наоборот, к связыванию того, который раньше в этом месте не садился), гораздо чаще оказываются вовлеченными в развитие болезни.
«Конечно, мы все еще на верхушке айсберга, но теперь здесь можно комфортно расположиться и продолжать исследования его подводной части. Наша коллекция далека от полноты, но содержит на порядок больше информации об аллель-специфичных взаимодействиях, чем было известно ранее. Особенно ценными эти данные могут оказаться для медицинских генетиков, которым важно понимать функциональную роль вариантов, расположенных в регуляторных областях генов. Наша карта будет полезна и вычислительным биологам для построения и проверки новых моделей взаимодействия факторов транскрипции и ДНК на основе машинного обучения», — заявил Иван Кулаковский.