«Драйверы для перезагрузки отечественной селекции»
Что делают биоинформатики в сельском хозяйстве, когда ГМ-продукты производить нельзя, зачем читать 3000 рисовых геномов, как дроны и тракторы помогают оценивать фенотипы и почему мы не помещаемся на полки в поезде, можно узнать из репортажа Indicator.Ru со школы для биоинформатиков SmartAgro-2017.
«Биоинформатиков ищут днем с огнем»
По традиции первый день школы был общеобразовательным, и посетить лекции мог любой желающий, а не только 30 человек, прошедших отбор. На открытии организаторы напомнили, что агронаправление существует в Сколково более двух лет, но при этом в стране наблюдается огромный дефицит кадров, и «биоинформатиков ищут днем с огнем». Начав день со вполне программистской метафоры, они выразили надежду, что участники школы смогут стать «драйверами для перезагрузки российской селекции».
«У нас в Открытом университете есть пять человек, которые занимаются подобными программами. Больше всего мы сотрудничаем с БиоМедТехом – одним из наших кластеров», — пояснила Дарья Авдулова, менеджер проектов Открытого университета Сколково. В рамках этого сотрудничества и была организована школа. По словам Авдуловой, такие школы «направлены на передачу компетенций и навыков, которым не учат нигде», и ставят своей целью как можно ближе познакомить с современными методами исследований, в том числе и на практике.
«Мы много встречались с российскими селекционными компаниями, агрохолдингами, которые запускают собственные селекционные программы, и поняли, что сейчас на рынке дефицит специалистов, которые умеют работать с геномными данными для целей селекции, — рассказала корреспонденту Indicator.Ru соорганизатор школы Надежда Долматова. — Так и родилась идея провести школу и обучить биоинформатиков специфике работы с растениями».
Одни специалисты в своих выступлениях сделали упор на конкретику, истории об исследовании определенных культур, другие – на общую теоретизацию и сами подходы к такой работе. Второй и третий день школы посвящены практическим занятиям (работе с базами данных и основам статистического анализа), а мы отправимся послушать открытые для всех выступления.
От пальм до гороха
Профессор в области молекулярной и системной биологии в Университете Южной Калифорнии Сергей Нуждин рассказал о двух проектах своей лаборатории, связанных с агрогеномикой: о финансируемом Малайзией исследовании пальм, из плодов которых получают пальмовое масло, и об изучении генетики гороха нута, из которого готовят многие блюда ближневосточной кухни (например, хумус и фалафель). Основная проблема у масличных пальм — большая косточка, которая занимает существенную часть плода. Но если скрестить два вида пальм, южноамериканскую (Elaeis oleifera) и африканскую (Elaeis guineensis), у гибрида косточка будет тонкой, масло по качеству будет лучше, а сами пальмы получатся более «удобного» для сбора урожая размера. Также у гибридов выше устойчивость к засухе и патогенам. Однако только 10% пыльцы сохранит плодовитость, поэтому большинство плодов будет непригодно для изготовления масла. Прочтение геномов пальм помогло понять, что гены, связанные с качеством масла и качеством пыльцы, расположены на 16-й хромосоме, а гены, которые могут сделать пыльцу гибридов стерильной, — на 3-й.
Нут — очень распространенный продукт питания в развивающихся странах. К примеру, в Эфиопии люди постятся три месяца в году, и для них нут становится единственным источником белка. Одомашнили нут примерно 10-12 тысяч лет назад в Месопотамии. Примерно 6 тысяч лет назад нут попал в Индию, позже — в Эфиопию и Марокко. Ученые искали дикорастущие разновидности этого растения в разных географических регионах (засушливых, горных районах), спрашивая о них у местных фермеров, и собрали около 1000 образцов листочков растений и около 300 образцов семян.
Геномы этих разновидностей позволили узнать, какие гены отвечают за устойчивость у дикорастущих сортов гороха. Привнесение этих генов в популяции культурных растений могло бы повысить их приспособленность. Производство нута в России растет, чтобы обеспечить поставки в Индию. Но с ним есть и проблемы: селекционеры никак не могут вывести устойчивые к болезням и вредителям сорта, нут гибнет от засухи и заморозков.
Дроны и тракторы в помощь рисоводу
Еще одна лекция была посвящена рису (Oryza sativa). Ее автор, доктор биологических наук и специалист по биоинформатике Николай Александров, работает в Международном научно-исследовательском институте риса в Филиппинах. Не удивляйтесь, в России отдельный институт для исследования риса тоже существует, и находится он на Кубани.
Рис вовсе не так прост, как кажется: существует около 130 000 его разновидностей. Для поиска генов, связанных с селекционно важными чертами этой культуры, был запущен международный проект по секвенированию (чтению) 3000 рисовых геномов. Но добыть последовательность «букв» ДНК — это лишь часть работы, их также нужно интерпретировать, понять, как они выражаются в фенотипе. Важных с точки зрения сельского хозяйства характеристик (высота растения, время цветения, длина зерна и так далее) насчитали около 40.
Для того чтобы исследовать, как гены проявляют себя в фенотипе, ученые используют тракторы и дроны, которые фотографируют растения и выделяют их признаки с помощью нейросетей. Делается это так: у каждого трактора или дрона есть камеры, которые могут фотографировать на разных длинах волны, от инфракрасного до ультрафиолетового спектра. Каждый пиксель этого фото оценивается, что и позволяет делать выводы о фенотипе растений, не ползая по полям и не определяя его вручную. Мечта ученых — «точный дизайн рисового генома». «Хотя у нас много селекционеров, и они не согласны со мной», — полушутливо заметил в конце оратор.
«Буква» и «дух» генома
Вышеописанные исследования проводились с помощью полногеномного поиска ассоциаций (GWAS, что расшифровывается как Genome-Wide Association Studies). Этот метод, что понятно уже из его названия, изучает, как часто определенные варианты в геноме совпадают с фенотипическими признаками. Чаще всего поиск направлен на однонуклеотидные полиморфизмы — вариации отдельных «букв» в геноме. GWAS помогает выявлять, к примеру, предрасположенность к развитию различных заболеваний у людей в зависимости от конкретных генов, но используют его и в сельском хозяйстве.
Это не единственный подход к улучшению сортов растений с позиций биоинформатики. О другом методе, который называется геномной селекцией, прочитала лекцию доктор биологических наук, профессор и руководитель магистерской программы «Прикладная математика и информатика. Системная биология и биоинформатика» в СПбПУ Петра Великого Мария Самсонова. Геномная селекция никак не связана с генетической модификацией живых организмов. Она позволяет выбирать лучшие организмы для скрещиваний, оценивая различные маркеры в их геноме. Под этим словом понимаются наследуемые модификации генов, нуклеотидных последовательностей или хромосом, которые связаны с ценными для селекционера признаками. Здесь масштаб селекции смещается на уровень выбора целых «более удачных» геномов (и, соответственно, обладающих ими организмов).
В основе геномной селекции растений лежит метод машинного обучения. На некоей выборке восстанавливается зависимость между генотипом и фенотипом (проявлением записанных в геноме признаков). Здесь, конечно, на точность результатов будет влиять правильный выбор математической модели, которая будет точно работать в разных популяциях. Важно учитывать и взаимодействия между генотипом и факторами внешней среды. К примеру, на неплодородной почве или в неподходящем климате растение вряд ли вырастет сильным и развитым, даже если у него к этому есть генетические предпосылки. Также на точность предсказаний влияет плотность расположения маркеров в геноме (как близко они друг к другу) и организация генома, хотя о последнем часто бывает мало данных.
Главный плюс геномной селекции по сравнению с обычной, конечно же, скорость. Не нужно ждать годы, пока каждое растение (или животное) станет большим и проявит все свои признаки, и можно будет решить, подходит ли оно для размножения.
Бабушки и альфальфа
Татьяна Татаринова, доктор философии (PhD, Университет Южной Калифорнии), которая занимается разработкой алгоритмов для анализа регуляторных областей и аннотации растительных геномов, работает с древними ДНК, популяционной генетикой человека и растений, героически добралась до школы из Лос-Анджелеса, хотя ее рейс задержали на два дня. Она предложила слушателям поиграть и вспомнить о дате рождения, имени, фамилии и национальности бабушек и дедушек, а потом рассказала о проекте National Demographic, который провел подобные исследования в гигантских масштабах, а потом сопоставил ответы в опросах с генетическими данными.
Оказалось, что сейчас генетика способна предсказать континент и регион происхождения с вероятностью почти в 100%, а страну — с вероятностью в 80%. Это получилось благодаря сравнению частот разных полиморфных аллелей (вариаций одного и того же гена) в разных популяциях. Хотя и здесь не обошлось без сюрпризов: красивые цифры подпортили прозорливым генетикам жители Кувейта (потому что государство очень маленькое, и родственные арабские популяции встречаются и во многих соседних) и Перу (потому что данные собирали только в столице, Лиме, где «перуанцами» оказались всевозможные переселенцы, вплоть до японцев и китайцев).
Те же самые методы помогают и установить родство и распространение разных растений одного вида, хотя, конечно, «на пути любви цветочков становятся горы, моря и злобные коровы», что тоже нужно учитывать. Конкретным примером здесь стало изучение еще одного бобового растения с забавным названием альфальфа (это разновидность люцерны и очень хороший медонос). При этом частота разных аллелей позволяет предсказать, откуда взялось растение. И наоборот, по их распространению и генотипам можно предсказать свойства (например, устойчивость к засухе будет лучше у растений из пустынной местности, а к перепаду температур — в горах).
Бессмертные цветки Фишера и плацкартные полки
Темой еще одной общетеоретической лекции стала генетика количественных признаков (это совсем не так скучно, как это звучит). Виктория Скобеева, кандидат биологических наук из МГУ, рассказала о многообразии количественных признаков и их наследовании, напомнив, что, к примеру, у человека к количественным ученые относят не только рост, но и даже цвет глаз и давление крови. А то, что у большинства людей ассоциируется со словом «количество» (например, количество щетинок на одном из сегментов дрозофил, которые считают студенты в лабораториях), часто относят к так называемым счетным признакам.
Многие количественные признаки кодируются сразу восемью-десятью генами. Например, цвет кожи определяется тем, сколько определенных аллелей, связанных с темным цветом, набралось в сумме по всем генам, связанным с производством меланина, а цвет глаз (тоже зависящий от количества меланина) кодируется шестью генами и испытывает влияние еще как минимум двух.
Кроме того, количественные признаки сильно зависят от условий среды. В генах записан лишь «проект» организма, тогда как его реализация может быть разной: в среднем любое животное или растение, которое лучше питается, вырастет больше, чем в том случае, если оно питается плохо. Именно поэтому мы сейчас плохо помещаемся на полки в поездах: это не поезда такие неудобные делают, а люди стали лучше питаться и расти, хотя их геном в среднем не сильно изменился.
А таблицы, ставшие эталоном для задач про количественную генетику, придумал британский биолог и статистик Рональд Фишер, который измерил лепестки у 150 цветков, относящихся к трем видам ириса, в четырех ракурсах (длина и ширина внутренней и наружней части околоцветника).
ГМО Шредингера и будущее агрогеномики
Последний из выступавших в этот день лекторов, кандидат биологических наук из Института общей генетики (ИОГен) РАН Сергей Брускин, рассказал о разных типах CRISPR-редактирования. Все мы наслышаны об излюбленном биологами CRISPR/Cas9, но на самом деле это вовсе не единственная схема. Помимо «режущего инструмента», фермента Cas9, для этой же цели могут использоваться и Fok-нуклеазы, и Cfp1, да и сам Cas9 можно с помощью мутаций изменить так, чтобы он производил только один разрез в цепи ДНК, а не два или ничего не резал, а только к этой молекуле прикреплялся.
В целом о генном редактировании, которое в России запрещено законом о ГМО на уровне производства пищевых продуктов, Брускин отзывался с надеждой. По его словам, скорее всего, все движется к тому, что подобные технологии в нашей стране разрешат использовать, и не только для исследований. Кроме того, он обратил внимание на парадокс: в законе само определение ГМО размыто и не включает использования белков для того, чтобы вносить изменения, а CRISPR-технологии и вовсе попадают в «серую зону». К тому же определить, сделали ли какую-то модификацию в геноме, в большинстве случаев чрезвычайно сложно.
По словам организаторов, биоинформатические методы только набирают популярность в сельском хозяйстве нашей страны. «Наша задача — показать индустрии, российским селекционным компаниям, что не стоит бояться переходить на геномную селекцию. У нас есть специалисты, которые могут научить работать с генетическими данными, отвечающими за хозяйственно-ценные признаки сельскохозяйственных культур, у нас есть биоинформатики, которые могут применять самые современные методики на практике», — ответила Надежда Долматова на вопрос, каких итогов ожидают организаторы.
Но глядя на то, как задорно перешучивались и пытались подловить друг друга хитроумными вопросами лекторы, которые неожиданно даже для организаторов оказались знакомы и связаны (кто общими проектами, кто совместной учебой), сами участники подумали о другом. «Вот будет здорово, если и мы через много лет тоже будем где-то на конференции выступать», — сказала одна из слушательниц своей подруге.
Подписывайтесь на Indicator.Ru в соцсетях: Facebook, ВКонтакте, Twitter, Telegram, Одноклассники.