Расшифрован гигантский геном пшеницы
Ученые опубликовали практически полный сиквенс генома пшеницы мягкой (Triticum aestivum), которая используется для выпечки хлеба. Прочитать его было невероятно сложно, поскольку этот геном более чем в пять раз превышает человеческий, при этом в каждой клетке находится по шесть копий каждой хромосомы. В результате геном состоит из 16—17 миллиардов пар оснований. Крупный международный коллектив пытался сделать эту работу в течение десяти лет, но их обогнала группа всего из шести ученых. Их статья опубликована в журнале GigaScience.
Геном пшеницы очень сложен не только из-за своего размера, но также и потому, что на 80% состоит из повторяющихся последовательностей. Это обстоятельство особо затрудняет работу, так как машины-секвенаторы за один раз прочитывают небольшие фрагменты, которые затем надо объединять в более длинные, причем повторяющиеся участки сильно запутывают этот процесс. Это напоминает сборку паззла с картинкой голубого неба. «Геном пшеницы — это голубое небо, — поясняет соавтор Стивен Сальцберг из Университета Джонса Хопкинса. — Многие детали выглядят как многие другие, но они не абсолютно идентичны».
В результате предыдущие анализы генома пшеницы были неполными, что не позволяло точно определять положение отдельных генов и изучать их. В частности, в 2014 году консорциум из 1800 ученых опубликовал работу, в которой было представлено две трети генома. Но геном был слишком фрагментирован.
В новой работе коллектив биологов использовал секвенаторы, выдающие очень длинные последовательности, до 10 000 нуклеотидов. В дополнение к ним использовались более высокоточные машины, но работающие с небольшими участками. Общий массив данных, состоящий из 1,5 триллионов нуклеотидов, соединяли 880 000 часов процессорного времени. В результате получился почти неразрывный геном длиной 15,3 миллиарда генетических букв.
«Я думаю, что прошла та эпоха, когда геномные проекты требовали таких монументальных международных коопераций», — прокомментировал Нил Холл из Эрлэмского института расшифровку генома, считавшегося одним из самых сложных. Данные должны помочь селекционерам вывести устойчивые к изменению климата сорта, однако до этого надо еще провести аннотацию генома, то есть отметить все гены и другие последовательности.