Сельское хозяйство

Расшифрован гигантский геном пшеницы

© Roman023_photography/Shutterstock/Indicator.Ru

Ученые опубликовали практически полный сиквенс генома пшеницы мягкой (Triticum aestivum), которая используется для выпечки хлеба. Прочитать его было невероятно сложно, поскольку этот геном более чем в пять раз превышает человеческий, при этом в каждой клетке находится по шесть копий каждой хромосомы. В результате геном состоит из 16—17 миллиардов пар оснований. Крупный международный коллектив пытался сделать эту работу в течение десяти лет, но их обогнала группа всего из шести ученых

Ученые опубликовали практически полный сиквенс генома пшеницы мягкой (Triticum aestivum), которая используется для выпечки хлеба. Прочитать его было невероятно сложно, поскольку этот геном более чем в пять раз превышает человеческий, при этом в каждой клетке находится по шесть копий каждой хромосомы. В результате геном состоит из 16—17 миллиардов пар оснований. Крупный международный коллектив пытался сделать эту работу в течение десяти лет, но их обогнала группа всего из шести ученых. Их статья опубликована в журнале GigaScience.

Геном пшеницы очень сложен не только из-за своего размера, но также и потому, что на 80% состоит из повторяющихся последовательностей. Это обстоятельство особо затрудняет работу, так как машины-секвенаторы за один раз прочитывают небольшие фрагменты, которые затем надо объединять в более длинные, причем повторяющиеся участки сильно запутывают этот процесс. Это напоминает сборку паззла с картинкой голубого неба. «Геном пшеницы — это голубое небо, — поясняет соавтор Стивен Сальцберг из Университета Джонса Хопкинса. — Многие детали выглядят как многие другие, но они не абсолютно идентичны».

В результате предыдущие анализы генома пшеницы были неполными, что не позволяло точно определять положение отдельных генов и изучать их. В частности, в 2014 году консорциум из 1800 ученых опубликовал работу, в которой было представлено две трети генома. Но геном был слишком фрагментирован.

В новой работе коллектив биологов использовал секвенаторы, выдающие очень длинные последовательности, до 10 000 нуклеотидов. В дополнение к ним использовались более высокоточные машины, но работающие с небольшими участками. Общий массив данных, состоящий из 1,5 триллионов нуклеотидов, соединяли 880 000 часов процессорного времени. В результате получился почти неразрывный геном длиной 15,3 миллиарда генетических букв.

«Я думаю, что прошла та эпоха, когда геномные проекты требовали таких монументальных международных коопераций», — прокомментировал Нил Холл из Эрлэмского института расшифровку генома, считавшегося одним из самых сложных. Данные должны помочь селекционерам вывести устойчивые к изменению климата сорта, однако до этого надо еще провести аннотацию генома, то есть отметить все гены и другие последовательности.