Опубликовано 11 мая 2022, 14:01
5 мин.

Лингвисты подобрали ключ к расшифровке смысла генетического кода

Unsplash

Unsplash

© Unshplash

Профессор Балтийского федерального университета имени Иммануила Канта показал возможность описания генетического кода и его эволюции методами лингвистики: его история представляется как семиозис, то есть как возникновение знаковых отношений, а процесс обработки генетической информации — как коммуникация. Ранее ученый рассмотрел генетический код как управляемую системой правил («грамматикой») знаковую систему, и эта статья — прямое продолжение его работы. Результаты исследования, поддержанного грантом РНФ, опубликованы в ведущем семиотическом журнале Semiotica.

Уже с момента зарождения генетики ученые обнаружили определенное сходство между языком и обработкой генетической информации. Исследователи стали проводить аналогии между текстом и нуклеиновыми кислотами еще и потому, что происхождение генетического кода представляет собой неразрешенный вопрос в биологии — равно как и происхождение естественного языка в лингвистике. Генетический код имеет двойственную природу: он выполняет не только биохимические, но и информационные функции, которые можно описать как систему знаков, регулируемых через их расположение, линейный порядок и контекст. Выходит, что гены представляют собой программу развития зародыша биологических структур, которая напоминает написанные по определенным правилам линейные тексты, содержащие генетическую информацию о биохимических молекулярных структурах и функциях.

Так, вся информация в генах записана с помощью четырех «букв» — нуклеотидов, которые по три собираются в «слова» — триплеты, кодирующие аминокислоты. Поэтому гены можно считать информационными единицами наследственности, ведь их различия состоят только в последовательности символов. Взяв любые три буквы из набора «A, У, Г, Ц», можно собрать 64 различные комбинации, но это не случайная комбинаторика, а регулируемая определенными правилами система, описать которую можно по аналогии с грамматикой естественных языков. На помощь приходит семиотика — наука, изучающая общие закономерности передачи информации при помощи знаков.

Доктор филологических наук, профессор Сурен Золян, сотрудник Балтийского федерального университета имени Иммануила Канта (Калининград), Национальной академии наук Республики Армения (Ереван) и Института научной информации по общественным наукам РАН (Москва) предложил авторскую концепцию структурно-семиотического анализа генетического кода: исследовать его как знаковую систему и процесс передачи заложенной в нем информации. Это так называемое метапредставление, при котором генетические процессы и механизмы получают новое информационное объяснение на основе сходства и различия с языком.

Основой стало замечание первооткрывателя генетического кода Френсиса Крика о том, что генетический код — это некий набор или «словарик» соответствий между двумя «языками» — нуклеотидами (а именно их триплетами) и кодируемыми ими аминокислотами. Автор представил генетический код как язык, включающий четыре блока-компонента: единицы алфавита; словарь; грамматику как правила формирования слов; правила соответствия, соотносящие единицы словаря и категории грамматики. Такой подход позволяет увидеть не замеченные ранее системно-структурные характеристики разных генетических процессов, например белкового синтеза.

Так, различие между лексикой (нуклеотидами) и категориями грамматики (пустые позиции внутри триплета) позволяет выявить правила формирования значимых единиц генетического кода (дуплетов и триплетов) и объяснить их композиционную семантику — правила соответствия между кодонами и аминокислотами. Данный принцип контекстной зависимости позволит описать случаи, когда биохимически одинаковая последовательность нуклеотидов в зависимости от их расположения приобретает иное значение и выполняет другую функцию, а также поможет раскрыть индивидуальный профиль для каждого из нуклеотидов.

Исследователь рассмотрел разные гипотезы происхождения и эволюции генетического кода и пришел к выводу, что он основан на формировании основного для семиотики языка принципа произвольности, то есть на немотивированной смысловой связи означающего и означаемого, что также было указано еще Криком. Он видел в этом основное отличие генетического кода от предопределенной периодической таблицы элементов Менделеева. Кроме того, действуют такие характерные для кодирования информации процессы, как минимизация ошибок и устранение многозначности.

Обобщая наблюдения, Сурен Золян вводит понятие семиопоэзиса — это завершающий этап самоорганизации биологических систем (аутопоэзиса). Ассоциации материальных явлений (в данном случае, нуклеотидов и аминокислот) привели к установлению семиотических связей, в результате чего возникают механизмы хранения и передачи информации, позволяющие создавать устойчивые формы жизни. Возрастающая сложность организации приводит к кристаллизации информационного и семиотического начал. Семиопойэзис — рекурсивная автореференция (ссылка на себя) семиотической системы — становится формой организации биомира, когда в нем определяющими оказываются такие параметры, как смысл и цель. Дуализм генетической информации объясняется тем, что биохимическая субстанция приобретает семиотическую форму. В целом процесс эволюции предлагается рассматривать как процесс семиозиса в действии, который приводит к образованию новых, более сложных семиотических структур, хотя и использующих одну и ту же субстанцию (тот же минимальный набор нуклеотидов).

Поскольку гены имеют свою структурную иерархию (определенную последовательность единиц генетической информации), то сам процесс обработки генетической информации происходит следующим образом. На первом, дотекстовом уровне нуклеотиды в гене объединяются в триплеты; на втором триплеты передают информацию в аминокислоты. Если сравнить этот принцип с любым естественным языком, то нуклеотиды, триплеты, аминокислоты — это соответственно фонемы, морфемы (такие части слова как приставка, корень, суффикс) и слова. На третьем уровне последовательность аминокислот складывается в информационные блоки (РНК) так же, как слова в предложения. Далее по мере усложнения биохимических закономерностей гены дополняются лингвистическими и семиотическим принципами. Возникает коммуникация — отношения, которые напоминают характеристики не столько биологических, сколько знаковых систем. При этом смысловая нагрузка таких текстов возникает благодаря биохимическим различиям, а именно различиям в последовательности «букв» — нуклеотидов.

«Генетический код — продукт многоэтапной эволюции, и механизмы его работы близки принципам организации языка. Генетический код возникает из материи точно так же, как органический мир вырос из неорганического путем введения новых уровней организации. Таким образом, связи между материальными объектами (в данном случае, нуклеотидами и аминокислотами) привели к возникновению семиотических (знаковых и смысловых) связей», — подводит итог Сурен Золян.