Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Харченко Е.П.

ФГБУН «Институт эволюционной физиологии и биохимии им. И. М. Сеченова» РАН

Генетический код и некоторые особенности его реализации в мРНК

Авторы:

Харченко Е.П.

Подробнее об авторах

Прочитано: 1245 раз


Как цитировать:

Харченко Е.П. Генетический код и некоторые особенности его реализации в мРНК. Молекулярная генетика, микробиология и вирусология. 2024;42(4):3‑11.
Kharchenko EP. The genetic code and some features of its implementation in mRNA. Molecular Genetics, Microbiology and Virology. 2024;42(4):3‑11. (In Russ.)
https://doi.org/10.17116/molgen2024420413

Рекомендуем статьи по данной теме:
мРНК: ор­га­ни­за­ция син­так­си­са. Мо­ле­ку­ляр­ная ге­не­ти­ка, мик­ро­би­оло­гия и ви­ру­со­ло­гия. 2025;(2):14-28

Введение

Спустя почти 60 лет после расшифровки генетический код (ГК) как центральная проблема возникновения жизни не перестает интересовать исследователей. Признано, что его универсальность, организация и помехоустойчивость не могли быть случайным продуктом природы. Ныне мнение исследователей ГК конвергирует к концепции, согласно которой он сформировался под влиянием уникальной комбинации различных факторов, включая и эволюцию сложной системы трансляционного аппарата. И в ранее предложенных гипотезах (стереохимическая, коэволюционная , минимизация ошибок и др.), и в главенствующей ныне гипотезе РНК-мира в происхождении ГК предполагается многостадийность [1—4].

Экспериментально воссоздать условия возникновения примордиалного ГК и стадий его экспансии практически невозможно. Но полностью ли извлечена информация относительно организации ГК? Не содержатся ли в линейной последовательности триплетов в генах ограничения, поскольку реализованное в эволюции многообразие белковых последовательностей существенно меньше потенциально возможного? Оно, по-видимому, объясняется происхождением ныне существующих белков из сравнительно небольшого числа предковых генов. К тому же между первичными структурами разных белков эукариот, прокариот и вирусов существует глобальный пептидный континуума родства [5].

С активным развитием синтетической биологии на передний план выдвинулись проблемы расшифровки регуляторного кода мРНК и вклада в него синонимических кодонов (СК), с которым связаны стабильность мРНК и ее вторичная структура, эффективность трансляции, локализация и сплайсинг мРНК и котрансляционное свертывание белка. Анализ линейного распределения в мРНК кодонов позволил выявить ограничения в кодирования генов, проявляющееся в соседстве триплетов преимущественно с идентичными или близкими значениями индексов комплементарности (ИК). Последние равны общему числу комплементарных связей триплета с узнающей его тРНК [6]. Это ограничение является, по-видимому, не единственным. Поэтому в данном сообщении предпринят краткий анализ композиции ГК и анализ других возможных общих особенностей ограничений в мРНК разных белков, информация о первичной структуре которых была почерпнута в Интернете из доступных баз данных.

Правила композиции генетического кода

Для описания особенностей вырожденности ГК воспользуемся его таблицей (рис. 1), которая имеет иное представление, чем обычно принятое для стандартного ГК. Оно разбивается на две симметричные половины. В одной из них расположены квартеты триплетов одного корня (корень триплета — первые два его основания), кодирующие только одну аминокислоту, а в другой — квартеты триплетов одного корня, кодирующие не одну аминокислоту. Такое представление ГК способствовало двум вариантам формулировок правил композиции ГК, отражающим вырожденность ГК, один из которых основывался на представлении о сильных и слабых корнях триплетов, предложенном Ю.Б. Румером [7]; другой — на введенном нами понятии антикомплементарности нуклеотидов [8, 9]. Возможен и третий, более простой вариант правил композиции ГК, отражающий закономерности его вырожденности, который приводим ниже.

Рис. 1. Вариант представления таблицы ГК.

1. При наличии у квартета триплетов одного корня во второй позиции цитозина квартет триплетов кодирует только одну аминокислоту, а при наличии во второй позиции аденина — не одну аминокислоту.

2. При наличии у квартета триплетов одного корня во второй позиции гуанина или урацила квартет триплетов одного корня кодирует одну аминокислоту, если первой позицией корня является гуанин или цитозин, и кодирует не одну аминокислоту, если первой позицией корня является аденин или урацил.

3. Если квартет триплетов одного корня кодирует не одну аминокислоту, то триплеты каждой из них в третьей позиции содержат либо только пурины, либо только пиримидины.

Приведенный вариант правил вырожденности ГК справедлив для всех 16 квартетов триплетов ГК и подчеркивает различную роль нуклеотидов в распределении триплетов одного корня по кодируемым аминокислотам. Трактовка приведенных правил, очевидно, связана с проблемой возникновения и эволюцией генетического аппарата в целом. Опираясь на отдельные эволюционные биохимические факты, было высказано предположение, что первичные нуклеиновые кислоты должны были бы принадлежать к ГЦ-типу и поэтому в примитивном ГК изначально использовалась лишь часть кодонов с корнем ГЦ-типа [8, 9].

Последующий же этап эволюции ГК связан с большей специализацией триплетов, включением в код триплетов смешанного типа и, наконец, триплетов АУ-типа и возникновением дифференциации вырожденности триплетов по третьему основанию [8, 9]. Последнее, как сказано в третьем правиле, допускает лишь вариант присутствия либо пуринов, либо пиримидинов, но не комбинацию пурина с пиримидином. Эта строгость в дифференциации триплетов по третьему основанию, возможно, связана с обеспечением помехоустойчивости ГК, ибо в природе наиболее частыми мутациями являются транзиции и замена одного пурина на другой (либо одного пиримидина на другой ) сохраняет первичную структуру белка.

Принцип ограничения в кодировании генов

Дифференциация триплетов по третьему основанию представляется важной и для обеспечения принципа (феномена) ограничения в кодировании генов. Он был установлен в результате анализа состава дикодонов и частот встречаемости разницы между ИК (на рис. 2 представлены ИК триплетов) соседствующих трикодонов/кодонов (считанных, имитируя процесс трансляции на рибосомах, со сдвигом рамки на один кодон) в последовательностях разных генов. Оказалось, что лищь 2—3% трикодонов в каждом гене разнятся от предшествующих трикодонов по ИК на 3, а разницу по ИК 0 или 1 имеют 74—84% соседствующих трикодонов, т.е. даже разница между ИК, равной 2, в генах не предпочтительна [6]. В качестве иллюстрации принципа ограничения кодирования генов на рис. 3 представлена последовательность значений ИК трикодонов гена гистона H4 человека.

Рис. 2. Таблица значений ИК кодонов.

Рис. 3. Последовательность значений индексов комплементарности трикодонов гена гистона Н4 человека при сдвиге рамки считывания на 1 кодон.

Выявленные ограничения в различия трикодонов, считываемых со сдвигом на один шаг, по их ИК предопределены такими же ограничениями на уровне соседствующих триплетов. И действительно, анализ показал, что распределение частот встречаемости разницы последовательных триплетов по ИК аналогично таковому для трикодонов. Необходимо также заметить, что при редкой встречаемости разницы последовательных кодонов/трикодонов по ИК, равной 3, еще более редкой должна бы быть встречаемость трикодонов, у которых разница между ИК второго триплета и ИК и первого, и третьего триплетов равнялась бы 3. Их доля в исследованных генах составляет менее 1%. Исходя из частот встречаемости разницы между ИК соседних кодонов/трикодонов, наиболее распространенными трикодонами в генах, очевидно, являются те, у которых разница между составляющими их кодонами по их ИК не более 1.

Каждый кодон, за исключением первых и последних трех триплетов (по использованной нами модели считывания триплетов в мРНК), включается как и при трансляции мРНК на рибосомах, в 3 последовательно считаваемые трикодона, и очевидно, что ИК каждого триплета в трикодоне связан с ИК двух последующих и двух предшествующих триплетов. Это подводит к признанию существования в генах континуума связности триплетов по значениям их ИК [6].

Примечательно, что выявленные общие ограничения в кодировании генов не ведут к запретам соседствования аминокислот в первичной структуре белков, поскольку, во-первых, вырожденность кодирования аминокислот реализуется СК, разница между которыми по ИК не превышает 1 (см. рис. 2). Во-вторых, при ограничениях в кодировании гена для отсутствия ограничений соседства аминокислот в белке в композиции ГК особенно важно то, что СК аминокислот, кодируемых двумя триплетами, в третьей их позиции (см. рис. 2) содержат либо пурины, либо пиримидины, так как наличие в третьей позиции как комплементарных, так и некомплементарных пурина и пиримидина, с одной стороны, ограничивало бы разнообразие первичных структур белков, а с другой стороны, ухудшало бы помехоустойчивость ГК, поскольку преобладающие мутации генов реализуются, как отмечалось выше, через транзиции.

Нельзя не заметить, что триплет, кодирующий метионин, имеет ИК, равный 7, а не 6. В последнем случае возросли бы ограничения по включению метионина в соседство с отдельными аминокислотами в белке, поскольку мутации в триплетах, кодирующих, например, глицин, аргинин, пролин или аланин и соседствующих с триплетом, кодирующим метионин, могут приводить к разнице между соседними трикодонами, равной 3, которую природа предпочитает избегать. В этом аспекте триптофан, также кодируемый одним триплетом, но имеющим ИК, равный 8, имеет преимущество, поскольку ИК его триплета имеет варианты не отличаться от ИК триплетов всех других аминокислот либо отличаться на 1.

Вышесказанное служит аргументацией к тому, что полное понимание композиция ГК невозможно без выявления особенностей кодирования генов и запретов в нем, что особенно важно сегодня для синтетической биологии.

Асимметричность состава динуклеотидов и дикодонов в мРНК

Как замечено выше, ограничения в кодировании мРНК по значениям ИК трикодонов, считываемых сдвигом на один триплет, предопределено такими же ограничениями на уровне соседствующих триплетов, и эти ограничения не единственные. Анализ динуклеотидов и соседствующих кодонов (дикодонов) в мРНК разных белков вирусов, прокариот и эукариот (с общей протяженностью в 101 922 триплетов) выявил асимметричность в составе их нуклеотидов (рис. 4). Наиболее выраженная асимметричность проявляется по содержанию в мРНК дикодонов, у которых в третьей позиции первого кодона содержится урацил (тимин), а в первой позиции второго кодона — гуанин (см. рис. 4 b). Поскольку эти позиции триплетов в динуклеотидах соседствуют, то эту особенность дикодонов можно интерпретировать как частую встречаемость динуклеотидов T(U)pG в позиции ••X-Y•• дикодонов. Для того чтобы оценить, насколько высока асимметричность дикодонов по встречаемости в них в позиции ••X-Y•• динуклеотидов T(U)pG, были подсчитаны частоты динуклеотидов в общей выборке последовательностей мРНК (см. рис. 4 a), которые свидетельствуют о том, что более половины T(U)pG приходятся на позиции ••X-Y•• дикодонов. В других позициях дикодонов частота динуклеотидов T(U)pG меньше даже частоты динуклеотида TpA. Последний, как известно, вместе с динуклеотидом CpG встречаются в мРНК реже остальных динуклеотидов.

Рис. 4. Частоты динуклеотидов и сочетаний нуклеотидов в дикодонах мРНК.

Объяснение различий частот динуклеотидов в мРНК связано с признанием того, что ГК сформировался под влиянием уникальной комбинации различных факторов. Среди них частота встречаемости аминокислот в белках, преобладание в мутагенезе транзиций над трансверсиями, определяющее предпочтительные замены кодонов, вероятность мутирования в триплет, кодирующий редкую неизофункциональную аминокислоту либо аминокислоту, изменяющую конформацию белка, уровень вероятности мутирования триплета в стоп-кодон, а также влияние феномена ограничения кодирования генов, связанного с ИК. Так самая низкая частота динуклеотида CpG в мРНК, по-видимому, обусловлена тем, что высока вероятность мутирования его в результате транзиций в динуклеотид T(U)pG, являющийся корнем (корень кодона — первые два его нуклеотида) квартета триплетов, кодирующих стоп-кодон и цистеин. Появление новой позиции цистеина в белке может привести к резкому изменению его конформации. Высок риск мутирования корня CpG триплетов (аргинин) и в CpA, являющийся корнем триплетов, кодирующих неизофункциональные аргинину аминокислоты гистидин и глутамин. Возможно, эти риски с корнем CpG обусловили закрепление за аргинином кодирование шестью триплетами. Высокая вероятность мутирования корней T(U)pC (серин) и CpT(U)(лейцин) в корень CpC (пролин) несут риск изменения конформации и соответственно утраты функции белка, что также, возможно, послужило решающим фактором в кодировании серина и лейцина шестью кодонами. Добавим, что для триплетов с корнем CpA (глутамин и гистидин) высок риск мутировать в триплеты с корнем T(U)pA, являющимся корнем стоп-кодонов и неизофункциональной аминокислоты (тирозин). Аналогичные риски свойственны и для корня T(U)pG.

Другие особенности состава нуклеотидов в дикодонах связаны с первыми и вторыми позициями составляющих их триплетов. Так, наиболее часто встречаются дикодоны, в которых первые позиции составляющих их кодонов представлены аденином и гуанином (см. рис. 4 c), а во вторых позициях преобладают аденин и тимин (см. рис. 4 d). В совокупности эти особенности частот нуклеотидов в первой и второй позициях триплетов дикодонов отображают частоту аминокислот в белках.

Композиция ГК позволяет кодировать одну и ту же первичную структуру белка огромным множеством вариантов первичных структур мРНК. Однако выявленная асимметричность в частоте динуклеотидов и дикодонов с определенным составом нуклеотидов, как и общность ее для мРНК разных белков организмов всех уровней эволюционной иерархии, служит дополнительным свидетельством наличия в природе ограничений в кодировании мРНК.

Синонимические замены

Эволюция генов чаще всего оценивается по изменению первичной структуры кодируемого белка — по возникновению в последнем замен отдельных аминокислот. Но эти мутации могут повлечь изменение разницы ИК между последовательными трикодонами, нарушая принцип ограничения кодирования генов. Для закрепления в гене полезных мутаций, повлекших замену аминокислот, необходимо существование «механизма» выравнивания разницы по ИК между соседствующими кодонами до и после сайта мутации. И самые естественные кандидаты для такого выравнивания разницы по ИК — синонимические мутации. То, что именно они выполняют эту роль, можно продемонстрировать на примере наиболее древнего белка эукариот — гистона H4. На рис. 5 приведены последовательности кодонов и аминокислот гистонов Н4 Tetrahymena thermophila и человека, очень далеко отстоящих друг от друга по возникновению в эволюции.

Рис. 5. Различия первичных структур гистонов Н4 Tetrahymena thermophila и человека и их генов.

Примечания: обозначения вертикальных рядов слева направо: последовательная нумерация аминокислот в первичной структуре гистонов Н4, последовательность аминокислот гистона Н4 T. thermophile, последовательность аминокислот гистона Н4 человека, последовательность кодонов мРНК гистона Н4 T. thermophile, последовательность кодонов мРНК гистона Н4 человека. = — идентичность позиций, * — синонимические замены.

Белки обоих организмов отличаются по 24 позициям, а их гены в дополнение к мутациям, приведшим к замещениям аминокислот, отличаются еще по 49 синонимическим мутациям. Примечательно, что число синонимических мутаций вдвое больше числа мутаций, приведших к аминокислотным заменам, и ими объясняется сильные различия генов H4 по нуклеотидному составу (у Tetrahymena thermophila %GC равен 45, а у человека — 64), а их трансляционные коды сильно различны (рис. 6).

Рис. 6. Трансляционный код генов гистонов H4 Tetrahymena thermophila и человека.

Сходная картина отмечается и для генов гемагглютининов пандемических штаммов вируса гриппа H1N1 A/South Carolina/1/18 и A/California/04/2009, отстоящих друг от друга по возникновению почти на 100 лет. Первичные структуры их гемагглютининов отличаются по 79 позициям, которым сопутствуют различия по 191 синоимическим мутациям. У штаммов вирусов гриппа текущих эпидсезонов число обоих типов мутаций поменьше, но пропорции между ними примерно те же. Очевидно, что синонимические мутации — важнейший фактор в эволюции генов, и без них описание и понимание эволюции генов не является полным. Лишь сравнительно недавно пришло понимание о роли синонимических мутаций в изменении стабильности мРНК и ее вторичной структуры, ими определяется локализация, сплайсинг, эффективность трансляции мРНК и котрансляционного свертывания белка, реализуя регуляторный код [10, 11].

Запрещенные дикодоны

Продолжением анализа других возможных ограничений в кодировании генов стал поиск запрещенных дикодонов в мРНК. С этой целью мы воспользовались разработанной нами компьютерной программой анализа встречаемости дикодонов в мРНК. Она позволяет уточнить численность и состав дикодонов (а также и дипептидов) по первой или второй позициям [6].

Кумуляция результатов анализа генов белков, разных по функциям, по длине и нуклеотидному составу и в совокупности превышающих 100 000 триплетов (заметим, что число вариантов возможных дикодонов равно 3721), позволила выявить очень редко встречающиеся в мРНК дикодоны, а также не встречающиеся в анализируемой выборке генов дикодоны. К числу очень редко встречающихся дикодонов отнесены те, частота которых на 100 000 триплетов была равна 1. Приведенные на рис. 7 перечни редко встречающихся и не выявленных дикодонов позволяют отметить ряд их особенностей. В частности, в них преобладают, с одной стороны, кодоны аминокислот (серин, лейцин и аргинин), кодируемых 6 кодонами, а с другой стороны, кодоны с динуклеотидом CpG.

Рис. 7. Список редко встречающихся (А) и не обнаруженных (Б) в исследованных генах человека дикодонов.

Комплементарные кодоны

Стабильность мРНК и ее вторичной структуры зависит от содержания в ней аутокомплементарных фрагментов, способных образовывать короткие спиралевидные структуры. Обогащенность последних гуанином и цитозином формирует более прочное комплементарное взаимодействие большим числом водородных связей. Поэтому один из подходов стабилизации мРНК-вакцин основан на обогащении мРНК синонимическими кодонами, содержащими соответственно гуанин и цитозин [12—15]. Риск такого рекодирования мРНК сопряжен с возникновением триплетов/трикодонов с высокими ИК и соответственно с нарушением природных ограничений в кодирования генов, способных повлечь непредсказуемые изменения свойств мРНК и кодируемого ею белка, в числе которых могла бы утрата белком своей биологической активности (при сохранности исходной первичной структуры) из-за нарушения котрансляционного сворачивания белка [10, 11]. Стабилизация структуры мРНК через модифицирование ее СК с большим содержанием гуанина и цитозина — не единственный подход. Обобщенный метод стабилизации структуры мРНК, включающий и частичное рекодирование ее СК с большим содержанием гуанина и цитозина, заключается в таком изменении пропорций СК аминокислот (не изменяя их общего числа в мРНК) , которое увеличивало бы содержание комплементарных кодонов.

В представленной таблице ГК (рис. 8) комплементарные триплеты соединены линиями и видна обособленность столбцов квартетов триплетов по наличию в них комплементарных пар триплетов. Одна пара столбцов включает квартеты триплетов с гуанином и цитозином во второй их позиции, и с нею связаны наибольшие возможности рекодирования гена синонимическими комплементарными парами, поскольку 6 из 8 представленных в ней аминокислот кодируются 4 или 6 триплетами. Другая пара столбцов охватывает триплеты с аденином и тимином (урацилом) во второй их позиции.

Рис. 8. Комплементарные триплеты генетического кода.

Интегрирование информации о СК и комплементарных кодонах в таблицах, приведенных на рис. 8 и 9, применительно к мРНК S-белка коронавируса позволяет выявить явную асимметрию в содержании в ней комплементарных кодонов. Так в ней высоко содержание триплетов серина ТСА и лейцина ТТА, которые, как и другой триплет лейцина СТА (см. рис. 9), лишены в композиции стандартного ГК парных им комплементарных триплетов из-за принадлежности последних к стоп-кодонам. Резко асимметричны по содержанию комплементарные пары триплетов первой пары столбцов квартетов триплетов с гуанином и цитозином во второй их позиции, например, TCT-AGA, ACT-AGT, ACA-TGT и др. В меньшей степени асимметричны по содержанию комплементарные пары второй пары столбцов квартетов триплетов с аденином и тимином (урацилом) во второй их позиции. В целом же, в каждой паре комплементарных триплетов не соблюдается баланс по их количеству. Напрашивающийся вывод: мРНК S-белка коронавируса нестабильна из-за бедности ее потенциала формировать в ней спиральные фрагменты, и введение ее в натуральном виде в организм вакцинируемого повлечет быстрое ее разрушение. Неудивительны в этом аспекте усилия вирусологов по рекодированию мРНК S-белка коронавируса для придания ей стабильности в качестве вакцины [16].

Рис. 9. Трансляционный код S-белка коронавируса штамма Wuhan SARS-CoV-2.

При рекодировании мРНК с целью придания ей стабильности оптимизацией содержания комплементарных пар триплетов важно учитывать не только асимметричность в их количественном содержании, но и их локализацию. Выполненный нами анализ разных генов показал выраженную ограниченность кодирования генов по локализации комплементарных пар триплетов — они очень редко образуют дикодоны, их частота встречаемости чаще всего <1%. У гистона H4 нет ни одного дикодона, состоящего из комплементарных триплетов, у гена сывороточного альбумина лишь 4 дикодона, а у гена C3 компонента комплемента и α-2-макроглобулина их по 10. Возможный биологический смысл очень редкой встречаемости дикодонов из комплементарных пар заключается в дистантном распределении их друг от друга по длине мРНК, позволяющем формировать шпилечные структуры, обеспечивая ими большую стабильность мРНК и регулируя скорость трансляции и котрансляционное сворачивание белка. Композиция вырожденности ГК связана не только с обеспечением его помехоустойчивости, но и с ограничениями в линейном следовании синонимических и комплементарных триплетов в мРНК, определяя не только первичную структуру белка, но и регуляцию процесса ее трансляции, не раскрытого еще полностью [10].

Как же количественно оценить асимметричность в содержании комплементрных триплетов в мРНК? Можно предложить (используя в качестве примера рис. 9) следующую формулу расчета индекса асимметрии (ИА), обозначив последовательно через S1, S2, S3 и S4 суммы количеств использованных в мРНК триплетов, содержащихся в соответствующей вертикальной колонке рис. 9 трансляционного кода мРНК, и через L количество триплетов в мРНК и отсчитывая нумерацию вертикальных колонок слева направо:

:ИА=100·(|S1 –S2 |+|S3–S4 |)⁄L.

Она оценивает обобщенную асимметричность по комплементарным триплетам. Для избирательной оценки асимметричности по комплементарным триплетам с гуанином/цитозином или с аденином/урацилом во второй их позиции можно использовать соответственно формулы

ИА(GC)=100*|S1 –S2 |⁄L и ИА(AU)=100*|S3–S4 |⁄L.

Рассчитанные по этим формулам значения ИА для разных мРНК (эукариот, прокариот и вирусов) приведены в таблице, свидетельствуя о широком варьировании его значений. Чем выше значения ИА, тем больше асимметрия в содержании комплементрных триплетов. Значения же парциальных ИА ориентируют относительно вклада кодонов правой или левой половины ГК (рис. 8) в асимметричность гена по комплементарным триплетам. Специфичность значений ИА для каждого гена исключает возможность существовании в синтетической биологии какого-то одного алгоритма оптимизации несбалансированности комплементрных триплетов в генах при их рекодировании. Более того, несбалансированность генов по комплементрным триплетам в природе является правилом, а не аномалией.

Характеристика генов по асимметричности в содержании комплементарных кодонов

Ген/ источник

Длина в кодонах

%

GC

ИА

ИА (AU)

ИА (GC)

Сыворотчный альбумин человека

609

43

19

8

11

α-2- макроглобулин человека

1324

49

14

4

10

С3 компонент комплемента человека

1663

56

10

5

5

MYH9 вариант миозина человека

1960

59

24

20

4

α-1 цепь коллагена человека

1464

65

10

9

1

Саксин человека

4579

39

8

3

5

Гистон H1 человека

219

61

58

24

34

Гистон H2a человека

130

64

9

7

2

Гистон H2b человека

126

58

32

14

18

Гистон H3 человека

136

60

10

4

6

Гистон H4 человека

103

64

14

1

13

Гистон H4

Tetrahymena thermophila (strain SB210)

103

45

7

3

4

S белок коронавируса SARS- Cov-2, штамм Wuhan

1273

37

10

1

9

Гемагглютинин

H1N1 A/California/ 04/2009

566

41

14

10

4

Гемагглютинин

H1N1 A/South Carolina/1/18

566

42

11

8

3

Гемагглютинин

H2N2 A/JAPAN/305/1957

562

42

9

8

1

Гемагглютинин

H3N2 A/AICHI/2/1968

566

45

8

6

2

Гемагглютинин

H3N2 |A/New_York/51/2023|

566

42

10

8

2

Гемагглютинин H1N1A/Baden-Wuerttemberg/96/2022

566

41

15

10

5

Избирательность в соседствовании между кодонами служит, наряду с ограничениями в разнице по ИК между соседними трикодонами, барьером, который нужно соблюдать при рекодирования генов. Другим барьером являются редко встречающиеся и не обнаруженные в исследованных нами генах человека дикодоны, перечисленные на рис. 6. Эти дикодоны можно рассматривать как запретные для использования при рекодировании. Кроме того, необходимо не нарущать оптимизацией природный дисбаланс в содержании комплементарных триплетов в гене. Учет перечисленных нами барьеров в рекодировании генома/гена посредством изменения состава СК переводит синтетическую биологию на другой уровень, способствуя избеганию неудач. Выявление нескольких ограничений в структуре генов предполагает, что любая ее модификация (в любом гене) должна не противоречить каждому из ограничений, установленных природой.

Заключение

В завершение статьи хотелось бы подчеркнуть, что композиция вырожденности ГК обнаруживает связь с ограничениями в следовании кодонов в генах, и что компоненты аппарата трансляции, вероятно, соучаствовали в предопределении кодирования следования триплетов линейно друг за другом в эволюционном процессе формирования гена. Именно особенности композиции вырожденности ГК, реализующего кодирование аминокислот (за исключением триптофана и метионина) СК с разными ИК, позволили возникнуть в эволюции генам и геномам, резко отличающимся по кодоновому составу, но с проявлением в них ограничений в кодировании, универсальных по своему характеру.

Естественно, возникают вопросы «почему» и «с какой целью» в эволюции сохраняется такое ограничение в кодировании генов и геномов. Как проницательно писал М. Эйген [17], из-за стохастической природы процессов, участвующих в эволюции, и одновременного вовлечения в них нескольких участников ответить на вопрос «почему» безнадежно сложно. Что же касается «биологической цели» ограничений в кодироваании, то можно заметить: если возникновение на уровне эукариот разорванности генов способствовало быстрому порождению разнообразия новых белков посредством комбинаций фрагментов из разных генов, то в ограничениях их линейного кодирования можно усмотреть механизм сохранения в эволюции возникшей ценной информации.

Литература / References:

  1. Koonin EV, Novozhilov AS. Origin and Evolution of the Universal Genetic Code. Annu. Rev. Genet. 2017; 51: 45-62.  https://doi.org/10.1146/annurev-genet-120116-024713
  2. Zagrovic B, Adlhart M, Kapral TH. Coding From Binding? Molecular Interactions at the Heart of Translation. Annu. Rev. Biophys. 2023; 52:69-89.  https://doi.org/10.1146/annurev-biophys-090622-102329
  3. Lei L, Burton ZF. Evolution of the genetic code. Transcription. 2021;12:28-53.  https://doi.org/10.1080/21541264.2021.1927652
  4. Kirschning A. On the Evolutionary History of the Twenty Encoded Amino Acids Chem. Eur. J. 2022; 28: e202201419: 1-22.  https://doi.org/10.1002/chem.202201419
  5. Харченко Е.П. Иммуноэпитопный континуум родства белков и полиреактивность и аутореактивность антител. Медицинская иммунология. 2015; 17: 335-346.  https://doi.org/10.15789/1563-0625-2015-4-335-346
  6. Харченко Е.П. Частные и общие ограничения в кодировании генов и синонимическое рекодирование их. Молекулярная генетика, микробиология и вирусология. 2024;42(1): 4349. https://doi.org/10.17116/molgen20244201143
  7. Румер Ю.Б. Систематизация кодонов в генетическом коде. ДАН АН СССР. 1968; 183: 224-226. 
  8. Харченко Е.П. Некоторые правила композиции генетического кода и возможный путь его эволюции. Журнал эволюцтонной биохимии и физиологии. 1976; 12: 280-281. 
  9. Харченко Е.П. Инварианты генетического кода и возможный путь его эволюции. Журнал эволюцтонной биохимии и физиологии. 1986; 22: 351-357. 
  10. Gonçalves-Carneiro D, Bieniasz PD. Mechanisms of Attenuation by Genetic Recoding of Viruses. mBio. 2021; 12(1): e02238-20.  https://doi.org/10.1128/mBio.02238-20
  11. Martínez MA, Jordan-Paiz A, Franco S, Nevot M. Synonymous Virus Genome Recoding as a Tool to Impact Viral Fitness. Trends Microbiol. 2016; 24 (2):134-147.  https://doi.org/10.1016/j.tim.2015.11.002
  12. Venter JC, Glass JI, Hutchison CA. 3rd, Vashee S. Synthetic chromosomes, genomes, viruses, and cells. Cell. 2022;185 (15): 2708-2724. https://doi.org/10.1016/j.cell.2022.06.046
  13. Lin BC, Kaissarian NM, Kimchi-Sarfaty C. Implementing computational methods in tandem with synonymous gene recoding for therapeutic development. Trends Pharmacol Sci. 2023; 44 (2):73-84.  https://doi.org/10.1016/j.tips.2022.09.008
  14. Komar AA. Synonymous codon usage — a guide for co-translational protein folding in the cell. Molecular biology. 2019; 53: 883-898.  https://doi.org/10.1134/S0026898419060090
  15. Komar AA. The yin and yang of codon usage. Human Molecular Genetics. 2016; 25 (R2): 77-85.  https://doi.org/10.1093/hmg/ddw207.
  16. Bok K, Sitar S, Graham BS, Mascola JR. Accelerated COVID-19 vaccine development: milestones, lessons, and prospects. Immunity. 2021; 54: 1636-1651. https://doi.org/10.1134/S0026898419060090
  17. Эйген М. Самоорганизация материи и эволюция биологических макромолекул. М.: Мир, 1973.

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail

Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.