Введение
Мобильные генетические элементы (МГЭ) представляют собой неотъемлемую часть геномов большинства живых организмов. Они обладают особой способностью перемещаться в геноме, увеличивая количество своих копий, а также влиять на структуру и функции генома хозяина. Кроме того, их нуклеотидные последовательности могут служить источником новых генов [1, 2].
На транспозиционную активность МГЭ влияет ряд физических, химических и биологических факторов. Изменчивость генома усиливается факторами окружающей среды, тем самым устанавливая новое состояние «индуцированной эволюционной пластичности», когда отбор может закрепить благоприятные мутации в геноме [3—5].
Согласно классификации эукариотические МГЭ делятся на два класса. Ретротранспозоны (класс I) включают МГЭ, которые кодируют обратную транскриптазу и перемещаются через промежуточную РНК, а также их неавтономные производные. Напротив, ДНК-транспозоны (класс II) и их неавтономные производные не используют промежуточную РНК [6, 7].
IS630/Tc1/mariner (ITm) представляет собой одну из наиболее распространенных групп ДНК-транспозонов, члены которой обнаруживаются у большинства изученных эукариот [8]. Активные (функциональные) транспозоны ITm, как правило, обладают единственной открытой рамкой считывания (ОРС), кодирующей фермент транспозазу, которая фланкирована концевыми инвертированными повторами (TIR) [8].
Довольно сложная классификация транспозонов ITm недавно была значительно дополнена и изменена [9, 10]. Обобщая последние данные, их можно разделить на несколько основных групп, таких как Tc1-подобные элементы (TLE/DD34-38E), mariner-подобные элементы (MLE/DD34D), maT/DD37D, rosa/Visitor/DD41D, plants/Guest/DD39D, mosquito/DD37E, pogo/DDxD и IS630/DDxE [11—15].
Хотя транспозоны ITm обнаруживаются практически в каждом эукариотическом геноме [16, 17], лишь немногие из них остаются активными [18—20]. Этот факт объясняется тем, что пик активности большинства транспозонов ITm был давно, и их «жизненный цикл» близок к своему завершению [21]. У гребневика Mnemiopsis leidyi найдено 9 транспозонов, и из них только два потенциально функциональны [22].
Термин «молекулярное одомашнивание» относится к процессу кооптации последовательности МГЭ, начинающей впоследствии выполнять важную функцию для генома хозяина. Молекулярное «одомашнивание» является одним из итогов коэволюции МГЭ и генома [23, 24]. В результате этого процесса последовательности МГЭ становятся незаменимыми для генома хозяина, а сам МГЭ становится эволюционно «бессмертным», в отличие от других, подвергающихся деградации и уничтожению, которыми, как правило, завершается их жизненный цикл. В настоящее время известно, что ряд генов являются потомками МГЭ, хотя многие из них выполняют функции, которые остаются неясными [1]. Некоторые белки МГЭ были включены в систему защиты хозяина, защищая его геном от инфекционных или инвазивных агентов (вирусов или самих МГЭ) [24]. Rag1 и Rag2 являются примерами генов, полученных от МГЭ. Их продукты, белки RAG1 и RAG2, являются ключевыми компонентами специфического иммунитета, в частности, катализатора рекомбинации V (D) J [25, 26]. Случаи одомашнивания известны и среди ITm транспозонов. Например, ген SETMAR приматов кодирует химерный белок, который обладает N-концевым доменом гистон-лизин N-метилтрансферазы и C-концевым доменом транспозазы mariner. Белок SETMAR участвует в механизмах репарации ДНК, включая негомологичное соединение концов и репарацию двухцепочечных разрывов [27]. Кроме того, у многоклеточных организмов известно, как минимум, три случая конвергентной доместикации pogo-подобных элементов и появление на их основе белков, связывающихся с центромерами (CENP-B) и участвующих в расхождении хромосом [28].
В данной работе мы искали одомашненные ITm-транспозоны у гребневика Mnemiopsis leidyi. Гребневики представляют собой довольно небольшую группу морских организмов, насчитывающую около 150—200 видов [29]. Большинство гребневиков — планктонные хищники с желеобразным телом, похожие на тело медуз, а некоторые представители — донные виды (отряд Platyctenida), несколько похожие внешне на плоских червей [30, 31]. Недавнее сравнение секвенированного генома вида гребневика M. leidyi с геномами других видов подтверждает сестринское родство гребневиков и остальных многоклеточных животных [31—33]. M. leidyi также активно изучался в экологическом аспекте, связанном, прежде всего, с его инвазиями (вызвавшими перестройки пелагической пищевой цепи) в Черное и Азовское море, Мраморное море, Эгейское море, Восточное Средиземноморье и Каспийское море [34—36].
В результате исследования были описаны транскрипты гипотетических химерных генов и проведена оценка их уровня экспрессии.
Материал и методы
Поиск транскриптов гипотетических химерных генов
Для поиска транскриптов элементов ITm и гипотетических химерных генов был использован BLASTn [37]. В качестве матриц для поиска были использованы кодирующие транспозазу последовательности всех девяти элементов ITm. Поиск транскриптов осуществляли в сборке кДНК транскриптов (TSA) M. leidyi (GFAT00000000.1). Для поиска ОРС в выявленных транскриптах использовали ORF Finder (NCBI) [38]. Гипотетические белки, протяженностью более 75 а.о., анализировали с помощью Conserved Domain Search Service (NCBI) для выявления специфических доменов [38].
Анализ экспрессии гипотетических химерных генов
Экспрессию гипотетических химерных генов количественно оценивали с помощью совместного использования программ Kallisto и Sleuth [39, 40]. Количественная оценка была выполнена с помощью Kallisto (v0.46.1), где на основе метода псевдовыравнивания ридов и транскриптов подсчитывается количество содержания РНК в образце и выражается в величине TPM (транскриптов на миллион). Для увеличения достоверности при подсчете было осуществлено 100 повторов (bootstrap 100). Для выравнивания использовалась сборка кДНК транскриптов гребневика M. leidyi GFAT00000000.1. Последующая оценка дифференциальной экспрессии гипотетических химерных генов была выполнена с использованием пакета Sleuth (v0.30.0), в котором на основе предварительных количественных оценок, полученных с помощью Kallisto, создается нормализованная на уровне генов матрица TPM. Нормализованные значения были также скорректированы с учетом возможных погрешностей в данных РНК-секвенирования, полученных в результате применения различных методов определения последовательности нуклеотидов. Для визуализации кластерного анализа использовалась функция Plot_transcript_heatmap в программе Sleuth (рис. 1—3, см. https://mediasphera.ru/upload/medialibrary/files/Mol_genetika_2022_04_032_add.zip). Полученные тепловые карты анализировали визуально. При анализе обращали внимание на воспроизводимость результата в повторах и на интенсивность окрашивания ячеек. Белые ячейки обозначают отсутствие транскрипционной активности, градиентный переход к черному цвету сигнализирует повышение экспрессии до максимального.
Результаты и обсуждение
Транскрипты гипотетических химерных генов
В результате поиска транскриптов элементов ITm не было обнаружено ни одной кДНК, которая бы соответствовала полной кодирующей последовательности (КП) транспозазы какого-либо элемента. Однако было обнаружено 80 последовательностей кДНК, имеющих фрагменты, гомологичные отдельным участкам КП транспозазы. Из них был выбран 21 уникальный транскрипт, ОРС которых кодировала аминокислотную последовательность протяженностью выше 75 а.о. (таблица). Транскриптов, имеющих последовательности, гомологичные КП транспозазы Mariner-5_MLe, было обнаружено больше всего (7). Для Mariner-1_MLe и Mariner-6_MLe было обнаружено 4 и 3 таких химерных транскрипта соответственно. Для остальных элементов было обнаружено от 1 до 2 транскриптов, имеющих последовательности, гомологичные КП транспозазы. Представленные транскрипты имели от одной до четырех гипотетических ОРС, кодирующих аминокислотные последовательности протяженностью от 75 до 1278 а.о. Поиск консервативных доменов в гипотетических белках преимущественно выявлял домены, связанные с транспозазной активностью (Transposase, Integrase core domain, HTH domain in Mos1 transposase) (см. таблицу). Также много было последовательностей без узнаваемых доменов (No CD have been identified) (см. таблицу). Кроме того, встречались последовательности с доменами, характерными для других белков (PLAC8 family, ALG3 protein, von Hippel-Landau (pVHL) protein, ELMO/CED-12 family, Interferon-induced transmembrane protein, Uroporphyrinogen decarboxylase, putative PEP-CTERM system TPR-repeat lipoprotein, Yip1 domain, DUF2723). Также выявлена химерная последовательность, образованная объединением элемента Mariner-6_MLe и ретротранспозона, о чем свидетельствует наличие в транскрипте локусов, гомологичных обратной транскриптазе (Reverse transcriptase) (см. таблицу).
Транскрипты гипотетических химерных генов, выбранные для анализа уровня экспрессии
Элемент | Транскрипт | Длина, п.н. | Участок КП транспозазы, к которому есть гомология | Консервативный домен | Длина кодируемой аминокислотной последовательности, а.о. |
1_MLe | GFAT01138571 | 453 | 522...974 | Integrase core domain | >104 |
GFAT01136858 | 327 | 648...973 | Integrase core domain | >104 | |
GFAT01122274 | 2064 | 978...1122 | PLAC8 family | 170 | |
GFAT01043956 | 1109 | 1...551, 937...1122 | HTH domain in Mos1 transposase | 213 | |
2_MLe | GFAT01016169 | 1180 | 1...304, 731...1043 | Консервативные домены не обнаружены | 122 |
GFAT01125601 | 2842 | 1...1053 | ALG3 protein | 393 | |
Integrase core domain | 350 | ||||
3_MLe | GFAT01001713 | 3481 | 1...933 | Консервативные домены не обнаружены | 167 |
Консервативные домены не обнаружены | 90 | ||||
GFAT01130284 | 2314 | 69...933 | Integrase core domain | 161 | |
No CD have been identified | 85 | ||||
4_MLe | GFAT01050404 | 2812 | 88...949 | von Hippel-Landau (pVHL) protein | 308 |
Консервативные домены не обнаружены | 88 | ||||
5_MLe | GFAT01101644 | 1681 | 1167...1257 | ELMO/CED-12 family | 308 |
GFAT01098100 | 1277 | 1007...1120 | Консервативные домены не обнаружены | 114 | |
GFAT01006243 | 1784 | 1183...1266 | Interferon-induced transmembrane protein | 115 | |
GFAT01016735 | 4790 | 1...1000, 1265...1775 | Integrase core domain | 375 | |
Uroporphyrinogen decarboxylase (URO-D) | 372 | ||||
Консервативные домены не обнаружены | 96 | ||||
GFAT01045696 | 1912 | 436...1000, 1265...1928 | Integrase core domain | 547 | |
GFAT01140651 | 5900 | 1140...1267 | putative PEP-CTERM system TPR-repeat lipoprotein | 1278 | |
Yip1 domain | 227 | ||||
Консервативные домены не обнаружены | 108 | ||||
GFAT01055629 | 1892 | 1011...1086 | Protein of unknown function (DUF2723) | 379 | |
6_MLe | GFAT01031206 | 2753 | 1...253, 251....619 | Transposase; Integrase core domain | 303 |
GFAT01074464 | 1175 | 604...763 | Reverse transcriptase (RT, RNA-dependent DNA polymerase)_like family | 251 | |
GFAT01120903 | 1327 | 1...253, 248...763 | Integrase core domain; Transposase | 351 | |
7_MLe | GFAT01123240 | 847 | 1...816 | Homeodomain-like domain (HTH); Transposase | 232 |
9_MLe | GFAT01016268 | 1037 | 1...687 | Homeodomain-like domain (HTH) | 245 |
Примечание. КП — кодирующая последовательность.
Анализ транскрипционной активности гипотетических химерных генов
Двадцать один гипотетический ген был выбран для оценки транскрипционной активности. Кроме того, для контроля активности в анализ были включены гены домашнего хозяйства tubb (кодирует цитоскелетный белок тубулин), mdh1 (кодирует митохондриальную малатдегидрогеназу — фермент цикла Кребса) и actb (кодирует цитоскелетный белок бета-актин). Выводы о транскрипционной активности делались на основании анализа данных трех экспериментов, архивы коротких чтений (ридов) транскриптомов которых были взяты в базе данных NCBI. На рис. 1 (см. https://mediasphera.ru/upload/medialibrary/files/Mol_genetika_2022_04_032_add.zip) представлены результаты анализа экспрессии в ходе раннего эмбриогенеза, полученные при анализе 40 образцов (PRJNA258375) на стадиях от 0 до 20 ч после оплодотворения. На рис. 2 (см. https://mediasphera.ru/upload/medialibrary/files/Mol_genetika_2022_04_032_add.zip) представлены результаты анализа экспрессии в ходе раннего эмбриогенеза, полученные при анализе 31 образцов (PRJNA362973) на временных отрезках от 1 до 9 ч после оплодотворения. На рис. 3 (см. https://mediasphera.ru/upload/medialibrary/files/Mol_genetika_2022_04_032_add.zip) представлены результаты анализа экспрессии в процессе регенерации эпителия и гребней взрослого M. leidyi, полученные при анализе 96 образцов (PRJNA305523) на временных отрезках от 0 до 2 ч после воздействия.
При исследовании транскрипционной активности гипотетических химерных генов в ходе эмбрионального развития было установлено, что большая часть генов не экспрессируется или нестабильно экспрессируется на низком уровне (см. рис. 1, 2, см. https://mediasphera.ru/upload/medialibrary/files/Mol_genetika_2022_04_032_add.zip). В эксперименте PRJNA258375 только две последовательности показали достаточно устойчивый средний уровень экспрессии (GFAT01130284 и GFAT01043956), тогда как в другом эксперименте (PRJNA362973) гипотетических химерных генов, относительно стабильно демонстрирующих активность, оказалось больше (см. рис. 2, см. https://mediasphera.ru/upload/medialibrary/files/Mol_genetika_2022_04_032_add.zip). При этом в экспрессии двух из них (GFAT01001713 и GFAT01098100) прослеживается динамика к повышению уровня транскрипционной активности в зависимости от времени. У еще двух GFAT01120903 и GFAT01140651 экспрессия хотя и имеет средний уровень, но носит нестабильный характер. Шесть генов (GFAT01043956, GFAT01050404, GFAT01016169, GFAT01016735, GFAT01125601, GFAT01130284, GFAT01101644) демонстрируют стабильную активность на среднем уровне или чуть выше среднего.
Эксперимент по регенерации эпителия и гребней у взрослых особей M. leidyi (PRJNA305523) показал большую вариабельность в транскрипционной активности (см. рис. 3, см. https://mediasphera.ru/upload/medialibrary/files/Mol_genetika_2022_04_032_add.zip), хотя большая часть анализируемых генов по-прежнему была не активна. Локусы, соответствующие транскриптам (GFAT01016735, GFAT01098100, GFAT01122274, GFAT01130284, GFAT01043956, GFAT01125601, GFAT01016169), демонстрируют дифференциальную активность в зависимости от тканей и времени после воздействия.
Во всех трех экспериментах маркерные гены tubb, actb и mdh1 показали стабильную высокую или выше среднего активность, что свидетельствует о приемлемом для анализа качестве транскриптома.
Заключение
В результате данной работы у M. leidyi нами был обнаружен 21 уникальный транскрипт гипотетических химерных генов, имеющих участки, гомологичные ITm-транспозонам. Транскрипционный анализ показал, что в процессе раннего эмбрионального развития, а также в тканях гребней и эпителия взрослых животных преобладающая доля гипотетических химерных генов не экспрессируется либо экспрессируется на низком уровне. Однако в нескольких локусах фиксируется дифференциальный уровень активности в процессе регенерации, что может свидетельствовать о вовлеченности данных генов в молекулярно-генетические процессы гребневиков.
Финансирование
Работа проведена в рамках государственного задания ФГБУН «ИМБИ» «Функциональные, метаболические и токсикологические аспекты существования гидробионтов и их популяций в биотопах с различным физико-химическим режимом», номер гос. регистрации 121041400077-1 и при финансовой поддержке РФФИ и города Севастополя в рамках научного проекта №18-44-920002.
Авторы заявляют об отсутствии конфликта интересов.