Рак молочной железы (РМЖ) является наиболее распространенным онкологическим заболеванием среди женщин в развитых странах. Ежегодно в Российской Федерации выявляют более 70 тыс. первичных случаев РМЖ [1]. Более 60% первичных случаев РМЖ приходятся на эстрогензависимые формы (люминальный РМЖ) [2]. Значительный вклад в улучшение безрецидивной и общей выживаемости больных люминальным РМЖ внесла гормональная терапия, направленная на подавление функциональной активности рецептора эстрогенов (РЭ) альфа и подавление синтеза эндогенных эстрогенов.
РЭ альфа, кодируемый геном ESR1, принадлежит к суперсемейству ядерных рецепторов, включающему, кроме рецепторов эстрогенов альфа и бета, также андрогеновые, прогестиновые, глюко- и минералокортикоидные рецепторы. РЭ альфа — белок с молекулярной массой 66 кДа, состоящий из 4 основных доменов: аминотерминального, ДНК-связывающего, лигандсвязывающего (ответственного за взаимодействие с эстрогенами) и карбокситерминального. В неактивном состоянии РЭ альфа связан с белком теплового шока 90 (heat shock protein, hsp90) и равномерно распределен между цитоплазмой и ядром [3]. Взаимодействие эстрогена с лигандсвязывающим доменом РЭ альфа вызывает диссоциацию белка hsp90 [2], изменение конформации и фосфорилирование рецептора. После этого он последовательно связывается с коактиваторами, димеризуется и переходит в активное состояние. Первичным коактиватором РЭ альфа является белок SRC-3, вторичными — p300/CBP, NCOA2, третичным — CARM1 [4]. В активном состоянии РЭ альфа выступает в качестве транскрипционного фактора в ядре клетки, связываясь либо напрямую с эстрогеновым ответным элементом (estrogen response element, ERE) в промотерных регионах целевых генов, либо опосредованно через белок-белковые взаимодействия с транскрипционными факторами из семейств AP-1 или SP-1 [5]. По информации базы данных TRRUST v2, РЭ альфа непосредственно контролирует экспрессию 76 генов [6]. Среди них ингибитор апоптоза BCL2, 6 транскрипционных факторов (E2F1, FOS, JUN, JUNB, SP1, RUNX2), регулятор транскрипции и восстановления ДНК BRCA1.
Молекулярные механизмы патогенеза
РЭ альфа регулирует ключевые процессы жизнедеятельности люминального РМЖ: метаболический статус, пролиферативную активность, избегание апоптоза. Две трети больных первичным люминальным РМЖ отвечают на гормонотерапию ингибиторами рецептора эстрогенов, что проявляется в подавлении роста первичной опухоли и формирования метастазов [7]. Тамоксифен — наиболее часто применяемый в клинической практике селективный антагонист РЭ альфа и агонист РЭ бета [8—10]. Тамоксифен связывается с лигандсвязывающим доменом РЭ альфа, индуцирует диссоциацию БТШ90 с последующей димеризацией РЭ. Тамоксифен не блокирует ДНК-связывающий домен РЭ альфа, что позволяет рецепторному комплексу связаться с эстрогеновым ответным элементом активируемого гена, однако препятствует активации карбокситерминального домена и взаимодействию активированного РЭ альфа с вторичными коактиваторами (p300/CBP и NCOA2), что приводит к практически полному подавлению транскрипции активируемого гена [11].
Прием тамоксифена в течение 5 лет снижает частоту рецидивов ранних стадий люминального РМЖ в 2 раза на период приема препарата и на 1/3 в последующие 5 лет. Частота рецидивов РМЖ за 5 лет гормональной терапии тамоксифеном находится на уровне 12% [9, 10]. Тем не менее значительная часть больных с местнораспространенной и практически все больные с метастатической формой люминального РМЖ сталкиваются с de novo формированием резистентности к тамоксифену [12, 13] — активацией в опухолевой клетке альтернативных сигнальных каскадов, поддерживающих высокую пролиферативную активность и блокирующих апоптоз.
В настоящее время отсутствует консенсус по молекулярным механизмам, лежащим в основе резистентности к тамоксифену [14]. Примерно в 20% случаев резистентность обусловлена полной потерей экспрессии РЭ альфа. Также возможны эпигенетические модификации, приводящие к активации альтернативных промоторов гена ESR1. Транскрипция гена ESR1 с неканонических промоторов приводит к образованию альтернативных вариантов РЭ альфа. Канонический вариант РЭ альфа имеет молекулярную массу 66 кДа, в то время как альтернативные транскрипционные варианты значительно короче и имеют массу 36 и 46 кДа. Укороченные изоформы РЭ альфа являются продуктами альтернативного сплайсинга. Изоформа с молекулярной массой 46 кДа характеризуется сплайсингом первого экзона ESR1, что приводит к практически полному отсутствию аминотерминального домена РЭ альфа. В свою очередь изоформа с молекулярной массой 36 кДа характеризуется сплайсингом не только 1-го, но также 7-го и 80-го экзонов, что приводит к потере и аминотерминального, и карбокситерминального доменов. Альтернативные варианты РЭ альфа характеризуются измененными характеристиками лигандсвязывающего домена и изменением внутриклеточной локализации РЭ альфа [15]. В частности, укороченная изоформа РЭ альфа с молекулярной массой 46 кДа с большей эффективностью реализует неядерные эффекты от активации РЭ альфа, в том числе фосфорилирование eNOS [16].
Для опухолевых клеток характерно возникновение мутаций в гене ESR1, прежде всего в лигандсвязывающем домене. Так, мутация в положении Cys447 нарушает пальмитирование лигандсвязывающего домена РЭ альфа и кавиолин 1 опосредованный транспорт РЭ альфа в липидные рафты клеточной мембраны, что не только вызывает перераспределение РЭ альфа, но и снижает его функциональную активность [17]. Мутация в положении Tyr537 приводит к изменению третичной структуры лигандсвязывающего домена РЭ альфа, делает невозможным его взаимодействие с hsp90 [18], облегчает димеризацию РЭ альфа. Димеризация рецептора без контроля hsp90 приводит к постоянному пребыванию РЭ альфа в активном состоянии, что значительно снижает эффективность антиэстрогеновой терапии [19].
Потеря активности РЭ альфа приводит к активации компенсирующих сигнальных каскадов (PI3K/AKT/mTOR, CyclinD1/CDK4/6), уже не подверженных воздействию гормональной терапии. Каскад PI3K/AKT/mTOR регулирует активность значительного количества факторов транскрипции (CREB2, E2F3, ERa, ERRa, HIF-1a, NFkB, STAT3), ответственных за экспрессию генов, находящихся под контролем РЭ альфа [20]. В свою очередь каскад CyclinD1/CDK4/6 контролирует активность всего семейства факторов транскрипции E2F [21], также регулируемого РЭ альфа [22].
Клинические данные свидетельствуют о том, что опухоль может переключаться с эстрогензависимого на эстрогеннезависимые сигнальные каскады под воздействием терапии [23]. Один из вариантов такого переключения основан на активации экспрессии гена ERBB2 (HER2/neu), кодирующего рецептор эпидермального фактора роста 2-го типа. Причем возможен вариант как гиперэкспрессии, так и увеличения копийности данного гена. В in vitro и ксенографтных моделях была продемонстрирована компенсаторная активация сигнальных каскадов факторов роста, обеспечивающая выживание и пролиферацию опухолевых клеток на фоне гормональной терапии [5, 24]. Разработано несколько подходов к преодолению гормональной резистентности опухоли с помощью ингибиторов CDK4/6 (palbociclib, ribociclib) и mTOR (everolimus), реактивации экспрессии РЭ альфа [25], однако данные подходы эффективны непродолжительное время и не для всех пациентов [26—28].
Значительная роль в формировании гормонорезистентности отводится эпигенетическим механизмам: гиперметилированию промотора РЭ альфа [25], посттранскрипционной регуляции экспрессии малыми некодирующими РНК (микроРНК) [29, 30].
Роль микроРНК в патогенезе
МикроРНК составляют одно из самых многочисленных семейств некодирующих РНК. Количество описанных микроРНК человека превысило 4000 и продолжает расти [31]. МикроРНК участвуют в регуляции экспрессии генов и вовлечены во множество процессов в организме, например в пролиферацию и дифференцировку клеток, апоптоз и различные метаболические пути [32—34]. По существующим оценкам, микроРНК регулируют экспрессию >60% генов белков [35]. Многие патологические процессы, в том числе онкологические заболевания, сопровождаются нарушениями экспрессии микроРНК [36, 37].
Гены микроРНК могут представлять собой самостоятельные транскрипционные единицы или располагаться в интронах генов белков, а также в интронах и экзонах генов некодирующих РНК и иногда в экзонах генов белков [38]. Гены микроРНК транскрибируются РНК-полимеразой II в составе длинных полиаденилированных предшественников (primary miРНК, при-микроРНК). При-микроРНК имеют в составе шпильку длиной ~70 н. (пре-микроРНК), содержащую последовательность зрелой микроРНК. Пре-микроРНК вырезаются из предшественника РНКазой III Drosha в комплексе с РНК-связывающим белком DGCR8 и с помощью белка Exportin 5 транспортируются в цитоплазму, где подвергаются дальнейшему процессингу с участием РНКазы III Dicer в комплексе с РНК-связывающим белком TRBP. Образующиеся ~22 н. двухцепочечные молекулы ассоциируют с белком семейства Ago, который является основным компонентом белкового комплекса, названного RISC (RNA-induced silencing complex). Одна из цепей дуплекса деградирует, а зрелая микроРНК в составе RISC может комплементарно взаимодействовать с мРНК-мишенью. За редкими исключениями комплементарность между ними неполная и микроРНК связывается с мРНК-мишенью участком в 7—8 нуклеотидов, так называемым сид-регионом. При таком взаимодействии разрезания мРНК по механизму РНК-интерференции обычно не происходит. Поэтому для ингибирования экспрессии необходимо участие дополнительных белков, в частности белка GW182, который ассоциирует с комплексом RISC и рекрутирует белки, осуществляющие репрессию трансляции или деаденилирование и деградацию мРНК [39].
Экспериментально показано взаимодействие сид-региона 14 микроРНК с 3’-нетранслируемым регионом ESR1. Взаимодействия такого типа приводят в остановке трансляции мРНК [40] и уменьшению количества РЭ альфа в клетке. В то же время результаты секвенирования более 747 образцов РМЖ в рамках проекта TCGA показали, что только 6 микроРНК экспрессированы опухолевыми клетками в достаточной мере для того, чтобы влиять на трансляцию РЭ: hsa-miR-22-3p, hsa-miR-26a-5p, hsa-miR-145-5p, hsa-miR-192-5p, hsa-miR-19b-3p, hsa-miR-221-3p [41]. МикроРНК hsa-miR-22-3p, кодируемая геном MIR22HG, относится к основным микроРНК клеток РМЖ. На нее приходится около 7% суммарной экспрессии всех микроРНК клетки. Показано, что ее экспрессия обратно коррелирует с экспрессией РЭ альфа как в клеточных линиях, так и в образцах РМЖ [42]. Снижение экспрессии hsa-miR-22-3p восстанавливает чувствительность клеточной линии MCF-7 к антиэстрогеновой терапии [43].
Одними из наиболее изученных ингибиторов трансляции РЭ альфа являются микроРНК hsa-miR-221-3p/222-3p, кодируемые геном MIR222HG. Несмотря на то что экспрессия данных микроРНК составляет около 0,01% всех микроРНК РМЖ, их экспрессия отрицательно коррелирована с тамоксифениндуцированным торможением клеточного роста и индукцией апоптоза клеточной линии РМЖ MCF-7 [44]. Кроме того, что hsa-miR-221-3p/222-3p непосредственно подавляют трансляцию ESR1, одной из их мишеней является 3’-нетранслируемый регион гена CDKN1B, кодирующего ингибитор циклинзависимой киназы 1B, регулирующий течение клеточного цикла и отвечающий за его остановку в G1-фазе [45]. Гиперэкспрессия данного гена в клеточной линии MCF-7 восстанавливает ее чувствительность к тамоксифену [44].
В ряде исследований была продемонстрирована возможность индукции резистентности к тамоксифену с помощью микроРНК, напрямую подавляющих трансляцию гена ESR1, кодирующего РЭ альфа: hsa-miR-221/222-3p [46], hsa-miR-18a-5p [47], hsa-miR-19a/b-3p [48] и hsa-miR-22-3p.
Перспективные подходы к изучению патогенеза
Более 95% исследований, посвященных молекулярно-биологическим основам патогенеза резистентности к тамоксифену, сосредоточены на 100 наиболее ярко изменяющихся генах и их белковых продуктах. Фактически пристальному изучению подвергается «вершина айсберга» — 1—2% генов клетки. Прежде всего это обусловлено ограничениями, накладываемыми классическими методами исследования образцов ткани опухоли (окрашивание антителами, полимеразная цепная реакция), способными одновременно оценить активность всего нескольких генов. Тем не менее данный подход, опирающийся на результаты изучения сотен тысяч биопсий, позволил выявить десятки клинически значимых генов, разработать на их основе диагностические тест-системы и молекулярно-направленные лекарственные препараты.
Развитие технологий секвенирования и микрочипового анализа позволило перейти от оценки активности десятков генов к изучению активности всего ансамбля генов клетки — транскриптома. Анализ транскриптома дает возможность одновременно оценить совокупность всех факторов патогенеза резистентности к тамоксифену: наличие мутаций в экзонах генов, влияние метилирования и микроРНК на экспрессию соответствующих мРНК, активность различных сигнальных каскадов и факторов транскрипции. Пропорционально количеству анализируемых показателей возросла и сложность вычислительной задачи по поиску сигнальных путей, задействованных в патогенезе. Биоинформационный анализ транскриптомных данных представляет сложную задачу на стыке таких областей, как машинное обучение и статистика. Главной проблемой является дисбаланс между количеством образцов обучающей выборки, которое обычно ограничено несколькими сотнями, и количеством генов-признаков, которое исчисляется десятками тысяч [49, 50]. Такое неравенство быстро приводит к проблеме переобучения — ситуации, когда слишком сложная модель настраивается на идеальное разделение образцов обучающей выборки, теряя способность классифицировать образцы из других выборок.
Общепринятый подход по устранению эффекта переобучения — сокращение размерности данных [51, 52]. В биомедицинских задачах сокращение размерности обычно проводится методом отбора наиболее информативных признаков (мРНК, микроРНК и т.д.), основным выигрышем которого является низкая требовательность к вычислительным ресурсам [53—55]. Результатом реализации подобного подхода стало создание классификаторов, позволяющих оценить риск рецидива люминального РМЖ на фоне терапии тамоксифеном (Oncotype DX и MammaPrint) [53, 54]. Несмотря на то что данные классификаторы позволяют прогнозировать развитие резистентности, они практически не дают информации о молекулярных механизмах, лежащих в основе патогенеза.
Разработан альтернативный подход к поиску механизмов патогенеза резистентности к тамоксифену на основе анализа комбинации признаков, не обладающих большой индивидуальной информативностью, но позволяющих с высокой точностью разделять пациентов на группы с развитием и без развития резистентности к тамоксифену при совместном использовании [56—58]. Подобные комбинации могут быть найдены путем полного перебора комбинаций всех транскриптов клетки. Учитывая, что клетка экспрессирует >50 000 транскриптов, перебор комбинации только из 4 транскриптов потребует около 1 мес при полной загрузке наиболее производительного на 2020 г. супервычислителя Fugaku. Причиной этого является «проклятие размерности» — проблема, суть которой заключается в экспоненциальной зависимости объема вычислений от количества рассматриваемых признаков [59].
В связи с этим актуальной становится задача предварительного уменьшения количества рассматриваемых генов, не опирающегося на индивидуальную информативность признака при прогнозе рецидива. Подобный отбор признаков может быть осуществлен с помощью L1-регуляризованной модели машинного обучения [60, 61]. L1-регуляризованные модели позволяют анализировать данные всего транскриптома вместе и определять комбинации транскриптов заданной длины. Вместе с этим модели несут в себе и некоторые недостатки, главным из которых является потенциально великий риск переобучения, связанный с тем, что гены целенаправленно выбираются для наилучшего описания обучающей выборки.
Перспективным подходом к предварительному отбору генов является анализ интерактомных данных. Данная техника позволяет рассматривать гены не в отдельности, а по совокупности данных их взаимодействия. В результате становится возможным определение генов с высокой внутриклеточной активностью. Логично предположить, что именно такие гены ответственны за развитие резистентности к тамоксифену.
Идея предварительного отбора генов с использованием графа интерактомных взаимодействий для дальнейшего полного перебора была впервые реализована в работе V. Galatenko и соавт. [62]. Был создан граф взаимодействующих мРНК и микроРНК, на основе которого были выбраны комбинации мРНК и микроРНК, ассоциированные с развитием рецидива люминального РМЖ на фоне терапии тамоксифеном. Однако отбор генов был проведен без учета фактических интерактомных взаимодействий, характерных для РМЖ, что могло привести к потере значительного объема прогностической информации.
Подводя итоги, можно констатировать, что, несмотря на значительный объем информации о молекулярно-биологических нарушениях в люминальном РМЖ, необходимо продолжить исследования молекулярных механизмов, лежащих в основе формирования резистентности к тамоксифену. Перспективным является применение интерактомного анализа данных на основе регуляторных графов взаимодействий генов, факторов транскрипции и микроРНК.
Исследование выполнено за счет гранта Российского научного фонда (проект №19-15-00397).
Авторы заявляют об отсутствии конфликта интересов.