Ишемический инсульт (ИИ) — заболевание, характеризующееся острым началом и быстрым развитием с накоплением тяжелых нарушений неврологических функций, которые могут приводить к инвалидизации и смерти. Эффективность профилактики ИИ может быть повышена за счет выявления среди населения групп риска с высокой предрасположенностью к заболеванию. Однако это затруднительно в связи с тем, что ИИ в большинстве случаев является следствием совокупного действия множества факторов — как средовых, включая образ жизни, так и генетических [1—7].
В настоящее время средовые факторы риска развития ИИ хорошо изучены, проводятся мероприятия по снижению их влияния на население. Альтернативное перспективное направление профилактики ИИ заключается в анализе генетических факторов риска, влияние которых может объяснять, по некоторым оценкам, до 40% всех случаев ИИ [8—11]. За последнее десятилетие число исследований генетических факторов предрасположенности к ИИ показывает экспоненциальный рост. Опубликовано множество работ по анализу ассоциаций однонуклеотидных полиморфных локусов (англ.: Single nucleotide polymorphism — SNP) генов, вовлеченных в патогенез заболевания. Появление доступных технологий массового параллельного секвенирования и чипов высокой плотности привело к широкому распространению полногеномного скрининга ассоциаций (англ.: Genome-wide association studies — GWAS), позволяющего на больших выборках анализировать связь множества SNP с заболеванием [12—14]. В рамках международных консорциумов ведутся работы по созданию баз данных генотипов человека, охватывающих значительное число популяций [15]. Однако, по данным многочисленных метаанализов, поиск ассоциаций, проведенный в одной популяции, на других выборках не подтверждается, дает прямо противоположные результаты или имеет низкую статистическую значимость [16—17]. Это значительно затрудняет и даже делает невозможным использование отдельных локусов для анализа предрасположенности к ИИ. С другой стороны, анализ сочетаний генетических факторов затруднен тем, что их взаимодействие носит сложный характер и исключает возможность расчета риска путем простого сложения числа аллелей риска для индивида [18]. В связи с этим для анализа таких взаимодействий разработаны алгоритмы поиска комбинаций значимых предикторов с использованием разных подходов [11, 19—23]. Несмотря на значительный прогресс в этой области, на сегодняшний день нет единой общепринятой модели, позволяющей однозначно описывать сложные межгенные взаимодействия даже для систем с небольшим числом генов и тем более учитывать влияние внешних факторов [18, 24].
Помимо большого числа факторов риска, ИИ также характеризуется многообразием патогенетических механизмов развития, обусловливающим его клинический полиморфизм и подразделение ИИ на подтипы [25, 26]. От 70 до 80% всех случаев ИИ приходится на атеротромботический (АТ) и кардиоэмболический (КЭ) подтипы, различающиеся по характеру течения и факторам риска. Проведены исследования, подтверждающие наличие у этих подтипов наследственных генетических факторов (общих и специфических) [14, 16]. Таким образом, АТ и КЭ ИИ имеют как общую генетически обусловленную патогенетическую основу, так и специфические генетические факторы, определяющие патофизиологические различия этих форм. На основании имеющихся сведений о роли генетических факторов в патогенезе ИИ было отобрано 48 SNP с подтвержденными значениями риска [27, 28].
Цель настоящей работы — разработка методики комплексной оценки генетически обусловленного риска развития АТ и КЭ ИИ и анализ ее эффективности.
Материал и методы
В исследовании использован клинический материал (образцы крови с ЭДТА), полученный для стандартных лабораторных анализов от двух групп: группы больных, проходивших лечение и реабилитацию в Научном центре неврологии в 2013—2016 гг., и популяционной контрольной группы (группа ПК). Группа больных включала пациентов с ИИ, подтвержденным данными клинического неврологического осмотра и результатами инструментальных исследований — компьютерной и/или магнитно-резонансной томографии головного мозга. Всего в группу больных вошли 182 пациента: 110 с АТ ИИ и 72 с КЭ И.И. Критериями включения в исследование считали: возраст моложе 85 лет независимо от пола; отсутствие врожденных пороков сердца или оперативных вмешательств в ближайшем анамнезе. Группа П.К. формировалась из жителей Московского региона, равномерно распределенных по полу и возрасту: 178 мужчин и 182 женщины в возрастных группах до 45 лет, 46—60 и 61—75 лет, не имеющих ИИ в анамнезе на момент обследования.
Геномную ДНК выделяли из клеток периферической крови с помощью набора реагентов РИБО-преп с предварительной обработкой реагентом Гемолитик (Центральный НИИ эпидемиологии). Генотипирование по 48 SNP проводили методом полимеразной цепной реакции в режиме реального времени (ПЦР-РРВ) с определением аллелей полиморфных локусов по двум каналам флюоресцентной детекции с использованием конформационно-блокированных зондов. Верификацию результатов осуществляли определением нуклеотидных последовательностей фрагментов ДНК, содержащих SNP, с помощью пиросеквенирования [29].
Для анализа результатов генотипирования нами ранее были предложены и апробированы методы расчета относительного риска (англ.: Relative risk — RR) по отдельным SNP и обобщенного относительного риска (англ.: General relative risk — GRR), обусловленного комбинацией аллелей, объединенных в группу [28, 30—32]. Значение RR для каждого SNP рассчитывалось, исходя из известной величины отношения шансов (англ.: Odds ratio — OR) генотипа [28] и его частоты (F) в популяции европеоидов (CEU) из базы данных проекта «1000 геномов» (1000 Genomes) [15]. Средний популяционный риск (англ.: Average population risk — APR) по отдельному SNP вычисляется по формуле:
APR=F1∙1+F2∙OR2+F3∙OR3,
а RR каждого из трех генотипов — по формулам:
RR1=1/APR; RR2=OR2/APR; RR3=OR3/APR.
В соответствии с мультипликативной моделью:
GRRкомбинации=RR1∙RR2…RRi…RRj,
где RR1…RRj — RR по каждому из SNP, включенных в группу. GRRкомбинации и каждый из RRi являются нормированными показателями, т. е. их величина более единицы соответствует значениям выше среднего GRRкомбинации или RRi в эталонной популяции, а величина менее единицы — значениям ниже среднего.
Проведенное сравнение частот аллелей большинства анализируемых SNP в выборках популяций европеоидов (Caucasian) из базы данных Национального центра биотехнологической информации США (англ.: National сenter for вiotechnological information — NCBI) и 1000 Genomes [15] с частотами в выборке населения Московского региона в целом не выявило существенных различий [33]. Незначительные отклонения в частотах, выявленные для некоторых SNP, несущественны, поскольку их вклад нивелируется перемножением значений RR для всех SNP, входящих в группу. Это позволяет использовать предложенную методику оценки комплексного генетического риска для анализа полученных данных.
Статистическую обработку результатов проводили с помощью программы IBM SPSS Statistics 19.0 for Windows («IBM Corp.») и пакета EpiTools в среде R 3.4.0 [34, 35]. Для определения различий между группами использовали показатель OR, критерий χ2 и U-критерий Манна—Уитни. Различия считали статистически значимыми при p<0,05.
Результаты и обсуждение
Сравнительная характеристика групп больных и ПК представлена в табл. 1.
На этапе генотипирования среди 48 SNP были обнаружены 4 пары SNP, сильно сцепленные и близко расположенные в геноме. Поскольку SNP в такой паре, вероятно, являлись маркерами одного и того же фактора риска, из каждой пары было удалено по 1 SNP (rs4044210, rs1906591, rs556621, rs730012). Еще 4 SNP (rs4479522, rs429358, rs5918, rs7412) были удалены в связи с их низкой информативностью в анализируемых выборках. Из результатов зарубежных исследований известно, что не все SNP в равной степени ассоциированы с обоими подтипами ИИ, более того, для некоторых из них показана связь только с одним из подтипов [14, 16]. Поэтому для анализируемых выборок необходимо было оптимизировать классификацию SNP на группы, ассоциированные с ИИ и его подтипами, с целью дальнейшего вычисления нескольких GRRкомбинации. Составы этих групп представляют собой простейшие модели генетической предрасположенности к АТ ИИ и КЭ ИИ, а величины соответствующих GRRкомбинации — простые интегральные оценки риска И.И. Для того чтобы избежать эффекта «подгонки моделей под ответ» (или англ.: переобучение — overfitting) при анализе ассоциации оставшихся 40 SNP с АТ и/или КЭ ИИ, все исследованные образцы были рандомно поделены на две равные выборки: обучающую и тестовую [44]. На основании сравнения средних величин RR отдельных SNP среди 180 здоровых из группы ПК и 55 больных с АТ ИИ и 36 больных с КЭ ИИ, входящих в «обучающую» выборку, 40 SNP были разделены на 4 группы (табл. 2).
Произведение величин RR в каждой из групп SNP дает независимые показатели GRR: GRR8АТ+КЭ, GRR7АТ, GRR7КЭ, GRRЗАПАС. По ним можно вычислить 3 производных показателя: GRR15АТ=GRR8АТ+КЭ∙ GRR7АТ; GRR15КЭ=GRR8АТ+КЭ∙GRR7КЭ; и GRR40 ОБЩИЙ=GRR8АТ+КЭ∙GRR7АТ∙GRR7КЭ∙GRRЗАПАС, которые должны характеризовать риск развития АТ, КЭ и ИИ в целом соответственно. Показатели представляют собой порядковые количественные величины, имеющие одномодальное распределение в группе П.К. Диапазон показателей в данном исследовании: 0,13—18,3 (GRR15АТ); 0,21—8,2 (GRR15КЭ); 0,38—3,2 (GRR8АТ+КЭ); 0,033—20,6 (GRR40 ОБЩИЙ).
Прогностический потенциал величин GRR15АТ, GRR15КЭ, GRR40 ОБЩИЙ и GRR8АТ+КЭ определяли вычислением показателя AUC (площадь под ROC-кривой), позволяющего оценить качество бинарной классификации [45]. Показатели GRR15АТ и GRR15КЭ статистически значимо обеспечивают отличие группы ПК от групп пациентов с АТ и КЭ ИИ как в обучающей, так и в тестовой выборке, т. е. эффект «переобучения» практически отсутствует (табл. 3).
Таким образом, предложенные комплексные показатели GRR15АТ, GRR15КЭ и GRR8АТ+КЭ позволяют дифференцировать больных, перенесших ИИ, и здоровых из группы П.К. При сравнении значений этих показателей можно определить условную границу между группами пониженного и повышенного риска развития ИИ и рассчитать такие важные характеристики критерия риска, как OR и популяционная атрибутивная фракция (ПАФ). Выбор границ между группами повышенного и пониженного риска (или низкого, среднего и высокого риска) в общем случае представляет собой сложную задачу, выходящую за рамки статистики. Выбор порога определяет частоту ошибок 1-го рода (ложноположительное включение в группу риска) и ошибок 2-го рода (ложноотрицательное невключение в группу риска). В зависимости от социально-медицинской цены ошибки, определяемой при постановке задач, связанных с предотвращением болезни или применением оптимальных параметров ведения больных, можно минимизировать частоты того или иного типа ошибки или стремиться к определенному балансу между ними. В настоящем исследовании выбран наиболее простой путь, позволяющий продемонстрировать эффективность GRR как показателей риска, обеспечивающих достаточно высокие значения OR (от 1,7 до 3,5), значимо отличающиеся от единицы (табл. 5).
Прогностическая эффективность предлагаемых комплексных показателей генетически обусловленного риска развития ИИ показана различными методами: по величине AUC при ROC-анализе бинарной классификации «население Москвы — больные ИИ в Москве», по значимому различию этих показателей в группе ПК и группах больных АТ и КЭ ИИ, по высокой доле повышенного генетического риска ИИ в группах больных. Принципиально важно, что комплексная оценка, основанная на применении количественных показателей, варьирующих в широких диапазонах, предполагает, что в группе генетически обусловленного риска ИИ находится довольно большая часть населения, а не только лица с отдельными редкими аллелями/генотипами риска. Соответствующие величины ПАФ указывают, что с помощью предлагаемых показателей можно, пусть пока и формально, объяснить и предсказать 20—50% случаев ИИ, т. е. именно ту долю ИИ, которую связывают с наследуемыми факторами по результатам популяционно-эпидемиологических исследований ИИ [8, 9].
В настоящей работе была предпринята попытка преодолеть многочисленные трудности, встречающиеся при оценке генетического риска, обусловленного совместным действием генов [18]. Однако окончательно доказать эффективность разработанных методов расчета и оценки индивидуального риска развития ИИ могут только репродуцирующие исследования на независимых выборках (в том числе на других этнических группах).
Дальнейшие перспективы данного направления могут заключаться в расширении модели оценки риска за счет включения в нее негенетических факторов, выборе более информативных маркеров и последующем внедрении комплексной оценки риска развития заболевания в практику локальных диагностических лабораторий.
Авторы заявляют об отсутствии конфликта интересов.
*e-mail: vitaly_korchagin@rambler.ru