Агиенко А.С.

ФГБНУ «Научно-исследовательский институт комплексных проблем сердечно-сосудистых заболеваний»

Трифонова М.В.

ООО «Айтентика Дон»

Баздырев Е.Д.

ФГБНУ «Научно-исследовательский институт комплексных проблем сердечно-сосудистых заболеваний»

Цыганкова Д.П.

ФГБНУ «Научно-исследовательский институт комплексных проблем сердечно-сосудистых заболеваний»

Князев Е.Г.

ООО «Международный инновационный консалтинг»

Артамонова Г.В.

ФГБНУ «Научно-исследовательский институт комплексных проблем сердечно-сосудистых заболеваний»

Инновационный подход к прогнозированию кардиоваскулярного риска с использованием методов машинного обучения

Авторы:

Агиенко А.С., Трифонова М.В., Баздырев Е.Д., Цыганкова Д.П., Князев Е.Г., Артамонова Г.В.

Подробнее об авторах

Прочитано: 97 раз


Как цитировать:

Агиенко А.С., Трифонова М.В., Баздырев Е.Д., Цыганкова Д.П., Князев Е.Г., Артамонова Г.В. Инновационный подход к прогнозированию кардиоваскулярного риска с использованием методов машинного обучения. Профилактическая медицина. 2025;28(7):36‑42.
Agienko AS, Trifonova MV, Bazdyrev ED, Tsygankova DP, Knyazev EG, Artamonova GV. Innovative approach for cardiovascular risk predicting by machine learning methods using. Russian Journal of Preventive Medicine. 2025;28(7):36‑42. (In Russ.)
https://doi.org/10.17116/profmed20252807136

Рекомендуем статьи по данной теме:
Ран­нее вы­яв­ле­ние он­ко­ло­ги­чес­ких за­бо­ле­ва­ний же­лу­доч­но-ки­шеч­но­го трак­та: воз­мож­нос­ти раз­ви­тия эн­дос­ко­пи­чес­кой служ­бы в Рос­сий­ской Фе­де­ра­ции. До­ка­за­тель­ная гас­тро­эн­те­ро­ло­гия. 2024;(4):69-80
Ре­зуль­та­ты при­ме­не­ния мо­ди­фи­ци­ро­ван­ной ме­то­ди­ки эн­дос­ко­пи­чес­ко­го ли­ги­ро­ва­ния ва­ри­коз­но-рас­ши­рен­ных вен пи­ще­во­да у па­ци­ен­тов с цир­ро­зом пе­че­ни в со­че­та­нии с ге­па­то­цел­лю­ляр­ной кар­ци­но­мой. Эн­дос­ко­пи­чес­кая хи­рур­гия. 2025;(2):17-25
Оцен­ка зна­чи­мос­ти фак­то­ров ин­дек­са ин­но­ва­ци­он­ной го­тов­нос­ти сре­ды на уров­не ме­ди­цин­ской ор­га­ни­за­ции. Ме­ди­цин­ские тех­но­ло­гии. Оцен­ка и вы­бор. 2025;(2):31-38

Введение

По данным Всемирной организации здравоохранения, широкая распространенность болезней системы кровообращения (БСК) ежегодно становится причиной смерти 18 млн человек в мире, а к 2030 г. количество смертей возрастет до рекордных 23,6 млн [1]. С целью прогнозирования развития БСК у лиц без заболевания используется от 5 до 9 хорошо изученных параметров, применяемых в классических шкалах (SCORE, Фрамингемская шкала и др.). Тем не менее остается неохваченная часть населения с сердечно-сосудистым риском, но его выявление с помощью классических методик затруднительно [2, 3]. Применение методов машинного обучения (случайный лес, деревья решений и пр.) широко распространилось в области диагностики и лечения заболеваний, а также их профилактики. Именно прогностической возможности машинного обучения придается особое значение, поскольку, обучаясь на больших объемах данных, алгоритмы позволяют выявлять нелинейные взаимодействия между изучаемыми параметрами и заданным исходом [4]. Помимо классических факторов риска, на развитие БСК влияют многие другие параметры, которые могут иметь небольшую значимость в развитии заболевания, но оказывать влияние на прогноз БСК [3, 5—7]. Кроме того, дополнение новыми параметрами классических прогностических шкал позволяет снизить переоценку риска смерти от БСК и улучшает качество прогнозных шкал [2, 3, 7—10].

Цель исследования — разработать инновационную модель прогностической шкалы кардиоваскулярного риска и определить диапазон значений параметров модели с применением методов машинного обучения.

Материалы и методы

Набор данных собран на двух этапах проспективного исследования, проведенного с участием респондентов из г. Кемерово и поселений, располагающихся не далее 50 км от города (n=1600). Возрастной диапазон: 35—70 лет. Подробный дизайн описан в работе главного исследователя и соавт. [11]. Первый этап проведен в 2016 г., второй — через 3 года (в 2019 г.). Набор данных состоял из совокупности параметров, сгруппированных в категории (табл. 1).

Таблица 1. Совокупный перечень данных, анализируемых в исследовании

Группа параметров

Набор параметров

Количество параметров, определенных на этапах исследования

1-й этап

2-й этап

Анамнез заболевания и жизни

Инфаркт миокарда, стенокардия, инсульт, хронические болезни коронарных артерий, сердечная недостаточность, фибрилляция и/или трепетание предсердий, другие заболевания сердца, сахарный диабет, заболевания бронхо-легочной системы, желудочно-кишечного тракта и других систем

266

331

Социально-экономический и психосоциальный статус

Профессия, уровень образования, доходов, изменения состава семьи (смерть родственников, развод, отделение от семьи, рождение детей) и другие показатели

139

201

Условия проживания и окрестностей

Близкое расположение магазинов, освещение на улице, возможность общения на прогулке, уровень преступности в окрестностях и другие показатели

237

Образ жизни

Употребление алкоголя и табака, время засыпания и пробуждения, показатели физической активности, изменение образа жизни и другие показатели

261

261

Оценка системы здравоохранения

Посещение частных и государственных клиник, аптек, соблюдение рекомендаций врачей и другие показатели

72

Лабораторно-инструментальные показатели здоровья

Антропометрия, анализ состава тела согласно биоимпедансометрии, спирометрия, лабораторная оценка показателей крови (в том числе липидограмма) и другие показатели

123

23

В рамках 1-го этапа определялось, были ли диагностированы БСК у участников когда-либо в течение жизни, а в рамках 2-го — в течение последних 3 лет (с момента первого визита) согласно предоставленной медицинской документации. Данные, полученные на этапах, проанализированы совокупно и объединены, дизайн представлен на рисунке. Коды заболеваний включали I20—I25: ишемическая болезнь сердца; I30—I52: другие болезни сердца; I60—I69: цереброваскулярные болезни; I70—I79: болезни артерий, артериол и капилляров. Для построения наиболее полной прогностической модели учитывали набор параметров, полученный в рамках очного обследования на двух этапах: у 354 (29,1%) респондентов имелись БСК, а у 863 (70,9%) — нет; суммарно использовано 1915 параметров.

Дизайн исследования.

БСК — болезни системы кровообращения.

Применен метод градиентного бустинга, реализованный в составе фреймворка библиотеки Catboost [12]. Для углубленного анализа параметров и прогнозов модели использовали фреймворк Shap Welcome to the SHAP documentation — SHAP latest documentation. Для определения значимых диапазонов параметров и интересных закономерностей использовали метод ассоциативных правил [13]. Алгоритм ассоциативных правил включает такие параметры, как: поддержка — отражает, как часто в наборе данных вместе встречаются X и Y, достоверность — доля данных, содержащих X, в которых также встречается Y, улучшение — ключевая метрика, которая показывает, что X и Y чаще встречаются вместе, чем по отдельности. Качество модели проверяли трехкратно перекрестно, использовали значения величины площади под кривой (AUC — area under the curve), специфичности (Specificity) и чувствительности (Recall).

Результаты

Предварительные данные опубликованы ранее [14]. В качестве первоначальной обработки набора данных построено 17 моделей машинного обучения, включающих параметры каждой отдельной группы и разных групп (n=1915), (см. табл. 1). При построении модели с наибольшим количеством параметров (n=256) специфичность и чувствительность составляли 0,60 и 0,70 соответственно, а с наименьшим (n=23) — 0,54 и 0,66 соответственно, что являлось недостаточным качеством модели. Максимально возможная специфичность (0,77) обнаружена у модели машинного обучения №17, объединяющей набор параметров по оценке системы здравоохранения (n=72), чувствительность — 0,70. У модели №16, характеризующей условия проживания и окрестностей (n=198), наблюдалась наибольшая чувствительность 0,77, а специфичность при этом составила 0,49. Таким образом, из всех групп параметров определены те, которые обладали наибольшей значимостью, к ним отнесено 192 параметра. Далее построение моделей проводилось только по значимым параметрам (n=192), получено 9 моделей. Исходя из реализуемости модели на амбулаторно-поликлиническом этапе, эксперты-клиницисты отобрали модель (n=28), AUC которой была 0,72, а чувствительность — 0,71.

В итоговую модель вошли параметры с указанием значения, связанного с риском развития БСК (табл. 2).

Таблица 2. Параметры, ассоциированные с риском развития болезней системы кровообращения, и их значимость

Значимость параметра

Параметры, ассоциированные с риском развития болезней системы кровообращения

Диапазон значений измеримых параметров

0,159538

Отсутствие потребления алкоголя в настоящем или прошлом (никогда не употреблял)

Неприменимо

0,116632

Объем форсированного выдоха за 1 с

<2,22 л, [2,22; 2,71]

0,100638

Доля внутреннего жира

≥13

0,095542

Отсутствие потребления пива

Неприменимо

0,089565

Общая продолжительность физической активности, связанной с выполнением рабочих обязанностей

[0,0; 2475,0] MET-мин/нед

0,087362

Отсутствие работы

Неприменимо

0,080219

Уровень холестерина

<4,7 ммоль/л

0,074803

Снижение потребления поваренной соли после врачебной рекомендации

Неприменимо

0,065727

Отсутствие расходов на покупку собственности, земли, скота, ремонт за последние 12 мес

Неприменимо

0,064895

Объем талии

≥103 см

0,058305

Ходьба, связанная с выполнением рабочих обязанностей

[0,0; 1386,0] MET-мин/нед

0,055193

Отсутствие доли физической активности, связанной с выполнением рабочих обязанностей

Неприменимо

0,049917

Объем форсированного выдоха за 1 с

<89,0%, [89,0; 98,17], [98,17; 110,0]

0,047156

Ходьба, связанная с оздоровительными мероприятиями

[0,0; 198,0], [198,0; 792,0], ≥792,0 MET-мин/нед

0,037265

Отношение объема талии/бедер

≥0,94, [0,88; 0,94]

0,037182

Сила мышц правой руки

Не установлена

0,036723

Время засыпания

01:00, 22:00

0,032103

Форсированная жизненная емкость легких

<2,86 л, [2,86; 3,48]

0,031261

Пребывание на пенсии

Неприменимо

0,030698

Физическая активность, приходящаяся на прогулку

[1617,0; 3564,0], [396,0; 1617,0] MET-мин/нед

0,029094

Уровень креатинина крови

<6,7 мкмоль/л [10,1; 15,0], [6,7; 10,1]

0,028292

Посещение врача государственной больницы за последние 12 мес

Неприменимо

0,026192

Сила мышц левой руки

≥34,67 кг

0,022681

Посещение частной аптеки за последние 12 мес

Неприменимо

0,020141

Общая физическая активность

[0,0; 1200,0] MET-мин/нед

0,012550

Отсутствие обращений к врачу за последние 12 мес

Неприменимо

0,010051

Факт изменения образа жизни

Неприменимо

0,004169

Факт получения врачебных рекомендаций по коррекции образа жизни

Неприменимо

Примечание. MET-мин/нед — показатель уровня физической активности, который выражается в количестве метаболических эквивалентов (MET) за 1 нед.

Получено 28 ассоциативных правил. Далее приведены правила, имеющие максимальные значения по критериям поддержки, достоверности и улучшения. Правило 1 (поддержка 25, достоверность 0,758, улучшение 2,6) содержало следующие условия:

— отношение объема талии/бедер (ОТ/ОБ) ≥0,94;

— получение врачебных рекомендаций по коррекции образа жизни;

— физическая активность, приходящаяся на прогулку — [396,0; 1617,0] MET-мин/нед.

Правило 1 свидетельствует о том, что у 25 участников исследования есть БСК, при этом у всех отношение ОТ/ОБ ≥0,94, все респонденты получали врачебные рекомендации по коррекции образа жизни, а физическая активность, приходящаяся на прогулку, была в диапазоне [396,0; 1617,0] MET-мин/нед. Сочетание указанных параметров в удовлетворяющих данным диапазонам значениях приводило к выявлению БСК в 75,8% случаев. При этом выявление (улучшение) данной комбинации условий в 2,6 раза чаще наблюдалось у лиц с БСК, чем без.

Правило 2 (поддержка 10, достоверность 1, улучшение 3,4) содержало следующие условия:

— объем форсированного выдоха за 1 с (ОФВ1), л [2,22; 2,71];

— отношение ОТ/ОБ ≥0,94;

— рекомендация по изменению потребления соли.

Правило 2 указывает на то, что 10 респондентов с диагнозом БСК получали рекомендации по изменению (снижению) потребления поваренной соли, у всех респондентов отношение ОТ/ОБ было ≥0,94, а ОФВ1 находился в диапазоне [2,22; 2,71]. Сочетание указанных условий в 100% случаев приводило к выявлению БСК, при этом у пациентов с данными показателями риск развития БСК был в 3,4 раза выше.

Правило 3 (поддержка 11, достоверность 1, улучшение 3,4) содержало следующие условия:

— отношение ОТ/ОБ ≥0,94;

— снижение потребления поваренной соли после врачебной рекомендации;

— посещение врача в государственной больнице в течение последних 12 мес.

Правило свидетельствует о том, что в 100% случаев у 11 участников исследования с БСК выявлены названные условия. При этом риск БСК определяли в 3,4 раза чаще у пациентов с данными показателями.

Обсуждение

По данным мировой литературы, к неклассическим параметрам, связанным с развитием БСК, относят: темп ходьбы, ОФВ1, концентрацию натрия в моче, уровень основного обмена, силу мышц левой руки, возраст отца на момент смерти, самооценку здоровья [3], уровень цистатина C, индекс пачка-лет [15], гематокрит [16], наличие хронической обструктивной болезни легких [17], сумму амплитуд зубцов SV1+RV5RV6 [18], уровень фибриногена, ОТ, соотношение ОТ/ОБ, частоту сердечных сокращений, уровни C-реактивного белка, глюкозы [6] и пр. К другим ассоциированным с развитием БСК факторам относят психосоциальные: личностные свойства (тип личности Д, агрессивность), отрицательный эмоциональный фон (стресс, тревога), информированность о здоровье и самооценка здоровья, социально-экономические детерминанты здоровья (наличие работы и уровень доходов, уровень образования, район проживания) [19, 20].

В ходе данного исследования выявлены новые факторы (n=28), связанные с риском развития БСК. В отдельных исследованиях подтверждается связь БСК и указанных параметров [3, 6, 15—20]. Однако только в настоящем исследовании все параметры собраны в одну модель с указанием их значимости и величин, связанных с риском развития БСК. Следует отметить, что в полученной модели прогностической шкалы риск развития БСК связан с низким уровнем холестерина — <4,7 ммоль/л, в то время как классические шкалы используют гиперхолестеринемию как фактор риска БСК. Согласно данным отечественных ученых, высокий уровень холестерина имеет обратную зависимость с заболеваемостью БСК, что не противоречит настоящему исследованию [5]. В полученной прогностической модели значимыми признаками были доля внутреннего жира, ОТ и отношение ОТ/ОБ, которые характеризуют массу тела и соответствуют такому фактору, как индекс массы тела, используемому в ряде классических прогностических шкал (Framinghem-30 и Joint British Societies-3). Показатели спирометрии ОФВ1 и форсированная жизненная емкость легких характеризуют дыхательную функцию и являются частью диагностических признаков хронической обструктивной болезни легких наряду с индексом пачка-лет — неклассическими факторами, упомянутыми в мировой литературе. Физическая активность рассмотрена всесторонне: при выполнении рабочих обязанностей, в рамках оздоровительных мероприятий, в свободное время. Это способствует лучшему пониманию уровня физической активности человека и вносит свой вклад в информационный пул факторов риска, помимо известного негативного влияния малоподвижного образа жизни, а также учета только темпа ходьбы в общем прогнозе развития БСК. Пагубное влияние чрезмерных доз алкоголя изучено и представлено в многочисленных публикациях. Полученный в рамках исследования факт того, что потребление алкоголя в настоящий момент не связано с развитием БСК, подтверждается данными мировой литературы [21]. Умеренное употребление алкоголя (красное и белое вино) оказывает протективный эффект в отношении БСК и выполняет защитную функцию для сердечно-сосудистого здоровья [21—23]. Отсутствие работы и отсутствие трат на ремонт и приобретение собственности отражает социально-экономический статус, влияние которого на развитие БСК является доказанным. Известно, что с возрастом растет уровень сердечно-сосудистого риска, соответственно, увеличивается распространенность БСК, с этим согласуется «пребывание на пенсии» как параметр полученной модели. Показано, что более частое получение рекомендаций и коррекция образа жизни наблюдаются как у длительно болеющих БСК, так и у заболевших в пределах 3 лет по сравнению со здоровыми людьми [24]. Вместе с этим отмечается, что у лиц из группы заболевших БСК в пределах 3 лет при отсутствии заболевания исходно имелись высокие уровни общего холестерина, артериального давления и индекса массы тела. Это позволяет сделать вывод, что необходимость коррекции образа жизни связана с изначально нездоровым поведением (неправильное питание, низкая физическая активность), а также с низким самоконтролем здоровья, что подтверждается данными литературы [20, 24]. В то же время отсутствие визитов к врачу за последние 12 мес в полученной прогностической модели ассоциировано с риском развития БСК. Данный факт отражает роль ежегодных профилактических осмотров, контроль уровня холестерина и артериального давления с целью профилактики БСК.

Важным ограничением исследования является небольшой, с позиции машинного обучения, объем выборки, а также ее исходное смещение в сторону относительно здоровых лиц. Решением служит расширение объема выборки за счет лиц с уже известным целевым событием, что не только улучшит метрики сформированной модели, но и усилит ее предиктивную ценность.

Заключение

С применением методов машинного обучения определены новые неклассические показатели, влияющие на сердечно-сосудистый прогноз: инструментально-лабораторные (параметры спирометрии, биоимпедансо- и динамометрии), образа жизни (отсутствие потребления алкоголя, физическая активность в разных видах деятельности), системы здравоохранения (получение рекомендаций и изменения образа жизни) и социально-экономического статуса (отсутствие работы и пр.). Сформирована прогностическая шкала кардиоваскулярного риска, определен диапазон значений параметров модели.

Вклад авторов: концепция и дизайн исследования — Артамонова Г.В., Баздырев Е.Д., Князев Е.Г.; сбор и обработка материала — Агиенко А.С., Цыганкова Д.П.; статистический анализ данных — Агиенко А.С., Цыганкова Д.П., Трифонова М.В.; написание текста — Агиенко А.С., Трифонова М.В.; научное редактирование — Артамонова Г.В., Цыганкова Д.П., Бздырев Е.Д.

Финансирование: результаты получены при поддержке Российской Федерации в лице Министерства науки и высшего образования Российской Федерации в рамках Соглашения от 30 сентября 2022 г. №075-15-2022-1202 (КНТП, утвержденная распоряжением Правительства Российской Федерации от 11 мая 2022 г. №1144-р).

Авторы заявляют об отсутствии конфликта интересов.

Authors contribution: study design and concept — Artamonova G.V., Bazdyrev E.D., Knyazev E.G.; data collection and processing — Agienko A.S., Tsygankova D.P.; statistical analysis — Agienko A.S., Tsygankova D.P., Trifonova M.V.; text writing — Agienko A.S., Trifonova M.V.; scientific editing — Artamonova G.V., Tsygankova D.P., Bzdyrev E.D.

Financial Support: results were obtained with the support of the Russian Federation through the Ministry of Science and Higher Education of the Russian Federation within the framework of the Agreement dated September 30, 2022 No. 075-15-2022-1202 (ISTP, approved by order of the Government of the Russian Federation dated May 11, 2022 No. 1144-р).

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail

Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.