Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.
Сравнение моделей прогнозирования спонтанных преждевременных родов
Журнал: Медицинские технологии. Оценка и выбор. 2024;46(4): 10‑19
Прочитано: 1288 раз
Как цитировать:
Преждевременные (в сроки от 22 до 37 недель беременности) роды (ПР) являются важной акушерской проблемой. В настоящее время именно ПР служат основной причиной неонатальной заболеваемости и смертности [1]. Частота ПР в разных странах варьирует — от 4% в Исландии до 17% в Бангладеш [2]. В Российской Федерации их частота по разным оценкам составляет от 6,9 до 7,3% [2, 3].
Для формирования групп риска по развитию ПР и целевого применения мер вторичной профилактики необходима разработка методик прогнозирования. В то же время многочисленные исследования по изучению этиологии ПР демонстрируют участие многих факторов, что может затруднять точное прогнозирование ПР [4, 5]. К потенциальным детерминантам ПР относят: социально-демографические факторы (возраст, этническая принадлежность, образование, семейный статус, экономическое положение женщины) [6, 7], факторы акушерского анамнеза (порядковый номер беременности и родов, интервал между родами, ПР в анамнезе, наличие спонтанных прерываний беременности или искусственных абортов) [7], наличие одного или нескольких экстрагенитальных заболеваний (хронические инфекции мочевой системы, артериальная гипертензия, сахарный диабет) [7, 8], поведенческие факторы (курение, употребление алкоголя) [9], а также осложнения настоящей беременности (многоплодная беременность, многоводие, угроза прерывания, в том числе кровотечение в ранних ее сроках) [7, 10, 11].
Имеются также указания на прогностическую значимость ряда биохимических (интеркейкины ИЛ-6 и ИЛ-8, фибронектин плода, плацентарный альфа макроглобулин-1) [12, 13] и анатомических (маточно-цервикальный угол, длина шейки матки) факторов [14, 15] для оценки риска ПР. В то же время большинство данных параметров не принято оценивать рутинно в клинической практике, и, следовательно, возможность их использования в прогностических моделях на популяционном уровне ограничена.
В течение многих лет для прогнозирования бинарных исходов, к которым относят и ПР, исследователи преимущественно использовали логистическую регрессию (ЛР), но в последние годы все более популярными становятся технологии машинного обучения. В отличие от регрессионного анализа, подходы, основанные на машинном обучении, не требуют соблюдения большинства допущений традиционных статистических методов и могут применяться для обработки сложных взаимодействий между прогностическими факторами [16]. Так, в обзоре А.А. Ившина и соавт. представлен анализ ряда исследований, проведенных с целью разработки механизма прогнозирования с помощью алгоритмов машинного обучения, таких как искусственные нейронные сети, деревья классификации (ДК), случайный лес и другие. При этом показатели точности прогноза у описанных методов с использованием выборок от 546 до 16 млн наблюдений варьировали от 0,8 до 1,0, а показатели чувствительности — от 60 до 96% [17].
Важная проблема, ограничивающая разработку моделей на основе машинного обучения и других технологий интеллектуального анализа данных — необходимость формирования больших выборок с однородными, стандартизованными по методике сбора, данными для обучения моделей. Регистр родов Архангельской области (РРАО), содержащий собранные и закодированные по единой методике данные о более чем 90 тыс. исходов беременности со сроком гестации 22 недели и более в регионе за 2012—2018 гг., является мощным инструментом для разработки методов прогнозирования неблагоприятных исходов беременности и оценки их прогностической значимости.
Цель исследования — провести сравнительную оценку прогностических моделей спонтанных преждевременных родов, разработанных с помощью логистической регрессии и деревьев классификации.
Проведено ретроспективное когортное исследование, основанное на данных РРАО за 2012—2018 гг. РРАО — это электронная база данных, содержащая детальную информацию обо всех исходах беременностей со сроком 22 недели и более в Архангельской области. Сбор данных для РРАО осуществлялся медицинскими организациями родовспоможения согласно разработанной анкете, содержащей информацию о социально-демографических данных родителей, факторах образа жизни, акушерском анамнезе, особенностях и осложнениях течения настоящей беременности и родов, результатах пренатального скрининга, состоянии новорожденного. Источниками данных для заполнения регистрационной карты РРАО служила первичная медицинская документация, а именно обменная карта, история родов, история развития новорожденного [18].
За рассматриваемый период в РРАО зарегистрировано 92 584 исхода беременностей в сроке 22 недели и больше. Для проведения анализа исключены оперативные (n=21 041) и индуцированные (n=7 368) роды, наблюдения с неизвестным типом родоразрешения (n=430), а также наблюдения, для которых в базе РРАО отсутствовали изучаемые переменные (n=13 164). Таким образом, в итоговый анализ включен 50 581 случай родов (рис. 1). В качестве зависимой переменной исхода для формирования прогностических моделей использован факт спонтанных родов в сроке ранее 37 полных недель гестации.
Рис. 1. Блок-схема отбора наблюдений из регистра для включения в исследование.
Порядок организации и формирования РРАО определен распоряжением Министерства здравоохранения Архангельской области №25-рд от 23.01.2017, протокол ведения и регистрационная карта одобрены комитетом по этике ФГБОУ ВО СГМУ (г. Архангельск) Минздрава России (протокол №1 от 14.02.2017). Проведение данного исследования одобрено комитетом по этике ФГБОУ ВО СГМУ (г. Архангельск) Минздрава России (протокол №1/09-22 от 28.09.2022).
Разработаны 6 моделей прогнозирования (по 3 модели для ЛР и ДК), которые условно разделены на три временных периода для прогнозирования: (1) при планировании беременности, (2) при первой антенатальной явке, (3) в сроке 20—22 недели гестации.
В первую модель включены социально-демографические факторы (семейное положение, образование и возраст матери), факторы акушерского анамнеза (интергенетический интервал, мертворождения, искусственное прерывание беременности, как по желанию женщины, так и по медицинским показаниям, спонтанные аборты, преждевременные или оперативные роды, наличие рубца на матке по причинам, не связанным с оперативным родоразрешением), а также факторы, связанные с состоянием здоровья женщины (наличие хронических инфекций половых органов, почек и/или мочевыводящих путей, бронхиальная астма, артериальная гипертензия, эпилепсия, сахарный диабет до настоящей беременности, а также индекс массы тела при первой антенатальной явке).
Во вторую модель в дополнение к указанным выше факторам включены поведенческие факторы (поздняя (позже 12-й недели беременности) первая антенатальная явка, курение во время беременности, признаки злоупотребления алкоголем во время беременности), а также прием мультивитаминов и фолиевой кислоты во время беременности.
Третья модель дополнена особенностями течения настоящей беременности (наличие признаков патологии у плода или женщины, выявленной при ультразвуковом исследовании (УЗИ), многоплодная беременность, кровотечение в сроке до 13 недель гестации (O20.8-O20.9), гестационный диабет, анемия во время беременности, угроза прерывания беременности (O20.0), острые респираторные вирусные заболевания во время настоящей беременности, отеки беременных, генитальная инфекция, инфекция почек и мочевыделительной системы во время беременности, чрезмерная прибавка массы тела (O26.0), инфекции, передаваемые половым путем во время беременности (O98.1-O98.3) (ИППП), наличие истмико-цервикальной недостаточности (O34.3).
Статистическая обработка и создание моделей для прогнозирования проведены в программе STATA 17.0 с использованием метода бинарной ЛР и построением ДК. При построении моделей с помощью ЛР в качестве зависимой включена бинарная переменная, кодировавшая факт спонтанных ПР, в качестве независимых переменных — потенциальные предикторы, организованные в три модели в зависимости от периода беременности. Включаемые в каждую из моделей независимые переменные проверены на наличие мультиколлинеарности: фактор инфляции дисперсии для всех включенных в модель переменных не превышал 3, что свидетельствовало об отсутствии выраженной мультиколлинеарности, требующей коррекции. В связи с этим построение корреляционной матрицы для исключения коррелирующих между собой предикторов не проводилось. Результаты регрессионного анализа представлены в виде отношений шансов (ОШ) с 95% доверительными интервалами (ДИ), скорректированными на все включенные в модель переменные.
Построение ДК в настоящем исследовании реализовано методом CART (classification and regression tree) через плагин для программы STATA «CRTREES: Stata module to compute Classification and Regression Trees algorithms» [19], который позволяет строить ДК, деревья регрессии [20] и случайный лес [21]. При построении и тестировании ДК базу исследования разделяли на две выборки: обучающая выборка (от 25 343 до 25 365 наблюдений) и тестовая выборка (от 25 216 до 25 238 наблюдений). Результаты ДК представлены в виде структуры деревьев с указанием вероятностей развития ПР у групп женщин с наличием факторов — потенциальных предикторов, отобранных в финальную модель, с 95% ДИ.
Для оценки прогностической значимости созданных моделей использована оценка площади под Receiver Operating Characteristic (ROC)-кривой [22], чувствительность (способность корректно идентифицировать ПР) и специфичность модели. За последнюю принимали способность модели корректно идентифицировать женщин, у которых беременность завершилась родами в срок более 37 полных недель гестации.
В сформированной из РРАО выборке исходов беременностей наблюдалось 2167 спонтанных ПР, частота которых составила 4,28 на 100 родов (95% ДИ: 4,11—4,47). Результаты прогнозирования ПР методом ЛР на этапе планирования беременности представлены в таблице. Наиболее значимыми факторами, увеличивающими вероятность развития ПР, были отягощенный акушерский анамнез (мертворождения, спонтанные прерывания беременности, медицинские аборты в анамнезе), социальные факторы (отличный от официального брака семейный статус), здоровье женщины (ожирение II и III степени, сахарный диабет 1-го или 2-го типа, эпилепсия). В то же время повторнородящие с интергенетическим интервалом более 2 лет имели более низкий риск ПР.
Прогнозирование спонтанных преждевременных родов с помощью логистической регрессии
| Переменная | При планировании беременности | При первой антенатальной явке | В сроке 20—22 недели беременности | ||||||
| Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | |
| Семейное положение матери | |||||||||
| не замужем | 1,55 | 1,36—1,76 | <0,0001 | 1,44 | 1,26—1,64 | <0,0001 | 1,49 | 1,30—1,71 | <0,0001 |
| замужем | Реф. | Реф. | Реф. | ||||||
| сожительство | 1,34 | 1,19—1,50 | <0,0001 | 1,26 | 1,12—1,42 | <0,0001 | 1,27 | 1,13—1,44 | <0,0001 |
| другое | 3,18 | 0,93—10,92 | 0,066 | 3,03 | 0,88—10,42 | 0,079 | 3,11 | 0,93—10,82 | 0,074 |
| Образование матери | |||||||||
| нет | Реф. | Реф. | Реф. | ||||||
| среднее | 0,76 | 0,40—1,44 | 0,406 | 0,72 | 0,38—1,38 | 0,320 | 0,67 | 0,35—1,29 | 0,231 |
| среднее специальное | 0,67 | 0,36—1,25 | 0,208 | 0,72 | 0,38—1,38 | 0,319 | 0,70 | 0,37—1,32 | 0,275 |
| высшее | 0,57 | 0,30—1,08 | 0,086 | 0,66 | 0,36—1,25 | 0,204 | 0,61 | 0,32—1,15 | 0,129 |
| Возраст матери, лет | |||||||||
| до 19 | 1,17 | 0,90—1,54 | 0,245 | 1,16 | 0,89—1,52 | 0,273 | 1,20 | 0,91—1,58 | 0,199 |
| 19—35 | Реф. | Реф. | Реф. | ||||||
| старше 35 | 1,02 | 0,75—1,38 | 0,911 | 1,03 | 0,74—1,37 | 0,941 | 0,99 | 0,72—1,35 | 0,953 |
| Интергенетический интервал | |||||||||
| первородящая | Реф. | Реф. | Реф. | ||||||
| не более 2 лет | 1,02 | 0,88—1,19 | 0,763 | 0,96 | 0,82—1,13 | 0,626 | 1,00 | 0,85—1,18 | 0,977 |
| более 2 лет | 0,83 | 0,75—0,92 | <0,0001 | 0,82 | 0,74—0,91 | <0,0001 | 0,82 | 0,74—0,91 | <0,0001 |
| Мертворождения в анамнезе | 1,44 | 1,02—2,03 | 0,037 | 1,44 | 1,02—2,04 | 0,037 | 1,44 | 1,01—2,05 | 0,042 |
| Искусственное прерывание беременности в сроке до 13 недель | 1,20 | 1,09—1,32 | <0,0001 | 1,19 | 1,08—1,30 | <0,0001 | 1,15 | 1,05—1,27 | 0,004 |
| Искусственное прерывание беременности в сроке 13 недель и позже | 1,25 | 0,69—2,25 | 0,456 | 1,22 | 0,68—2,18 | 0,510 | 1,28 | 0,70—2,33 | 0,418 |
| Искусственное прерывание беременности по медицинским показаниям в анамнезе | 1,22 | 0,66—2,23 | 0,531 | 1,25 | 0,68—2,28 | 0,473 | 0,99 | 0,53—1,87 | 0,985 |
| Спонтанные аборты в сроке 13—22 недели гестации в анамнезе | 1,62 | 1,22—2,16 | 0,001 | 1,55 | 1,16—2,07 | 0,003 | 1,42 | 1,05—1,91 | 0,021 |
| Спонтанные аборты в сроке менее 12 недель гестации в анамнезе | 1,27 | 1,13—1,43 | <0,0001 | 1,27 | 1,13—1,44 | <0,0001 | 1,23 | 1,09—1,38 | 0,001 |
| Преждевременные роды в сроке 22—29 недель в анамнезе | 2,61 | 1,76—3,87 | <0,0001 | 2,57 | 1,73—3,81 | <0,0001 | 2,20 | 1,45—3,32 | <0,0001 |
| Преждевременные роды в сроке 30—36 недель в анамнезе | 3,76 | 3,17—4,46 | <0,0001 | 3,62 | 3,05—4,30 | <0,0001 | 3,70 | 3,10—4,42 | <0,0001 |
| Оперативные роды в анамнезе | 2,06 | 1,49—2,85 | <0,0001 | 2,02 | 1,47—2,80 | <0,0001 | 2,02 | 1,45—2,82 | <0,0001 |
| Рубец на матке по причинам, не связанным с оперативным родоразрешением | 3,00 | 0,67—13,35 | 0,148 | 2,68 | 0,59—12,08 | 0,200 | 2,71 | 0,60—12,30 | 0,197 |
| Хроническая инфекция половых органов | 1,07 | 0,94—1,20 | 0,304 | 1,06 | 0,94—1,20 | 0,318 | 1,07 | 0,94—1,21 | 0,311 |
| Хроническая инфекция почек и/или мочевыводящих путей | 1,02 | 0,91—1,14 | 0,770 | 1,01 | 0,90—1,14 | 0,867 | 1,02 | 0,90—1,15 | 0,751 |
| Бронхиальная астма до беременности | 0,64 | 0,40—1,03 | 0,064 | 0,64 | 0,40—1,03 | 0,120 | 0,65 | 0,41—1,06 | 0,082 |
| Гипертоническая болезнь до беременности | 1,27 | 0,96—1,67 | 0,087 | 1,24 | 0,94—1,64 | 0,120 | 1,29 | 0,98—1,71 | 0,070 |
| Эпилепсия до настоящей беременности | 1,93 | 1,12—3,32 | 0,017 | 1,88 | 1,09—3,25 | 0,023 | 2,09 | 1,21—3,60 | 0,008 |
| Прогнозирование спонтанных преждевременных родов с помощью логистической регрессии (Окончание). | |||||||||
| Переменная | При планировании беременности | При первой антенатальной явке | В сроке 20—22 недели беременности | ||||||
| Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | Ск.ОШ | 95% ДИ | p | |
| Сахарный диабет 1-го типа до беременности | 5,95 | 3,18—11,16 | <0,0001 | 5,83 | 3,12—10,91 | <0,0001 | 6,07 | 3,19—11,56 | <0,0001 |
| Сахарный диабет 2-го типа до беременности | 2,50 | 0,93—6,73 | 0,068 | 2,45 | 0,91—6,60 | 0,076 | 2,73 | 1,00—7,47 | 0,051 |
| Индекс массы тела матери | |||||||||
| недостаточная масса тела | 1,17 | 0,99—1,38 | 0,061 | 1,18 | 1,01—1,40 | 0,046 | 1,13 | 0,96—1,35 | 0,134 |
| нормальная масса тела | Реф. | Реф. | Реф. | ||||||
| избыточная масса тела | 1,05 | 0,94—1,17 | 0,408 | 1,04 | 0,93—1,16 | 0,524 | 1,06 | 0,95—1,20 | 0,285 |
| ожирение I степени | 1,07 | 0,89—1,28 | 0,462 | 1,06 | 0,88—1,27 | 0,513 | 1,15 | 0,96—1,38 | 0,137 |
| ожирение II степени | 1,98 | 1,51—2,59 | <0,0001 | 1,97 | 1,51—2,58 | <0,0001 | 2,11 | 1,60—2,78 | <0,0001 |
| ожирение III степени | 2,20 | 1,30—3,73 | 0,003 | 2,14 | 1,26—3,63 | 0,005 | 2,32 | 1,35—3,97 | 0,002 |
| Прием мультивитаминов во время беременности | — | — | — | 0,88 | 0,79—0,99 | 0,015 | 0,88 | 0,79—0,97 | 0,014 |
| Прием фолиевой кислоты во время беременности | — | — | — | 0,98 | 0,88—1,09 | 0,734 | 0,93 | 0,84—1,03 | 0,161 |
| Курение во время беременности | — | — | — | 1,33 | 1,19—1,49 | <0,0001 | 1,31 | 1,16—1,47 | <0,0001 |
| Срок беременности (недель) на момент постановки на учет позже 12 недель | — | — | — | 1,17 | 1,04—1,33 | 0,012 | 1,23 | 1,08—1,40 | <0,0001 |
| Признаки злоупотребления алкоголем во время беременности | — | — | — | 4,01 | 2,63—6,11 | <0,0001 | 4,36 | 2,84—6,67 | <0,0001 |
| Наличие признаков патологии плода или матери при УЗИ | — | — | — | — | — | — | 1,86 | 1,63—2,19 | <0,0001 |
| Многоплодная беременность | — | — | — | — | — | — | 26,38 | 20,74—33,53 | <0,0001 |
| Кровотечение в сроке до 13 недель гестации | — | — | — | — | — | — | 1,60 | 1,10—2,32 | 0,014 |
| Гестационный диабет | — | — | — | — | — | — | 1,23 | 1,00—1,53 | 0,055 |
| Анемия | — | — | — | — | — | — | 0,73 | 0,67—0,80 | <0,0001 |
| Угроза прерывания беременности | — | — | — | — | — | — | 1,66 | 1,52—1,83 | <0,0001 |
| Острые респираторные вирусные заболевания во время настоящей беременности | — | — | — | — | — | — | 0,98 | 0,85—1,12 | 0,802 |
| Отеки беременных | — | — | — | — | — | — | 0,77 | 0,68—0,88 | <0,0001 |
| Инфекция почек и мочевыделительной системы во время беременности | — | — | — | — | — | — | 1,05 | 0,92—1,19 | 0,488 |
| Генитальная инфекция во время беременности | — | — | — | — | — | — | 0,96 | 0,87—1,07 | 0,438 |
| Чрезмерная прибавка массы тела | — | — | — | — | — | — | 0,57 | 0,45—0,72 | <0,0001 |
| ИППП во время беременности | — | — | — | — | — | — | 0,96 | 0,59—1,58 | 0,878 |
| Истмико-цервикальная недостаточность | — | — | — | — | — | — | 4,93 | 2,90—8,35 | <0,0001 |
Примечание. Реф. — референсная категория; Ск.ОШ — скорректированное отношение шансов; ДИ — доверительный интервал; ИППП — инфекции, передаваемые половым путем; УЗИ — ультразвуковое исследование.
Площадь под ROC-кривой для данной модели составила 0,623 (0,610—0,636), точка отсечения с максимальной прогностической результативностью 0,041, или 4,1%, позволяла достичь чувствительности 54% и специфичности 65%.
При использовании того же набора переменных для прогнозирования с помощью ДК (рис. 2) в финальную модель алгоритмом отобраны только 4 фактора, позволяющие максимально результативно классифицировать исходы беременности в зависимости от срока гестации. Максимальная вероятность развития ПР, равная 0,368 (95% ДИ: 0,162—0,575), была у женщин, имевших в анамнезе ПР в сроке до 30 недель беременности и не состоявших в зарегистрированном браке. Прогностическая значимость указанной модели была ниже, чем для ЛР. Площадь под ROC-кривой составила 0,561 (95% ДИ: 0,552—0,571), чувствительность и специфичность в предполагаемой точке отсечения (0,048) были 24 и 87% соответственно.
Рис. 2. Модель прогнозирования спонтанных преждевременных родов на этапе планирования беременности с помощью деревьев классификации.
После добавления в модель факторов, которые могут быть оценены при первой антенатальной явке (см. таблицу), помимо факторов, указанных выше, значимое влияние на риск развития ПР оказывали: поздняя первая антенатальная явка, курение и признаки злоупотребления алкоголем во время беременности. Прием мультивитаминов, напротив, снижал риск развития ПР на 12%. Прогностическая значимость дополненной модели, созданной с помощью метода ЛР, изменилась незначительно: площадь под ROC-кривой составила 0,633 (95% ДИ: 0,621—0,646). При сохранении точки отсечения неизменной чувствительность модели составила 55%, специфичность — 66%.
При использовании ДК (рис. 3) в финальную модель с помощью алгоритма отобраны следующие факторы: ПР в сроке 30—36 недель в анамнезе, признаки злоупотребления алкоголем во время беременности, курение во время беременности, наличие сахарного диабета 1-го типа. Максимальная вероятность развития ПР, равная 0,261, прогнозировалась для беременных с наличием сахарного диабета 1-го типа. Прогностическая значимость модели с помощью ДК уступала таковой, основанной на результатах ЛР. Площадь под ROC-кривой составила 0,573 (95% ДИ: 0,563—0,583). При точке отсечения, равной 0,048, чувствительность модели составила 30%, специфичность — 84%.
Рис. 3. Модель прогнозирования спонтанных преждевременных родов при первой антенатальной явке с помощью деревьев классификации.
Третий вариант моделей предполагал включение факторов, связанных с настоящей беременностью. По результатам регрессионного анализа (см. таблицу) в дополнение к факторам, значимым в предыдущих моделях, более высокий риск ПР установлен у беременных, имевших многоплодную беременность, патологические изменения, выявленные при УЗИ плода, истмико-цервикальную недостаточность, кровотечения в сроке до 13 недель беременности и признаки угрозы прерывания беременности. Прогностическая значимость модели значительно выросла: площадь под ROC-кривой составила 0,703 (95% ДИ: 0,691—0,715). Эмпирически подобранная точка отсечения снизилась до 0,039, при этом чувствительность модели в точке отсечения выросла до 63%, а специфичность — до 67%.
Прогнозирование ПР в сроке 20—22 недели с помощью ДК (рис. 4) позволило выделить четыре значимых фактора, которые включены в финальную модель: многоплодная беременность, ПР в сроке 30—36 недель в анамнезе, угроза прерывания настоящей беременности, признаки злоупотребления алкоголем во время беременности. Максимальная вероятность ПР прогнозировалась для женщин с многоплодной беременностью — 0,529 (95% ДИ: 0,445—0,612). Среди женщин с одноплодной беременностью максимальная вероятность ПР прогнозировалась при наличии признаков злоупотребления алкоголем — 0,300 (95% ДИ: 0,161—0,438). По сравнению с предыдущими, построенными по алгоритму ДК, данная модель имела максимальную площадь под ROC-кривой — 0,620 (95% ДИ: 0,608—0,632) и баланс чувствительности и специфичности (52 и 69% соответственно).
Рис. 4. Модель прогнозирования спонтанных преждевременных родов в сроке 20—22 недели с помощью деревьев классификации.
Таким образом, максимальная результативность получена для прогностической модели, основанной на ЛР и включающей социально-демографические факторы, факторы акушерского анамнеза, поведенческие факторы, информацию о здоровье женщины до беременности и особенности течения настоящей беременности.
В проведенном исследовании использованы популяционные данные для прогнозирования спонтанных ПР у женщин с помощью ЛР и одного из методов машинного обучения на разных этапах: планирования беременности, при первой антенатальной явке, во втором триместре беременности. Из числа изученных предикторов наибольшую значимость для прогнозирования на этапе планирования беременности имели факторы, связанные с исходами предыдущих беременностей (ПР в анамнезе, искусственное прерывание беременности, оперативное родоразрешение и т.п.), а также ряд экстрагенитальных заболеваний (сахарный диабет, эпилепсия), что сопоставимо с результатами подобных исследований, использовавших только социально-демографические характеристики и состояние здоровья матери [23]. В целом 22 предиктора позволили достичь площади под ROC-кривой более 60% при использовании ЛР [23]. В то же время при использовании ДК результативность моделей на этом этапе была крайне низкой. Ранее проведенные исследования также демонстрировали недостаточную прогностическую ценность моделей при использовании только факторов анамнеза и социально-демографических характеристик. Так, в исследовании R.A. Belaghi и соавт. при использовании сравнимых характеристик-предикторов авторам удалось достичь чувствительности 50,2 и 64,5% [11], что сравнимо с полученными нами результатами. При этом результативность модели, построенной с помощью ДК, была ниже, чем для ЛР [11]. Исследование A. Koivu и соавт. с использованием набора данных, состоящего из 15 976 537 исходов беременности и 26 потенциальных предикторов, позволило получить площадь под ROC-кривой 0,620—0,640 для модели на основе ЛР и 0,63—0,67 для моделей на основе ансамбля ДК [24].
Дополнение модели поведенческими факторами риска, в числе которых была и поздняя первая антенатальная явка, не позволило увеличить прогностическую значимость модели, построенной с помощью ЛР. В то же время мы определили, что высокой прогностической значимостью обладает ряд поведенческих факторов, достаточно распространенных в изучаемой популяции [25], что свидетельствует об имеющемся потенциале снижения частоты ПР за счет модификации управляемых факторов риска. Использование разработанных моделей совместно с имеющимися балльными шкалами может повысить точность стратификации риска на этапе первой антенатальной явки.
Ожидаемо, что модель, включавшая в дополнение к предыдущим факторам особенности течения настоящей беременности, обладала максимальной прогностической значимостью, что в целом соответствует результатам ранее проведенных исследований [11, 23, 24]. Учитывая то, что изученная нами выборка не ограничивалась только одноплодными беременностями, в число предикторов включена многоплодная беременность, которая была наиболее значимым фактором с ОШ=26,38 (95% ДИ: 20,74—33,53). Полученные нами числовые показатели результативности для всех моделей были ниже по сравнению с аналогичным исследованием [11] по прогнозированию ПР среди одноплодных беременностей (площадь под ROC-кривой 0,703 по сравнению с 0,795 для ЛР и 0,620 по сравнению с 0,755 для ДК соответственно). Вероятной причиной может служить больший набор предикторов в исследовании, проведенном в Канаде, включавший, помимо прочего, ряд биохимических и анатомических показателей (неконъюгированный эстриол, плазменный протеин альфа и другие) и дополнительные характеристики беременности (пол плода). Более того, ограничение исследования [11] только одноплодными беременностями, с одной стороны, сокращало набор значимых предикторов, с другой — делало выборку более однородной и, следовательно, влияние остальных предикторов могло оказаться выше.
Использование ДК не позволило обнаружить больше переменных, связанных со спонтанными ПР, по сравнению с ЛР в нашем наборе данных. Интересно, что во всех прогностических моделях, подготовленных с помощью ДК в разные сроки беременности, суммарно фигурирует всего 8 потенциальных предикторов, из которых 1 относится к группе социально-демографических детерминант (семейный статус), 2 — к акушерскому анамнезу (ПР в разные сроки гестации в анамнезе), 1 — к группе экстрагенитальной патологии (сахарный диабет 1-го типа в анамнезе), 2 являются основными поведенческими факторами (курение и признаки злоупотребления алкоголем), и еще 2 характеризуют особенности течения настоящей беременности (многоплодная беременность и угроза прерывания). Это в целом согласуется как с результатами регрессионного анализа, в котором указанные факторы имели наибольшее влияние, так и с результатами анализа распространенности данных предикторов.
Данное исследование — первый опыт прогнозирования ПР в Российской Федерации, основанного на данных, рутинно собираемых в клинической практике, с использованием популяционного регистра родов. В качестве основных ограничений исследования можно выделить неполный набор предикторов, в первую очередь связанный с характеристиками экстрагенитальной патологии и степенью ее компенсации, а также отсутствие данных о результатах выполненных лабораторных исследований. Расширение набора переменных может повысить прогностическую значимость моделей. Использованная база исследования (РРАО) содержала значительную долю наблюдений с отсутствующими данными. Нами не проводились дополнительные процедуры по восстановлению недостающих значений (множественная импутация, заполнение средними значениями и т.п.), что привело к исключению из анализа значительного числа исходов беременностей и могло снизить статистическую мощность исследования. В то же время мы считаем, что вероятность возникновения ошибки отбора, связанной с этим, не является высокой, и это не могло повлиять на полученные результаты. По причине значительного числа отсутствующих данных и высокой вероятности информационных ошибок мы не включали в анализ ряд факторов (например, курение до беременности), что могло снизить прогностическую значимость, но только в отношении первой модели.
Мы продемонстрировали, что бинарная логистическая регрессия имела более высокую прогностическую результативность по сравнению с деревьями классификации для прогнозирования спонтанных преждевременных родов. Максимальная прогностическая значимость достигнута при включении в модель как факторов анамнеза, образа жизни и здоровья беременной, так и факторов, связанных с особенностями течения настоящей беременности. Это делает возможным использование указанного метода как альтернативы шкалам риска при условии дополнения прогностических моделей лабораторными данными и результатами инструментальных исследований.
Участие авторов:
Концепция и дизайн исследования — Постоев В.А., Гржибовский А.М., Меньшикова Л.И.
Сбор и обработка материала — Постоев В.А., Усынина А.А., Гржибовский А.М.
Статистическая обработка — Постоев В.А.
Написание текста — Постоев В.А., Усынина А.А.
Редактирование — Гржибовский А.М., Меньшикова Л.И., Сон И.М.
Авторы заявляют об отсутствии конфликта интересов.
Литература / References:
Подтверждение e-mail
На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.
Подтверждение e-mail
Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.