Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Валерий Алексеевич Аксенов

ГБУЗ Московской области «Московский областной научно-исследовательский институт акушерства и гинекологии им. акад. В.И. Краснопольского» Минздрава Московской области, Москва, Россия

Ольга Юрьевна Реброва

ГБУЗ Московской области «Московский областной научно-исследовательский институт акушерства и гинекологии им. акад. В.И. Краснопольского» Минздрава Московской области, Москва, Россия;
ФГАОУ ВО «Российский национальный исследовательский медицинский университет им. Н.И. Пирогова» Минздрава России, Москва, Россия

Прогностические исследования: требования к дизайну и типичные ошибки на примере акушерства, гинекологии и репродуктивной медицины

Авторы:

Аксенов В.А., Реброва О.Ю.

Подробнее об авторах

Прочитано: 169 раз


Как цитировать:

Аксенов В.А., Реброва О.Ю. Прогностические исследования: требования к дизайну и типичные ошибки на примере акушерства, гинекологии и репродуктивной медицины. Российский вестник акушера-гинеколога. 2026;25(1):101‑109.
Aksenev VA, Rebrova OYu. Prognostic research: design requirements and common mistakes with a focus on obstetrics, gynecology, and reproductive medicine. Russian Bulletin of Obstetrician-Gynecologist. 2026;25(1):101‑109. (In Russ.)
https://doi.org/10.17116/rosakush202626011101

Рекомендуем статьи по данной теме:

Введение

В современной медицине, включая акушерство, гинекологию и репродуктивную медицину, все большее значение приобретает использование риск-ориентированных и персонализированных подходов к профилактике и лечению. Такой подход предполагает адаптацию медицинских мероприятий в соответствии с уровнем риска (прогнозом), то есть вероятности наступления определенного исхода у пациента в заданный временной промежуток. Основная цель риск-ориентированной клинической практики заключается в персонализированном ведении пациента и соответствующем планировании медицинской помощи, что значительно повышает ее эффективность. Оценка рисков позволяет применять превентивные меры, такие как экстренное медицинское вмешательство для беременной женщины или новорожденного, а также выбирать альтернативные методы лечения, избегая неэффективных мероприятий, если вероятность положительного результата минимальна. На основе прогноза проводится индивидуализированное консультирование, помогающее беременной женщине принимать обоснованные решения, например, при выборе метода родоразрешения. Организационные аспекты включают обеспечение присутствия квалифицированного медицинского персонала и организацию оперативного доступа к операционной в случаях, требующих экстренного родоразрешения.

Историческим примером прогнозирования в акушерской практике является шкала Бишопа для количественной оценки степени зрелости шейки матки с целью прогнозирования успешной индукции родов, включая вероятность достижения вагинальных родов в течение определенного периода времени после индукции. Этот метод, разработанный еще в 1964 году, то есть задолго до внедрения современных принципов и методологических стандартов прогностических исследований, продолжает широко применяться в повседневной практике благодаря своей эффективности и простоте.

Особенности дизайна

Единственным возможным дизайном прогностических исследований является когортное исследование, в рамках которого используются проспективно собираемые данные либо архивные (ретроспективные) данные. Предпочтительным является проспективный сбор данных, который обеспечивает полный контроль над определением всех возможных предикторов и исходов с применением наиболее точных методов их оценки.

В научной литературе и методологических руководствах, посвященных когортным исследованиям, обычно описывается их использование для изучения этиологии заболеваний или факторов риска/факторов течения заболевания. В таких этиологических проспективных когортных исследованиях участников группируют в соответствии с их экспозицией1 эндогенному либо экзогенному фактору — например, курящие и некурящие (или, например, имеющие мутацию и не имеющие ее) — поскольку основной целью является изучение возможной причинно-следственной связи2 конкретного фактора с последующим исходом. Обязательным условием является отсутствие изучаемого состояния на момент начала наблюдения. Категоризация участников по признаку экспозиции изучаемому фактору является ключевым элементом для выделения его эффекта с учетом влияния потенциальных вмешивающихся факторов. Такой подход предоставляет исследователям возможность проводить сравнительный анализ частоты возникновения исходов между группами, которые подвергались и не подвергались влиянию изучаемого фактора (рис. 1).

Рис. 1. Схема этиологического когортного исследования.

Таким образом, когортные исследования этого типа призваны ответить на вопрос «Может ли фактор А быть причиной заболевания Б?». Однако для надежного доказательства причинно-следственной связи необходимо выполнение девяти критериев Брэдфорда Хилла [1], из которых лишь один относится к статистической связи фактора и исхода.

Примером традиционного проспективного когортного исследования является исследование британских врачей (British Doctors Study), которое началось в 1951 году и продолжалось до 2001 года. Исходно в исследование была включена большая группа курящих и некурящих британских врачей. В ходе наблюдений фиксировались различные последствия для здоровья, особое внимание уделялось развитию рака легких в зависимости от привычки к курению. Уже к 1956 году исследователи смогли доказать связь между курением и заболеваемостью раком легких [2].

Исследование британских врачей является классическим примером того, как проспективное когортное исследование предоставило исключительно убедительные доказательства, фактически установив причинно-следственную связь между курением и раком легких, а также другими заболеваниями. Несмотря на то что это было наблюдательное исследование, тщательная методология, длительный период наблюдения, большой объем выборки и соответствие многим критериям причинности привели к тому, что научное сообщество признало наличие причинно-следственной связи между курением и рядом заболеваний. Это исследование стало краеугольным камнем в усилиях общественного здравоохранения по борьбе с курением.

В отличие от этиологических когортных исследований в прогностических когортных исследованиях целью является максимально точное предсказание будущего исхода на основании множества переменных (предикторов), независимо от причинно-следственных (этиологических, патогенетических) связей. Цель состоит не в том, чтобы понять причину изучаемого исхода, а в том, чтобы предсказать его возникновение, т.е. ответить на вопрос: «Учитывая текущие обстоятельства, что произойдет в будущем?». В подобных случаях применяют другой вид когортного исследования, в котором исходное распределение участников на группы по признаку экспозиции какому-либо фактору не осуществляется [3, 4]. Целью таких исследований является выявление и количественная оценка исходных факторов, статистически ассоциированных с последующим развитием определенных исходов, а не анализ причинно-следственных связей между фактором и эффектом.

В таких исследованиях начальная когорта создается из участников на одном и том же четко определенном этапе заболевания или в момент первого применения скринингового теста либо лечебного вмешательства. Обязательным условием является отсутствие у всех участников изучаемого исхода на момент начала наблюдения [4]. Участники отбираются в когорту по единым критериям, включая наличие определенного заболевания, физиологического состояния, такого как беременность, или проведение медицинского вмешательства, например экстракорпорального оплодотворения. У всех участников регистрируются начальные и последующие значения множества потенциальных предикторов. За когортой ведется проспективное наблюдение с целью регистрации интересующих исходов (рис. 2). Формирование групп по наличию или отсутствию изучаемого исхода осуществляется на этапе анализа, что позволяет применять многомерные модели, такие как логистическая регрессия, регрессия Кокса, построение деревьев решений и др.

Рис. 2. Схема прогностического когортного исследования.

В ретроспективном прогностическом когортном исследовании данные о потенциальных предикторах извлекаются из архивных записей, содержащих информацию о факторах риска, характеристиках пациентов и других ранее собранных сведений. Подобно проспективному прогностическому когортному исследованию когорта изначально формируется из участников, не имеющих изучаемого исхода. Это могут быть пациенты, у которых заболевание только что диагностировано или которые только что подверглись определенному воздействию, например, проходили скрининг первого триместра или начали лечение бесплодия.

Исследование с подобным дизайном создает строгую временную структуру для осуществления прогнозирования. Начало отсчета времени (например, момент скрининга первого триместра беременности, начала программы ВРТ или госпитализации для родоразрешения) задается одинаковым для всех участников, что позволяет использовать единую точку отсчета (zero time) для предсказания последующих событий [4]. Такой дизайн обеспечивает применимость прогностических моделей за счет стандартизации исходного состояния и корректного учета предикторов.

Благодаря возможности одновременного изучения множества переменных и их комбинаций, когортные исследования без исходного распределения участников на группы по признаку экспозиции фактору являются необходимым дизайном для разработки и валидации прогностических моделей.

Поскольку предсказание будущего со 100%-ной достоверностью невозможно, прогностические исследования носят вероятностный характер и направлены на оценку рисков. В отличие от этиологических исследований, которые обычно оценивают относительный риск исхода, связанного с конкретным фактором, прогностические исследования нацелены на определение индивидуального абсолютного риска по данным клинико-лабораторного и анамнестического профиля пациента [5]. С точки зрения пациента, именно абсолютный риск, т.е. вероятность конкретного клинического исхода за определенный период времени предоставляет наиболее ценную и полную информацию.

В акушерстве и гинекологии для оценки абсолютного риска применяется множество шкал, номограмм, калькуляторов и индексов. Кроме упомянутой ранее шкалы Бишопа к ним относятся интерактивный онлайн-калькулятор успеха родов через естественные родовые пути после кесарева сечения [6], номограмма для индивидуально прогнозирования результата ЭКО [7], индекс O-RADS (Ovarian-Adnexal Reporting and Data System) для унифицированной оценки выявляемых при визуализации образований в придатках матки и оценки риска их малигнизации [8]. На веб-сайте Фонда медицины плода [9] представлены несколько интерактивных онлайн-калькуляторов, предназначенных для оценки индивидуального риска различных акушерских и перинатальных осложнений, включая риск преэклампсии, задержки роста плода, макросомии, преждевременных родов, трисомий, гестационного диабета и др. Все калькуляторы содержат ссылки на исследования, которые послужили основой для их разработки.

Любая прогностическая модель должна пройти проверку (валидацию). Цель валидации модели состоит в том, чтобы оценить прогностические характеристики модели на основе новых данных разработчиков, которые не были использованы при разработке модели (внутренняя валидация), либо на новых данных из других источников (внешняя валидация). В условиях дефицита данных вместо внутренней валидации применяют процедуры кроссвалидации, скользящего экзамена и т.п., что также позволяет получать более надежные модели.

Примеры применения прогностических когортных исследований в акушерстве, гинекологии и репродуктивной медицине

Примером прогностического когортного исследования является проспективное многоцентровое исследование, направленное на прогнозирование преэклампсии у беременных женщин, впервые обращающихся за медицинской помощью в связи с наступлением беременности [10].

Целью исследования являлась разработка модели скрининга, позволяющей прогнозировать раннюю и позднюю преэклампсию, а также гестационную гипертензию. В качестве прогностических факторов использовались клинические и анамнестические данные пациенток, результаты допплерографии маточных артерий, а также показатели среднего артериального давления, зафиксированные на сроке беременности 11—13 недель. Начальная когорта включала более 8000 беременных женщин, за которыми вели наблюдение до окончания беременности. В ходе исследования было зарегистрировано более 300 случаев развития преэклампсии или гестационной гипертензии.

После завершения наблюдения был проведен сравнительный анализ потенциальных предикторов гестационной гипертензии у женщин с диагностированными гипертензивными расстройствами и у пациенток без осложнений беременности. На основании проведенного анализа данных была разработана прогностическая модель с применением логистической регрессии, основанная на интеграции материнских данных (курение, расовая принадлежность, число родов и артериальная гипертония в анамнезе, артериальная гипертония у матери участницы), минимального пульсационного индекса маточной артерии, а также показателя среднего артериального давления. Модель продемонстрировала способность эффективно прогнозировать развитие ранней преэклампсии. При использовании только материнских данных частота выявления (чувствительность модели) ранней преэклампсии составляла 47%, тогда как при добавлении в многофакторную модель минимального пульсационного индекса маточной артерии и среднего артериального давления этот показатель увеличился до 81%. Анализ проводился при заданном предельном уровне ложноположительных результатов 10%.

Полученные результаты демонстрируют значительное улучшение чувствительности модели по сравнению со скринингом, основанным исключительно на материнских данных. Продемонстрирована возможность использования доступных клинических данных для прогнозирования ранней преэклампсии, что особенно важно для систем здравоохранения с ограниченным доступом к дорогостоящим биохимическим маркерам. Скрининг ранней преэклампсии (с дебютом до 34-й недели беременности) имеет приоритетное значение, поскольку эта форма заболевания характеризуется более тяжелым течением и ассоциируется с неблагоприятными исходами для матери и плода. Поэтому для ранней преэклампсии важно обеспечить оптимальное сочетание чувствительности и специфичности прогностической модели. В данном исследовании продемонстрировано, что модель обладает достаточно высокой чувствительностью (81%) при низкой частоте ложноположительных результатов (10%).

Это исследование является наглядной иллюстрацией выбора соотношения чувствительности и специфичности прогностической модели в программах раннего выявления заболеваний. Как известно, соотношение между чувствительностью и специфичностью тестов задается в зависимости от их цели (диагностической или скрининговой) и конкретной решаемой задачи — с учетом «цены» ошибок I и II рода (ложноположительных и ложноотрицательных результатов). В этом исследовании в контексте скрининга преэклампсии приоритет был отдан высокой чувствительности полученной прогностической модели. Это обусловлено потенциально быстрым развитием тяжелых осложнений, таких как эклампсия и HELLP-синдром, где цена пропуска диагноза включает материнскую и перинатальную смерть. Раннее выявление преэклампсии позволяет своевременно назначить профилактические меры, например, низкие дозы ацетилсалициловой кислоты [11, 12]. Ложноположительные результаты (в этом случае 10%) считаются допустимыми, поскольку профилактическое лечение ацетилсалициловой кислотой относительно безопасно, а усиленное медицинское наблюдение не наносит вреда здоровым беременным. Психологический дискомфорт от ложной тревоги значительно менее критичен по сравнению с последствиями не выявленного заболевания.

В прогностических когортных исследованиях гестационного сахарного диабета, как правило, изучают беременных женщин, включенных в исследование на ранних сроках беременности. Разрабатываемые в этом контексте прогностические модели направлены на идентификацию женщин с повышенным риском развития гестационного сахарного диабета на основании данных первого триместра, включая индекс массы тела, семейный анамнез, гликемические показатели (например, уровень глюкозы натощак и гликированного гемоглобина [HbA1c]), а также концентрации адипокинов и воспалительных биомаркеров [13].

В исследованиях, посвященных интранатальным осложнениям, таким как послеродовое кровотечение, в начальную когорту включаются пациентки на этапе госпитализации для родоразрешения. Целью подобных исследований является прогнозирование риска тяжелой кровопотери, требующей гемотрансфузии или хирургического вмешательства [14].

В области репродуктивной медицины проспективные прогностические исследования применяются для оценки вероятности живорождения у женщин с привычным невынашиванием беременности, обратившихся за медицинской помощью в ранние сроки последующих беременностей [15, 16].

В рамках вспомогательных репродуктивных технологий данный подход используется для прогнозирования синдрома гиперстимуляции яичников. В такие когорты включаются женщины с момента начала контролируемой стимуляции овуляции, а в качестве предикторов рассматриваются исходные характеристики и маркеры раннего ответа, включая уровень антимюллерова гормона и количество антральных фолликулов [17].

Кроме того, прогностические когортные исследования применяются при изучении гинекологических заболеваний, например, эндометриоза. На основании данных послеоперационного наблюдения разрабатываются модели прогнозирования рецидива болевого синдрома и репродуктивных исходов [18].

Совокупность приведенных примеров иллюстрирует широкие возможности применения такого дизайна в прогностическом моделировании. Такой подход способствует индивидуализированной стратификации риска и поддержке принятия клинических решений в гинекологии и репродуктивной медицине.

Когортные исследования с дизайном прогностического исследования также применяются в крупных популяционных исследованиях, направленных на изучения множества факторов риска. Такой дизайн имело знаменитое Фремингемское исследование, долгосрочное эпидемиологическое исследование, начатое в 1948 году и продолжающееся до настоящего времени. В сфере женского здоровья примечательным примером подобного подхода является исследование здоровья медицинских сестер (Nurses’ Health Study), в рамках которого проводился анализ факторов риска репродуктивного здоровья женщин [19].

Международные стандарты

В соответствии с рекомендациями Международного комитета редакторов медицинских журналов (ICMJE)3, при подготовке научных работ к публикации авторам рекомендуется придерживаться руководств, размещенных на международной платформе EQUATOR Network. Рекомендации по описанию и представлению результатов наблюдательных и прогностических исследованиий изложены в руководствах STROBE [20] и TRIPOD [21]. Руководство STROBE направлено на оптимизацию описания наблюдательных, в том числе когортных исследований, тогда как руководство TRIPOD акцентирует внимание на стандартизации отчетов о предсказательных моделях. Отмечается, что единичные предикторы, как правило, не дают надежных оценок диагностической или прогностической вероятности или рисков. Поэтому практически во всех областях медицины применяются многофакторные модели, которые могут быть диагностическими (в одномоментных (поперечных) исследованиях) и прогностическими (в динамических (продольных) исследованиях).

Как и другие руководства из EQUATOR Network, STROBE и TRIPOD содержат контрольные перечни (checklists), включающие все важные элементы исследования от его дизайна до представления результатов. По каждому пункту перечней даны разъяснения с примерами. Это помогает стандартизировать процесс описания исследования и снижает вероятность упущения ключевых аспектов при написании статей и диссертаций. Многие журналы требуют прилагать к направляемым для публикации рукописям заполненные контрольные перечни с указанием страниц статьи, на которых изложена информация по каждому пункту перечня.

Использование руководств STROBE и TRIPOD способствует повышению воспроизводимости научных результатов, облегчает их критический анализ и упрощает внедрение результатов наблюдательных и прогностических исследований в клиническую практику.

Ошибки дизайна и анализа данных

Одной из наиболее распространенных и критических ошибок в дизайне прогностических исследований является нарушение принципа временной последовательности между измерением потенциального предиктора и наступлением исследуемого исхода. Это происходит, когда исследователи измеряют изменяющиеся во времени потенциальные маркеры (предикторы) у пациентов после того, как прогнозируемый исход уже наступил, или одновременно с ним. Подобный подход подрывает фундаментальную цель прогностического исследования — предсказать будущее событие, а не объяснить уже произошедшее.

Обычно эта ошибка проявляется в ситуациях, когда группы в исследовании формируются на основе наличия или отсутствия изучаемой патологии, например, наличия или отсутствия преэклампсии. Затем у этих групп измеряются потенциальные предикторы, которые могут изменяться в период между исходной точкой и исходом, например, биомаркеры. Такая стратегия напрямую противоречит ключевому условию прогностических исследований, которые предполагают отсутствие изучаемого исхода у участников на момент начала наблюдения. В частности, в исследованиях, посвященных прогнозированию преэклампсии, потенциальные предикторы обычно измеряются в первом триместре беременности, как описано выше [10] и предусмотрено международными клиническими рекомендациями [12], то есть задолго до развития этого осложнения.

Однако включение в модель предикторов, которые изменяются между началом наблюдения и исходом и измеряются уже после его наступления, нарушает принцип временной последовательности и представляет собой серьезную методологическую проблему. В таких случаях отсутствует критически важный фактор времени, который определяет последовательность событий и направленность связи между воздействием или маркером (потенциальным предиктором) и исходом. Это приводит к невозможности точно установить, что произошло раньше: изменение предполагаемого фактора риска/предиктора или сам изучаемый исход. Например, если в исследовании, посвященном прогнозированию преэклампсии, группы сформированы на основе уже имеющегося осложнения, и у этих женщин измеряется концентрация биохимического маркера, возникает важный вопрос: отражает ли измеренный уровень маркера его значение до начала заболевания, или же он изменился вследствие развития самой преэклампсии? Если маркер изменяется как реакция на болезнь, он не может служить предиктором ее возникновения; его ценность в этом случае сводится к диагностике уже существующего состояния.

Подобные методологические ошибки нивелируют прогностическую ценность выявленных маркеров, делая их результаты неприменимыми для оценки риска и разработки эффективных стратегий профилактики. Для обеспечения валидности прогностических исследований необходимо строго придерживаться принципа временной последовательности, измеряя потенциальные предикторы до развития интересующего исхода в рамках правильно спланированных когортных исследований.

Вторая типичная методологическая проблема таких исследований — крайне низкое качество анализа данных [22, 23].

В прогностических исследованиях применяются сравнительно сложные многомерные аналитические методы без должной подготовки и необходимых базовых статистических знаний у авторов. Это приводит к ошибочным выводам, искажениям интерпретации, снижению достоверности результатов и ухудшению воспроизводимости исследований. Такая ситуация указывает на пробелы в организации и проведении исследований, где продвинутые аналитические подходы применяются без базового понимания статистического анализа. Основная причина кроется в стремлении применять «модные» методики без глубокого понимания их предпосылок и ограничений. Желание использовать сложные инструменты часто обусловлено стремлением к высокой публикационной активности или подражанием исследованиям с высоким импакт-фактором. Применение современных статистических программ без осознания теоретической базы биостатистики создает иллюзию научной строгости, которая на деле может быть обманчивой. Крайне важно, чтобы авторы либо повышали свою статистическую компетентность, либо привлекали к работе квалифицированных специалистов.

Одной из распространенных ошибок в прогностических исследованиях является использование для прогнозирования отдельных предикторов и ROC-анализа вместо полноценной прогностической модели. Обычно изучается бинарный клинический исход и оценивается прогностическая эффективность количественных потенциальных предикторов, таких как концентрации биомаркеров или количественные параметры УЗИ. На основе исследуемых количественных показателей формируются ROC-кривые, вычисляется площадь под кривой и определяется оптимальный порог отсечения, а полученный результат объявляется прогностической моделью. Однако согласно Руководству TRIPOD, прогностическая модель определяется как комбинация нескольких предикторов, которые объединяют для оценки вероятности конкретного исхода или события, которое может произойти в конкретный период в будущем.

Для объединения предикторов используются различные статистические методы, которые можно условно разделить на классические подходы и современные алгоритмы машинного обучения. Среди традиционных методов широко применяются регрессионные модели, в частности линейная регрессия для непрерывных исходов и логистическая регрессия для бинарных исходов. Также используются методы анализа времени до наступления событий, такие как модель пропорциональных рисков Кокса. Выбор модели определяется типом данных и целями исследования. В клинических исследованиях предпочтение зачастую отдается регрессионному анализу, так как он позволяет получить более наглядные и легко интерпретируемые результаты. Используемые в последнее время методы машинного обучения, напротив, зачастую воспринимаются как менее понятные и больше напоминающие нечто вроде «черных ящиков».

В прогностических исследованиях ROC-анализ применяется для оценки качества построенной модели, предварительного сравнения моделей и выбора отрезных точек для бинарной классификации. ROC-кривая отображает значения чувствительности и специфичности при различных значениях прогнозируемой вероятности (непрерывного количественного показателя в диапазоне от 0 до 1). Главными показателями эффективности модели являются дискриминация (discrimination) и калибровка (calibration). Для оценки дискриминационной способность модели, то есть ее способности различать пациентов с целевым исходом или без него, рассчитывается площадь под ROC-кривой, статистически тестируется ее отличие от площади при случайной дискриминации 0,5. Калибровочная кривая отражает согласованность между предсказываемыми вероятностями и относительными частотами наблюдаемых исходов. Калибровку предпочтительно отображать в виде калибровочного графика, на котором предсказываемые вероятности исхода откладываются на оси X, а наблюдаемые относительные частоты исхода — на оси Y.

Кроме того, должны оцениваться классификационные показатели модели, такие как специфичность, чувствительность, прогностическая ценность положительного результата (ПЦПР), прогностическая ценность отрицательного результата (ПЦОР) с поправкой на преваленс, если она необходима, и др., которые являются показателями эффективности модели после выбора (на основе того или иного заявленного критерия) порогового значения вероятности. Подчеркнем, что оценок только чувствительности и специфичности недостаточно — при применении инструмента прогноза врач опирается на прогностические ценности, поэтому именно они определяют практическую применимость модели. При этом зачастую высокими значениями обладает лишь одна из двух прогностических ценностей модели (ПЦПР или ПЦОР), тогда модель может работать только на подтверждение изучаемого состояния (если высока ПЦПР) или на его исключение (если высока ПЦОР).

Если же ROC-анализ применяется не для функции прогноза, а для отдельного предиктора, то ROC-кривая строится не для прогнозируемой вероятности исхода, а для значений этого количественного предиктора (например, концентрации биомаркера). В этом случае ROC-анализ служит для выбора такого значения количественного предиктора, который оптимально (с наименьшими ошибками) разделяет наблюдения с наличием или отсутствием прогнозируемого исхода. Конечно, прогноз в этом случае не может быть количественным (оценивающим индивидуальную вероятность прогнозируемого исхода), а является бинарным (будет исход или нет, с определенной долей уверенности). Таким образом, применение ROC-анализа для одного количественного показателя вместо моделирования исключает возможность оценки абсолютного риска развития прогнозируемого исхода, что является основным интересом как для пациентов, так и для клиницистов. Также данный подход не позволяет учитывать влияние потенциальных вмешивающихся факторов. Таким образом, такие работы следует рассматривать как поиск кандидатов в предикторы, которые в последующем могут быть использованы при разработке прогностических моделей. Впрочем, для такого отбора количественных предикторов также можно использовать сравнение групп тестом Манна—Уитни по всем потенциальным количественным предикторам, результаты будут точно такие же. Вместе с тем, для включения того или иного предиктора в модель не требуется доказательства его одномерной статистической связи с откликом.

Еще одной типичной ошибкой является некорректная интерпретация построенных моделей. Подобно тому, как корреляционные связи не могут интерпретироваться как причинно-следственные, прогностические модели также не могут интерпретироваться как свидетельства причинно-следственных связей предикторов и отклика.

Примером, иллюстрирующим описанные выше ошибки методологии и дизайна прогностических исследований, является проспективное когортное исследование, целью которого было прогнозирование неблагоприятных исходов беременности при гестационном сахарном диабете (ГСД) на основе биомаркеров крови [24].

Во-первых, это исследование фактически представляло собой этиологическое исследование, поскольку изначально в нем были сформированы две группы беременных: с наличием и отсутствием ГСД. На сроке 24—30 недель у пациенток обеих групп были получены образцы крови для определения набора биохимических и гематологических показателей. По завершении периода наблюдения исследователи сравнили эти биомаркеры, а также клинико-анамнестические характеристики у женщин с неблагоприятным исходом беременности и без него в обеих группах. Единственным биомаркером крови, концентрация которого различалась при наличии и отсутствии неблагоприятного исхода в обеих группах, оказался фибриноген. Считая его ключевым предиктором, авторы построили две ROC-кривые: первую — для оценки способности уровня фибриногена на сроке 24—30 недель дифференцировать пациенток с ГСД и без него, а вторую — дифференцировать пациенток с ГСД с неблагоприятным исходом беременности и без него.

Первая ROC-кривая была интерпретирована авторами как свидетельство того, что уровень фибриногена может использоваться для диагностики ГСД на сроке 24—30 недель. Однако трудно представить, что кто-либо будет диагностировать ГСД по уровню фибриногена вместо безопасного и точного диагностического перорального глюкозотолерантного теста. Вторая ROC-кривая вместо прогнозируемой вероятности неблагоприятного исхода отражает лишь распределение концентраций фибриногена при различных сочетаниях чувствительности и специфичности, что представляет собой не прогноз, а только косвенный признак ассоциации между уровнем фибриногена на сроке 24—30 недель и неблагоприятным исходом беременности.

Дополнительной методологической проблемой является спорный выбор изучаемого исхода. В качестве такового использовалась комбинированная конечная точка «неблагоприятный исход беременности», включающая преждевременные роды и нарушения роста плода. Такой состав комбинированной конечной точки является недостаточно полным для прогностического исследования, посвященного ГСД. Хотя преждевременные роды и аномалии роста плода представляют собой значимые риски, ассоциированные с ГСД, столь узкий состав комбинированной конечной точки исключает ряд важных материнских и неонатальных осложнений. Среди них — преэклампсия, макросомия, требующая родоразрешения путем кесарева сечения, послеродовое кровотечение, инфекции мочевых путей, неонатальная гипогликемия, респираторный дистресс-синдром и необходимость госпитализации новорождённого в отделение интенсивной терапии.

В этом исследовании также допущена довольно распространенная ошибка статистического анализа: сравнение показателей между пациентками с наличием и отсутствием неблагоприятного исхода проводилось отдельно в группах с ГСД и без него, тогда как поперечного сравнения между этими группами выполнено не было.

И, наконец, если бы авторы анализировали свои данные как результаты этиологического исследования, каким оно и является, то они могли бы рассчитать относительный риск для каждого осложнения ГСД. Такая информация была бы значительно более полезной и клинически значимой, чем научно-сомнительное и практически неприменимое значение AUC для фибриногена.

Заключение

Прогностические исследования играют ключевую роль в формировании устойчивой и эффективной системы охраны здоровья матери и ребенка, направленной на снижение материнской и детской заболеваемости и смертности, обеспечение качественной медицинской помощи, профилактику заболеваний и поддержку репродуктивного здоровья.

Учитывая важность надежных оснований для принятия ответственных решений в клинической практике, особенно в таких чувствительных областях, как материнское и репродуктивное здоровье, при проведении исследований важно обеспечить тесное сотрудничество медицинских специалистов с экспертами в области биостатистического анализа. Внедрение статистического рецензирования в научно-медицинских журналах также являются ключевой мерой, направленной на обеспечение надежности и научной состоятельности публикуемых работ.

Авторы заявляют об отсутствии конфликта интересов.

Авторы выражают благодарность В.В. Власову, д.м.н., профессору кафедры управления и экономики здравоохранения департамента политики и управления факультета социальных наук НИУ ВШЭ, за ценные рекомендации по редактированию рукописи.

Участие авторов:

Концепция и дизайн исследования — Реброва О.Ю., Аксенов В.А.

Сбор и обработка материала — Аксенов В.А., Реброва О.Ю.

Написание текста — Аксенов В.А., Реброва О.Ю.

Редактирование — Реброва О.Ю.

Authors declare lack of the conflicts of interests.

The authors sincerely thank V.V. Vlasov, Doctor of Medical Sciences and Professor in the Department of Health Management and Economics at the Faculty of Social Sciences, HSE University, for his valuable recommendations on editing the manuscript.

Participation of authors:

Concept and design of the study — Rebrova O.Yu., Aksenov V.A.

Data collection and processing — Aksenov V.A., Rebrova O.Yu.

Text writing — Aksenov V.A., Rebrova O.Yu.

Editing — Rebrova O.Yu.

1В данной статье экспозиция (от лат. expositio) — подверженность воздействию внешних и внутренних факторов.

2Когортные исследования при определенных условиях могут убедительно свидетельствовать в пользу причинно-следственной связи, особенно если соблюдены дополнительные критерии, такие как большой размер эффекта, согласованность с результатами других исследований и биологическое правдоподобие. Но окончательное доказательство причинно-следственной связи обычно требует проведения экспериментальных исследований, таких как рандомизированные контролируемые испытания (РКИ), которые позволяют минимизировать систематические ошибки и контролировать вмешивающиеся факторы. Проблема, однако, в том, что РКИ не могут проводиться для установления этиологии или факторов риска и течения болезней.

3International Committee of Medical Journal Editors [https://www.icmje.org/]. Recommendations for the Conduct, Reporting, Editing and Publication of Scholarly Work in Medical Journals [2024 Dec].

Литература / References:

  1. Hill AB. The Environment and disease: Association or causation? Proc R Soc Med. 1965;58:5:295-300.  https://doi.org/10.1177/003591576505800503
  2. Doll R, Hill AB. Lung cancer and other causes of death in relation to smoking. A second report on the mortality of British doctors. BMJ. 1956;233:1071-1076. https://doi.org/10.1136/bmj.2.5001.1071
  3. Sackett DL, Straus SE, Richardson WS, Rosenberg W, Haynes RB. Evidence-based medicine: How to practice and teach EBM. 2nd ed., Edinburgh; Churchill Livingstone, 2000.
  4. Флетчер Р., Флетчер С., Вагнер Э. Клиническая эпидемиология: Основы доказательной медицины. М.: Медиа Сфера. 1998;352. 
  5. van Diepen M, Ramspek CL, Jager KJ, Zoccali C, Dekker FW. Prediction versus aetiology: common pitfalls and how to avoid them. Nephrol Dial Transplant. 2017;32:suppl_2:ii1-ii5. PMID: 28339854. https://doi.org/10.1093/ndt/gfw459
  6. Vaginal birth after cesarean (VBAC) calculator MFMU Network, George Washington University. https://mfmunetwork.bsc.gwu.edu/web/mfmunetwork/vaginal-birth-after-cesarean-calculator(dateofaccess:09.11.2025).
  7. Qu P, Chen L, Zhao D, Shi W, & Shi J. Nomogram for the cumulative live birth in women undergoing the first IVF cycle: Base on 26, 689 patients in China. In Frontiers in Endocrinology 2022;13. Frontiers Media SA.  https://doi.org/10.3389/fendo.2022.900829
  8. Timmerman D, Planchamp F, Bourne T, Landolfo C, du Bois A, Chiva L, Cibula D, Concin N, Fischerova D, Froyman W, Gallardo Madueño G, Lemley B, Loft A, Mereu L, Morice P, Querleu D, Testa AC, Vergote I, Vandecaveye V, Scambia G, Fotopoulou C. ESGO/ISUOG/IOTA/ESGE Consensus Statement on pre-operative diagnosis of ovarian tumors. Int J Gynecol Cancer. 2021;31:7:961-982.  https://doi.org/10.1136/ijgc-2021-002565
  9. The Fetal Medicine Foundation. https://www.fetalmedicine.org(dateofaccess:09.11.2025).
  10. Poon LCY, Karagiannis G, Leal A, Romero XC, & Nicolaides KH. Hypertensive disorders in pregnancy: screening by uterine artery Doppler imaging and blood pressure at 11-13 weeks. Ultrasound in Obstetrics & Gynecology. 2009;34:5:497-502.  https://doi.org/10.1002/uog.7439
  11. Министерство здравоохранения Российской Федерации. Клинические рекомендации «Преэклампсия. Эклампсия. Отеки, протеинурия и гипертензивные расстройства во время беременности, в родах и в послеродовом периоде» [Электронный ресурс]. Москва. 2024.
  12. Poon LC, Shennan A, Hyett JA, Kapur A, Hadar E, Divakar H, McAuliffe F, da Silva Costa F, von Dadelszen P, McIntyre HD, Kihara AB, Di Renzo GC, Romero R, D’Alton M, Berghella V, Nicolaides KH, Hod M. The International Federation of Gynecology and Obstetrics (FIGO) initiative on pre-eclampsia: A pragmatic guide for first-trimester screening and prevention. Int J Gynaecol Obstet. 2019;145:Suppl 1:1-33.  https://doi.org/10.1002/ijgo.12892
  13. van Leeuwen M, Opmeer BC, Zweers EJ, van Ballegooie E, ter Brugge HG, de Valk HW, Visser GH, Mol BW. External validation of a clinical scoring system for the risk of gestational diabetes mellitus. Diabetes Res Clin Pract. 2009;85:1:96-101.  https://doi.org/10.1016/j.diabres.2009.04.025
  14. Neary C, Naheed S, McLernon DJ, Black M. Predicting risk of postpartum haemorrhage: a systematic review. BJOG. 2021;128: 1:46-53.  https://doi.org/10.1111/1471-0528.16379
  15. Nelson SM, Yates RW, Lyall H, Jamieson M, Traynor I, Gaudoin M, Mitchell P, Ambrose P, Fleming R. Anti-Müllerian hormone-based approach to controlled ovarian stimulation for assisted conception. Hum Reprod. 2009;24:4:867-875.  https://doi.org/10.1093/humrep/den480
  16. Weghofer A, Kim A, Barad DH, Gleicher N. Follicle stimulating hormone and anti-Müllerian hormone per oocyte in predicting in vitro fertilization pregnancy in high responders: a cohort study. PLoS One. 2012;7:4:e34290. https://doi.org/10.1371/journal.pone.0034290
  17. Lee TH, Liu CH, Huang CC, Wu YL, Shih YT, Ho HN, Yang YS, Lee MS. Serum anti-Müllerian hormone and estradiol levels as predictors of ovarian hyperstimulation syndrome in assisted reproduction technology cycles. Hum Reprod. 2008;23:1:160-167.  https://doi.org/10.1093/humrep/dem254
  18. Holdsworth-Carson SJ, Chung J, Machalek DA, Li R, Jun BK, Griffiths MJ, Churchill M, McCaughey T, Nisbet D, Dior U, Donoghue JF, Montgomery GW, Reddington C, Girling JE, Healey M, Rogers PAW. Predicting disease recurrence in patients with endometriosis: an observational study. BMC Med. 2024;22:1:320.  https://doi.org/10.1186/s12916-024-03508-7
  19. Chavarro JE, Rich-Edwards JW, Gaskins AJ, Farland LV, Terry KL, Zhang C, Missmer SA. Contributions of the Nurses’ Health Studies to Reproductive Health Research. Am J Public Health. 2016;106:9:1669-1676. https://doi.org/10.2105/AJPH.2016.303350
  20. Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ, Poole C, Schlesselman JJ, Egger M; STROBE Initiative. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration. Epidemiology. 2007;18:6:805-835.  https://doi.org/10.1097/EDE.0b013e3181577511
  21. Moons KG, Altman DG, Reitsma JB, Loannidis JPA, Macaskill P, Steyerberg EW, Vickers AJ, Ransohoff DF, Collins GS. Transparent reporting of a multivariable prediction model for individual prognosis or diagnosis (TRIPOD): explanation and elaboration. Ann Intern Med. 2015;162:1:W1-73.  https://doi.org/10.7326/M14-0698
  22. Реброва О.Ю. Описание статистического анализа данных в оригинальных статьях. Типичные ошибки. Российская ринология. 2018;26:1:65-68.  https://doi.org/10.17116/rosrino201826165-68
  23. Аксенов В.А. Ошибки статистического анализа и методологии исследований в статьях, направляемых в журнал «Акушерство и гинекология». Акушерство и гинекология. 2020;9:145-152.  https://doi.org/10.18565/aig.2020.9.145-152
  24. Mandić-Marković V, Dobrijević Z, Robajac D, et al. Biochemical Markers in the Prediction of Pregnancy Outcome in Gestational Diabetes Mellitus. Medicina. 2024;60:8:1250. https://doi.org/10.3390/medicina60081250

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail

Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.