Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.
Персонализированный ИИ-ассистент для медицинского сопровождения матери и ребенка с использованием интеллектуальных диалоговых систем (обзор литературы)
Журнал: Проблемы репродукции. 2026;32(2): 6‑16
Прочитано: 103 раза
Как цитировать:
Перинатальный и неонатальный периоды характеризуются наиболее интенсивным взаимодействием семьи с системой здравоохранения. На протяжении 9 мес беременности и последующих 5 лет детства число плановых визитов к врачу составляет в среднем 15—20. Однако между этими визитами у родителей, особенно при рождении первого ребенка, возникает широкий спектр вопросов, связанных с самочувствием во время беременности, состоянием новорожденного, интерпретацией результатов обследований и особенностями послеродового восстановления и др.
Зачастую за неимением рекомендаций о том, куда обращаться, и объективных источников медицинской информации родители могут быть в поисках ответов на те или иные повседневные вопросы и пользоваться поисковыми системами, форумами и социальными сетями, где рискуют столкнуться с устаревшими или недостаточно обоснованными рекомендациями. Следствием этого становится либо неоправданная тревожность с избыточными обращениями в медицинские учреждения, либо, напротив, недооценка серьезных симптомов и запоздалое обращение за помощью. При этом существующие мобильные приложения для беременных могут не соответствовать уровню клинической обоснованности контента [1] и не быть интегрированными с медицинскими информационными системами (МИС) клиник, что лишает их возможности учитывать индивидуальные особенности пациентки [2, 3].
Таким образом, дефицит квалифицированной коммуникации между визитами к врачу представляет собой не только информационную, но и клиническую проблему. Одновременно с этим стремительное развитие больших языковых моделей (Large Language Models (LLM)) и технологии генерации с дополненным поиском (Retrieval-Augmented Generation (RAG)) создает предпосылки для принципиально иного подхода к сопровождению семьи. Современные LLM демонстрируют клинически значимую точность ответов в акушерстве и педиатрии, а применение RAG-архитектуры может существенно снижать риск генерации недостоверной информации. Интеграция подобной системы с МИС клиники способна трансформировать обобщенный справочный инструмент в консультанта, учитывающего срок беременности, результаты обследований, возраст ребенка и историю обращений конкретной пациентки.
Цель обзора — обосновать применение ИИ-ассистента на базе RAG-архитектуры, связанного с МИС клиники, для непрерывного сопровождения матери и ребенка в перинатальном и раннем педиатрическом периоде.
В данном обзоре литературы последовательно рассматриваются следующие разделы:
1. Клиническая потребность в ИИ-ассистенте и возможные ограничения существующих инструментов на основе искусственного интеллекта (ИИ).
2. Доказательная база применимости LLM и RAG в профильных клинических областях.
3. Архитектура предлагаемого решения, включающая виртуальную модель пациента, систему определения степени срочности и механизм формирования сводок для врача.
4. Вопросы безопасности и границы компетенции системы.
5. Регуляторные и этические рамки внедрения в условиях Российской Федерации.
Поиск литературы проведен в электронных базах данных PubMed, Google Scholar, Cochrane Library и eLibrary с использованием следующих ключевых слов и их сочетаний на русском и английском языках: «большие языковые модели», «LLM», «акушерство», «педиатрия», «RAG», «retrieval-augmented generation», «чат-бот», «медицинский ассистент», «вируальная модель пациента», «медицинская сортировка (триаж)», «perinatal AI», «pediatric chatbot», «medical information system integration». Поиск охватывал период с января 2020 г. по май 2025 г. Дополнительно проведен анализ списков литературы включенных публикаций для выявления релевантных источников, не обнаруженных при первичном поиске.
Критерии включения: оригинальные исследования, систематические обзоры и метаанализы, описывающие применение больших языковых моделей и/или RAG-архитектуры в акушерстве, гинекологии и педиатрии; работы, посвященные цифровым ассистентам и системам сортировки обращений в указанных областях; публикации на русском и английском языках.
Критерии исключения: тезисы конференций, представленные без полнотекстовой версии; редакционные комментарии; работы, не содержащие количественных данных о точности или клинической эффективности описываемых систем.
В результате поиска выявлено 154 публикации (PubMed — 82, Google Scholar — 54, Cochrane Library — 6, eLibrary — 12). После удаления дубликатов отобрано 118 записей. На этапе отбора по заголовкам и аннотациям для полнотекстового анализа выделено 52 работы. После полнотекстового анализа в итоговый обзор включена 31 научная публикация (оригинальные исследования, систематические обзоры и метаанализы), составившая доказательную базу настоящей статьи.
Помимо этого, при подготовке работы использованы 4 нормативных документа Российской Федерации (национальные стандарты ГОСТ Р 59921.2-2021 и ГОСТ Р 71672-2024, приказ Росздравнадзора №4472 от 21.07.2025, Кодекс этики применения искусственного интеллекта в здравоохранении), 3 информационно-аналитических источника и 2 описания коммерческих клинических систем, использованных в качестве примеров существующих решений. Общее число цитируемых источников составило 40.
Традиционная модель медицинского наблюдения матери и ребенка предполагает периодические визиты к врачу с интервалом от двух недель до нескольких месяцев. В межвизитный период родители могут быть как лишены доступа к квалифицированной информационной поддержке, так и ограничены неформальными каналами — поисковыми системами, тематическими форумами и советами окружения. В свою очередь, врач также может не располагать данными о динамике состояния в промежутках между приемами (симптомы, поводы для беспокойства, вопросы, которые оставались неразрешенными, и др.), что стратегически важно, поскольку теряется преемственность между медицинскими специалистами и пациентами (на примере ситуации, связанной с пандемией COVID-19).
Наиболее остро данная проблема проявляется у первородящих женщин, не имеющих собственного опыта дифференцировки нормы и патологии. Типичные запросы, возникающие в межвизитном периоде, охватывают широкий спектр ситуаций: интерпретацию болевых ощущений и изменений самочувствия при беременности, оценку соответствия развития ребенка возрастным нормативам, допустимость применения тех или иных продуктов и лекарственных средств, тактику действий при повышении температуры тела у младенца. Каждый из этих вопросов потенциально значим для безопасности матери или ребенка и требует точного, контекстно-зависимого ответа.
Анализ цифровых инструментов для мониторинга беременности и раннего детства выявляет существенное несоответствие между потребностями пользователей и функциональными возможностями доступных решений. Согласно систематическому обзору N. Lazarevic и соавт. (2023), в мобильных приложениях для беременных выявлен низкий уровень научной обоснованности контента: только незначительная доля приложений базируется на актуальных клинических протоколах, тогда как большинство предлагает генерализованную и зачастую недостоверную информацию. Кроме того, имеющиеся приложения функционируют изолированно от клинических данных пациентки: они не содержат информации о сроке гестации (за исключением введенной вручную пользователем), не имеют доступа к результатам лабораторных и инструментальных исследований и не учитывают индивидуальные факторы риска [1].
Сохраняется также разрыв между потребительскими мобильными приложениями и медицинскими информационными системами (МИС). Многие популярные приложения для беременных не поддерживают стандарты обмена медицинскими данными (в частности, HL7 FHIR), что усложняет возможность системной двусторонней передачи информации между пациенткой и клиникой. Систематический анализ M. Nissen и соавт. (2024), охвативший 35 наиболее распространенных англоязычных приложений для беременных, подтверждает, что все рассмотренные приложения носят зачастую коммерческий характер, при этом только 15 из них декларируют участие медицинских экспертов в разработке контента, а ссылки на научные источники и доказательную медицину в большинстве случаев отсутствуют [2].
Дополнительным ограничением выступает низкая приверженность пользователей: по данным A. Pratap и соавт. (2020), медиана удержания участников в 8 исследованиях варьировала от 2 до 26 дней (медиана по всем исследованиям 5,5 дня). Недостаточная клиническая ценность имеющихся решений обусловливает низкий уровень долгосрочного вовлечения, что, в свою очередь, ограничивает их потенциальную клиническую эффективность [4].
Преемственность медицинской помощи (continuity of care) рассматривается международным медицинским сообществом в качестве важного фактора улучшения перинатальных исходов. В Кокрановском обзоре J. Sandall и соавт. (2024), охватившем 18 533 женщины, установлено, что модели непрерывного акушерского сопровождения ассоциированы со статистически значимым снижением частоты кесаревых сечений и повышением вероятности самопроизвольных вагинальных родов. Наблюдалось снижение риска потери плода до 24-й недели гестации (на 18%), однако авторы оценивают достоверность этих данных как очень низкую. Статистически значимого влияния на риск преждевременных родов не было [5].
Ключевым механизмом, обеспечивающим положительный эффект преемственности, выступает знание данных пациентки: ее анамнеза, предшествующих жалоб, динамики клинических показателей. Именно этот механизм может быть воспроизведен в цифровом формате посредством интеграции ИИ-ассистента с МИС клиники. Такая интеграция позволяет формировать персонализированный профиль каждой пациентки, по существу ее виртуальную модель, и предоставлять контекстно-зависимые рекомендации на протяжении всего периода наблюдения.
В области акушерства и гинекологии C. Martinelli и соавт. (2025) в кросс-секционном исследовании PERFORM сопоставили производительность восьми LLM и 24 врачей-ординаторов на 60 стандартизированных клинических сценариях. Лучшие модели — ChatGPT-o1-preview, GPT-4o и Claude Sonnet 3.5 — статистически значимо превосходили ординаторов младших лет обучения (p<0,001), при этом результаты ординаторов демонстрировали систематический рост от 44,7% на первом году до 87,1% на пятом [6]. Сходные результаты получены K.J. Eoh и соавт. (2024): на 116 вопросах ординаторских экзаменов по акушерству и гинекологии (из 170 за 2020—2023 гг., за вычетом вопросов с изображениями) средняя корректность ответов GPT-4 составила 79,31%, что статистически значимо не отличалось от результатов ординаторов [7]. F. Ługowski и соавт. (2025) при оценке ChatGPT-3.5 и ChatGPT-4 на 352 вопросах польских сертификационных экзаменов по акушерству и гинекологии получили для ChatGPT-4 точность от 76,5% до 89,6% в зависимости от сессии и языка [8].
В педиатрии Q. Wei и соавт. (2023) оценили точность ChatGPT (GPT-4) на 4160 клинических вопросах, охватывающих 104 педиатрических состояния. Общая точность достигла 82,2% (95% ДИ 81,0—83,4%), а для распространенных заболеваний доходила до 84,4% [9]. İ. Özer Aslan и соавт. (2025) при кросс-платформенном сравнении ИИ-чатботов в области грудного вскармливания выявили, что ChatGPT-4o Pro наиболее полно соответствовал рекомендациям Всемирной организации здравоохранения (ВОЗ), ACOG, CDC и NICE, набрав 38 из 40 возможных баллов по шкале соответствия клиническим руководствам (95% точности) на 20 стандартизированных вопросах [10]. Независимая оценка качества ответов чатботов, проведенная E.O. Kacer (2025), подтвердила высокую надежность генерируемой информации, но обнаружила проблему чрезмерной сложности языка ответов, для понимания которой необходим университетский уровень образования [11].
Применительно к вакцинации — еще одной ключевой теме для ИИ-ассистента — G. Deiana и соавт. (2023) установили, что точность ChatGPT при ответах на вопросы о мифах и заблуждениях ВОЗ о вакцинации достигает 85,4%. GPT-4 превосходил GPT-3.5 по корректности (+5,6%), ясности (+17,9%) и полноте (+9,3%) [12].
Следует подчеркнуть, что доля правильных ответов LLM заметно зависит от языка запроса. F. Ługowski и соавт. (2025) при сравнительном исследовании на польском и английском языках выявили статистически значимую разницу в пользу английского по всем тестам и версиям моделей (p<0,001 для каждого сравнения): для ChatGPT-3.5 разрыв составлял от 6 до 18,5 процентного пункта, для ChatGPT-4 — от 4,3 до 6,7 процентного пункта. Это подчеркивает необходимость тщательной локализации и валидации системы для русскоязычного контекста [8].
Несмотря на высокую базовую верность ответов, LLM подвержены так называемым галлюцинациям — генерации правдоподобных, но фактически некорректных утверждений. В медицинском контексте это создает риск для безопасности пациентов. M. Omar и соавт. (2025) при анализе уязвимости LLM к атакам в клинических сценариях обнаружили, что при целенаправленном тестировании уровень галлюцинаций базовых моделей доходит до 50—82,7%. Без дополнительных механизмов контроля такие модели неприемлемы в клинической практике [13].
Архитектура RAG представляет собой подход, при котором информация генеративной модели дополняется извлеченной релевантной информацией из верифицированных источников: клинических протоколов, рекомендаций профессиональных сообществ, медицинской карты конкретного пациента. Это позволяет резко снизить частоту галлюцинаций. F. Neha и соавт. (2025) в систематическом обзоре подтвердили, что RAG повышает фактическую согласованность ответов LLM, эффективно применяется для диагностической поддержки, реферирования медицинских карт и медицинского консультирования и демонстрирует потенциал эффективного применения в клинической практике, в том числе для поддержки диагностических решений, структурирования медицинской документации, а также для информационного консультирования пациентов [14].
Количественные оценки эффективности RAG подтверждают эти выводы. В работе Y.H. Ke и соавт. (2025) на 10 языковых моделях точность GPT-4 с RAG на базе международных клинических рекомендаций составила 96,4%, статистически значимо превосходя врачей-клиницистов (86,6%, p=0,016), при полном отсутствии галлюцинаций [15]. K. Wołk (2025) при сравнении 12 вариантов RAG-архитектуры выявил, что механизм саморефлексивной генерации (SELF-RAG) снижает уровень галлюцинаций до 5,8%, а гибридные подходы — сочетание плотного и разреженного поиска с повторным ранжированием — дают наилучший баланс точности извлечения (Precision@5>0,68) и скорости ответа [16]. В работе A. Wada и соавт. (2025) применение RAG-дополненной локальной модели в радиологическом контексте привело к полному устранению галлюцинаций (снижение с 8% до 0%) при одновременном улучшении клинической точности и качества коммуникации [17].
S. Xu и соавт. (2025), разработавшие архитектуру MEGA-RAG с множественными источниками доказательств для верификации ответов, добились снижения галлюцинаций более чем на 40% по сравнению с базовыми моделями. Совокупность приведенных данных позволяет утверждать, что RAG является необходимым компонентом для безопасного использования LLM в клинической практике [18].
Зависимость точности LLM от языка запроса создает серьезный вызов для применения ИИ-ассистента на российском рынке. Прямой перенос англоязычных результатов в русскоязычную среду некорректен, и необходима самостоятельная валидация [8, 9]. Мы рассматриваем языковой барьер, а не технологические ограничения моделей как таковых как потенциально главное препятствие при адаптации зарубежного опыта.
Для решения этой проблемы в архитектуре описываемой системы предусмотрены следующие механизмы: формирование русскоязычной базы знаний RAG с опорой на актуальные российские клинические рекомендации и международные протоколы в авторизованном переводе; адаптация системных промптов для генерации ответов на доступном, не требующем специальной подготовки языке; независимая валидация точности на корпусе типичных вопросов пациенток на русском языке с привлечением экспертов-клиницистов. Кроме того, существенным фактором может быть использование отечественной LLM, обученной на широком корпусе русскоязычных текстов (GigaChat).
ИИ-ассистент — интеллектуальная диалоговая система, функционирующая в приложении клиники и (или) в популярных мессенджерах. Она предназначена для круглосуточного информационного сопровождения пациентки с момента планирования беременности (включая программы вспомогательных репродуктивных технологий) до достижения ребенком возраста 5 лет.
Отличие данной модели ассистента от существующих решений заключается в сочетании следующих характеристик: высокой точности ответов за счет современных LLM с RAG-архитектурой; персонализации через интеграцию с МИС клиники (виртуальная модель пациента); встроенной системы определения степени срочности, направляющей пациента к врачу при выявлении показаний и выполнении на русском языке. Это способствует повышению доступности для пациентов и практического здравоохранения в целом.
Тематический охват ассистента включает вопросы питания, симптоматики и самочувствия, результатов обследований, развития плода и ребенка, подготовки к родам, грудного вскармливания и введения прикорма, норм сна, психомоторного и речевого развития, вакцинации и профилактики.
Центральным элементом персонализации выступает концепция виртуальной модели пациента. Речь идет о динамическом виртуальном профиле, который объединяет клинические данные из МИС клиники и историю взаимодействий в чате. V. Calcaterra и соавт. (2023), описавшие эту концепцию применительно к диаде «мать — плод», подчеркивают значение сбора мультимодальных данных для перехода от реактивного лечения к упреждающему прогнозированию осложнений [19].
Применительно к рассматриваемому ассистенту виртуальная модель включает следующие компоненты данных.
Из МИС клиники: срок беременности и предполагаемая дата родов; результаты лабораторных исследований (общий анализ крови, биохимия, гормональный профиль, скрининги); результаты инструментальных исследований (ультразвуковое исследование); диагнозы и факторы риска; назначенная терапия; возраст и антропометрические данные ребенка; календарь прививок и его выполнение.
Из истории чата: предыдущие вопросы и жалобы пациентки; динамика обращений (нарастающая частота вопросов по определенной теме); неразрешенные проблемы.
Благодаря интеграции с МИС ассистент может формировать ответы с учетом индивидуального контекста. Например, на вопрос о боли в пояснице система учитывает текущий срок беременности и наличие факторов риска; на вопрос о нормах развития — точный возраст ребенка и предшествующие показатели. По данным V. Kuwar и соавт. (2026), персонализация с использованием данных электронных медицинских карт статистически значимо повышает удовлетворенность пациентов, уровень вовлеченности и доверия к ИИ-системе [20].
J.N. Rivera Rivera (2024) описал реализацию послеродового чатбота в системе здравоохранения, где адаптация контента на основании данных медицинской карты (тип родов, практика грудного вскармливания) повышала соответствие предоставляемой информации потребностям пациенток [21]. Этот опыт подтверждает жизнеспособность подхода, положенного в основу нашей концепции.
С 2024 г. в Российской Федерации внедряются цифровые медицинские профили, объединяющие данные электронных медицинских карт и результаты обследований, что формирует нормативную и технологическую инфраструктуру для подобной интеграции [22].
Ключевым компонентом безопасности является система определения степени срочности, устанавливающая, в какой ситуации вопрос пациентки может быть решен ассистентом самостоятельно, в каком случае следует рекомендовать наблюдение, а в какой ситуации необходимо немедленное направление к врачу или вызов скорой медицинской помощи.
Согласно систематическому обзору M. Kopka и соавт. (2025), охватившему 19 исследований, LLM обеспечивают умеренную, но стабильную точность при сортировке обращений по степени тяжести (57,8—76,0%), превосходя обычных пользователей (47,3—62,4%) [23]. V. Liu и соавт. (2024) установили, что уровень безопасности клинически валидированных систем с маркировкой медицинского устройства достигает 97,6%: при точности совпадения 53,7% подавляющее большинство отклонений приходится на консервативную сторону (направление к врачу при отсутствии строгих показаний), а не на пропуск опасных состояний [24].
В области педиатрии E. Aygun и соавт. (2026) в проспективном исследовании зафиксировали чувствительность GPT-4o 82,9% при обнаружении критических состояний у детей — заметно выше, чем у среднего медицинского персонала (37,2%) [25]. Вместе с тем, по данным H. Brown (2025), ИИ правильно идентифицирует все экстренные случаи (100% чувствительность для неотложных состояний), однако склонен к гипердиагностике — перенаправлению неэкстренных случаев в неотложную помощь [26].
Выбор четырехуровневой модели обусловлен, с одной стороны, клинической практикой триажа в педиатрии, а с другой — необходимостью минимизировать количество уровней для упрощения логики принятия решений. Мы намеренно отказались от дробных шкал (например, пятиуровневой, как в системе Infermedica), поскольку в контексте информационного ассистента, а не диагностической системы избыточная детализация увеличивает риск ошибочной классификации.
С учетом приведенных нами данных для ассистента выбрана следующая модель:
Уровень 1 — самостоятельный ответ: типовые вопросы о питании, допустимых продуктах, нормах развития, подготовке к процедурам. Ассистент предоставляет информационный ответ с опорой на проверенную экспертами базу знаний RAG.
Уровень 2 — ответ с рекомендацией наблюдения: вопросы о симптомах без признаков экстренности. Ассистент предоставляет информацию и рекомендует наблюдение с описанием критериев для обращения к врачу.
Уровень 3 — рекомендация планового обращения: наличие тревожных, но не экстренных признаков или повторяющиеся жалобы по одной теме. Ассистент предлагает записаться на прием к врачу.
Уровень 4 — немедленное направление: обнаружение симптомов, требующих экстренной медицинской помощи (кровотечение, резкая боль, высокая температура у младенца первых месяцев жизни, признаки нарушения дыхания). Ассистент настоятельно рекомендует немедленное обращение к врачу или вызов скорой помощи.
Модель реализует принцип «консервативной сортировки»: при неопределенности система скорее направит пациентку к врачу, чем пропустит потенциально опасное состояние. Такой подход соответствует мнению экспертного сообщества о предпочтительности умеренной гипердиагностики перед риском недодиагностики в контексте цифровой оценки срочности [23, 24].
Для повышения надежности применяется гибридный подход: генеративная модель (LLM) дополняется детерминистическими правилами, составленными по валидированным клиническим протоколам. Протоколы педиатрического телефонного триажа Бартона Шмитта, используемые в 95% медицинских колл-центров США и Канады и основанные на рекомендациях Американской академии педиатрии, служат примером такой доказательной базы правил [27]. Коммерческие диагностические системы, например вероятностные модели с поддержкой более 1000 симптомов и состояний и пятиуровневой шкалой сортировки, показывают возможность сочетания алгоритмических правил и машинного обучения [28].
При направлении на уровни 3 и 4 ассистент формирует структурированное резюме для врача. Это решает распространенную проблему: при стандартной записи на прием врач не располагает информацией о том, что именно беспокоило пациентку и какова динамика ее состояния. Резюме включает: идентификационные данные пациентки и ребенка; текущую жалобу; контекст из чата за предшествующий период (предыдущие вопросы, отмеченные симптомы, динамика); рекомендации, предоставленные ассистентом; причину направления.
Такой подход превращает каждое обращение к ИИ-ассистенту в дополнительный источник клинической информации, расширяя представление врача о состоянии пациентки за пределы данных, собираемых в ходе планового визита.
Помимо консультативной функции ИИ-ассистент может выполнять роль координатора медицинского обслуживания.
Вакцинация. Цифровые ассистенты с автоматизированным планированием и напоминаниями способны повышать уровень завершенности курса вакцинации у детей. Так, B. Baublitz и соавт. (2023) показывают, что в выбранных для исследования клиниках 57% детей в возрасте от 19 до 23 мес пропустили одну или более прививку и только 28% из них были записаны на последующий визит. Интеграция с МИС дает ассистенту возможность отслеживать фактическое выполнение прививочного календаря и заблаговременно напоминать о предстоящих вакцинациях [29].
Нутрициологическая поддержка. Как показали M. Haimi и соавт. (2025), дистанционное нутрициологическое ведение в педиатрии обеспечивает клинические результаты, сопоставимые с очными визитами, при ощутимом снижении логистической нагрузки на семью. ИИ-ассистент может предоставлять рекомендации по введению прикорма, режиму питания и допустимым продуктам, исходя из возраста ребенка и наличия аллергии [30].
Мониторинг развития. По данным M. Rodriguez-Marin и соавт. (2025), точность алгоритмов машинного обучения в диагностике нарушений физического развития у детей составляет 94,65% при чувствительности 91,03%. На основании этих данных ассистент способен выявлять отклонения от нормативных показателей роста и развития по данным из МИС и своевременно рекомендовать обращение к специалисту [31].
Запись на прием, планирование и организация визитов. Ассистент поддерживает запись, перенос и отмену визитов через интеграцию с системой расписания клиники.
Отправка результатов анализов. Автоматическое уведомление о готовности результатов обследований.
Проблема галлюцинаций и меры противодействия
Как отмечалось выше, галлюцинации остаются основным риском применения LLM в медицине. Уровень галлюцинаций базовых моделей (без RAG) при состязательном тестировании доходит до 50—82,7% [13]. Использование RAG-архитектуры резко снижает этот показатель: до 5,8% для механизма SELF-RAG и до 0% для RAG-дополненных моделей с верифицированными клиническими рекомендациями [15—17].
Для защиты от ошибок в ассистенте предусмотрено несколько уровней контроля. Прежде всего, база знаний формируется только из проверенных источников: актуальных клинических рекомендаций российских и международных профессиональных сообществ, данных из МИС конкретной пациентки, внутренних протоколов клиники. Механизм саморефлексивной генерации оценивает применимость извлеченной информации и степень обоснованности ответа, отказываясь от ответа при недостаточной уверенности в его корректности. Для критических сценариев предусмотрены детерминистические правила: при выявлении симптомов, входящих в перечень экстренных состояний, система использует жестко заданные алгоритмы вместо генеративной модели. Наконец, действует система регулярного мониторинга качества с протоколированием всех взаимодействий и периодическим аудитом ответов с привлечением врачей-экспертов.
Склонность ИИ-систем к гипердиагностике (направлению к врачу при отсутствии объективных показаний) создает обратный риск: чрезмерную нагрузку на клинику и формирование тревожности у пациенток. Мы полагаем, что на начальном этапе внедрения умеренная гипердиагностика предпочтительнее пропуска опасных состояний, однако без целенаправленной калибровки она способна подорвать доверие пользователей к системе. Согласно результатам L.M. Alomari и соавт. (2025), точность ИИ-сортировки в сравнении с «золотым стандартом» (консультант) составляет 42,8% при высоком уровне согласия с врачами приемного покоя (85,6%), что обусловлено именно тенденцией к переоценке тяжести состояния [32].
Наш опыт общения с практикующими врачами — акушерами-гинекологами показывает, что избыточные направления со стороны цифровых систем вызывают не меньшее раздражение врачей, чем пропущенные случаи. Поэтому калибровка порогов является, на наш взгляд, не второстепенной, а центральной задачей ИИ-ассистента, разрабатываемого на основе обзора литературы и собственного опыта.
Для минимизации этого риска в системе предусмотрены калибровка порогов направления по результатам пилотного исследования, мониторинг доли направленных обращений и их обоснованности, механизм обратной связи от врачей для корректировки алгоритмов оценки срочности.
Следует отметить, что ИИ-ассистент не предназначен для замены врача. Его роль определяется как информационное сопровождение и первичный фильтр, направляющий пациента к специалисту при наличии показаний. Система не ставит диагнозов, не назначает лечение, не интерпретирует результаты обследований в клиническом смысле (только предоставляет справочное пояснение) и не принимает решений, требующих врачебной экспертизы.
Это ограничение закреплено на уровне системных инструкций модели и в явной форме сообщается пользователю при каждом взаимодействии, затрагивающем клинически значимые вопросы.
Нормативная база Российской Федерации
Российская Федерация располагает развитой нормативной базой регулирования ИИ-систем в медицине. Серия национальных стандартов ГОСТ Р 59921 устанавливает требования к жизненному циклу медицинского ИИ, включая программу и методику технических испытаний [33]. С 2026 г. вступают в силу требования по обязательной клинической валидации ИИ-систем, работающих с данными электронных медицинских карт, с использованием стандартизированных метрик (C-индекс, кривые калибровки) [34].
Особое значение имеет нормативное регулирование постмаркетингового надзора. Согласно требованиям Росздравнадзора, производители медицинских изделий с ИИ обязаны обеспечивать автоматическую передачу данных обо всех выявленных ошибках и качестве данных в информационную систему регулятора [35].
Согласно прогнозам, объем российского рынка ИИ в здравоохранении увеличится с 12 млрд рублей в 2024 г. до 78 млрд рублей к 2030 г., причем цифровые ассистенты рассматриваются как одно из приоритетных направлений [36]. Мы считаем целесообразным подчеркнуть, что рост рынка сам по себе не гарантирует качества решений; напротив, быстрое масштабирование без клинической валидации способно дискредитировать направление в целом.
Кодекс этики применения ИИ в здравоохранении, утвержденный Минздравом России, устанавливает ряд принципов, непосредственно значимых для разработки ИИ-ассистента: принцип ограниченной автономности ИИ (система поддерживает, но не заменяет решение врача); право пациента на отказ от автоматизированного решения; требование прозрачности и объяснимости (пациент информирован о том, что взаимодействует с ИИ-системой, а не с врачом); ответственность оператора за результаты использования системы [37].
Обработка персональных и медицинских данных пациентов осуществляется в соответствии с требованиями законодательства о персональных данных и врачебной тайне с получением информированного добровольного согласия и применением технических мер защиты [38—40].
Проведенный систематический анализ литературы позволяет нам сделать вывод, что технологии больших языковых моделей в сочетании с RAG-архитектурой, вероятно, достигли уровня зрелости, позволяющего рассматривать их как основу клинически полезного ИИ-ассистента в перинатальной и педиатрической помощи. Корректность ответов LLM в акушерстве (73—89%) и педиатрии (82—93%) сопоставима с результатами врачей-ординаторов, а применение RAG с опорой на верифицированные клинические рекомендации позволяет снизить долю недостоверных ответов до 0—5,8%.
Потенциальным преимуществом предложенной архитектуры является интеграция с медицинской информационной системой клиники, обеспечивающая формирование виртуальной модели пациентки и переход от универсальных справочных ответов к персонализированным рекомендациям, учитывающим индивидуальный анамнез и актуальные клинические данные. Встроенная четырехуровневая система определения степени срочности может реализовывать принцип консервативной сортировки: при неопределенности система направляет пациентку к врачу, что согласуется с данными литературы о предпочтительности умеренной гипердиагностики перед риском пропуска опасных состояний. Вместе с тем избыточные направления способны подорвать доверие и пользователей, и клиницистов, поэтому калибровка порогов сортировки является одной из центральных задач пилотного этапа.
Представленный обзор литературы и собственные данные закладывают теоретическую основу для последующей клинической апробации [41]. Отдельного внимания требует языковая адаптация. Большинство рассмотренных исследований точности LLM выполнены на англоязычном материале, а зависимость качества ответов от языка запроса, показанная авторами, делает самостоятельную русскоязычную валидацию обязательным условием внедрения.
Нормативная среда Российской Федерации — серия стандартов ГОСТ Р 59921 [34, 35], требования Росздравнадзора к постмаркетинговому надзору [36] и Кодекс этики применения ИИ [38] в здравоохранении — формирует правовую основу для создания подобных систем, однако вопросы классификации ИИ-ассистента как медицинского изделия требуют дополнительной проработки.
Внедрение подобных цифровых решений может иметь потенциал не только для совершенствования персонализированного сопровождения пациенток, но и для формирования новых возможностей мониторинга показателей здоровья матери и ребенка. Накопление структурированных данных о динамике состояния пациенток, особенностях течения беременности и послеродового периода, а также о параметрах раннего развития детей может способствовать повышению обоснованности управленческих решений в системе здравоохранения.
Кроме того, использование ИИ-ассистента как инструмента непрерывной коммуникации между пациентом и медицинской организацией способно повысить доступность своевременной медицинской информации и оптимизировать качество медицинской помощи. В перспективе это может стать важным элементом цифровой трансформации перинатальной службы и повышения качества медицинского сопровождения на всех этапах наблюдения.
Авторы заявляют об отсутствии конфликта интересов.
Литература / References:
Подтверждение e-mail
На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.
Подтверждение e-mail
Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.