Personalized AI assistant for mother and child based on intelligent dialogue systems with integration into the medical information system (review)

Adamyan L.V.; Plavunov I.N.; Konysheva O.V.

doi:https://doi.org/10.17116/repro2026320216

Введение

Перинатальный и неонатальный периоды характеризуются наиболее интенсивным взаимодействием семьи с системой здравоохранения. На протяжении 9 мес беременности и последующих 5 лет детства число плановых визитов к врачу составляет в среднем 15—20. Однако между этими визитами у родителей, особенно при рождении первого ребенка, возникает широкий спектр вопросов, связанных с самочувствием во время беременности, состоянием новорожденного, интерпретацией результатов обследований и особенностями послеродового восстановления и др.

Зачастую за неимением рекомендаций о том, куда обращаться, и объективных источников медицинской информации родители могут быть в поисках ответов на те или иные повседневные вопросы и пользоваться поисковыми системами, форумами и социальными сетями, где рискуют столкнуться с устаревшими или недостаточно обоснованными рекомендациями. Следствием этого становится либо неоправданная тревожность с избыточными обращениями в медицинские учреждения, либо, напротив, недооценка серьезных симптомов и запоздалое обращение за помощью. При этом существующие мобильные приложения для беременных могут не соответствовать уровню клинической обоснованности контента [1] и не быть интегрированными с медицинскими информационными системами (МИС) клиник, что лишает их возможности учитывать индивидуальные особенности пациентки [2, 3].

Таким образом, дефицит квалифицированной коммуникации между визитами к врачу представляет собой не только информационную, но и клиническую проблему. Одновременно с этим стремительное развитие больших языковых моделей (Large Language Models (LLM)) и технологии генерации с дополненным поиском (Retrieval-Augmented Generation (RAG)) создает предпосылки для принципиально иного подхода к сопровождению семьи. Современные LLM демонстрируют клинически значимую точность ответов в акушерстве и педиатрии, а применение RAG-архитектуры может существенно снижать риск генерации недостоверной информации. Интеграция подобной системы с МИС клиники способна трансформировать обобщенный справочный инструмент в консультанта, учитывающего срок беременности, результаты обследований, возраст ребенка и историю обращений конкретной пациентки.

Цель обзора — обосновать применение ИИ-ассистента на базе RAG-архитектуры, связанного с МИС клиники, для непрерывного сопровождения матери и ребенка в перинатальном и раннем педиатрическом периоде.

В данном обзоре литературы последовательно рассматриваются следующие разделы:

1. Клиническая потребность в ИИ-ассистенте и возможные ограничения существующих инструментов на основе искусственного интеллекта (ИИ).

2. Доказательная база применимости LLM и RAG в профильных клинических областях.

3. Архитектура предлагаемого решения, включающая виртуальную модель пациента, систему определения степени срочности и механизм формирования сводок для врача.

4. Вопросы безопасности и границы компетенции системы.

5. Регуляторные и этические рамки внедрения в условиях Российской Федерации.

Материал и методы

Поиск литературы проведен в электронных базах данных PubMed, Google Scholar, Cochrane Library и eLibrary с использованием следующих ключевых слов и их сочетаний на русском и английском языках: «большие языковые модели», «LLM», «акушерство», «педиатрия», «RAG», «retrieval-augmented generation», «чат-бот», «медицинский ассистент», «вируальная модель пациента», «медицинская сортировка (триаж)», «perinatal AI», «pediatric chatbot», «medical information system integration». Поиск охватывал период с января 2020 г. по май 2025 г. Дополнительно проведен анализ списков литературы включенных публикаций для выявления релевантных источников, не обнаруженных при первичном поиске.

Критерии включения: оригинальные исследования, систематические обзоры и метаанализы, описывающие применение больших языковых моделей и/или RAG-архитектуры в акушерстве, гинекологии и педиатрии; работы, посвященные цифровым ассистентам и системам сортировки обращений в указанных областях; публикации на русском и английском языках.

Критерии исключения: тезисы конференций, представленные без полнотекстовой версии; редакционные комментарии; работы, не содержащие количественных данных о точности или клинической эффективности описываемых систем.

В результате поиска выявлено 154 публикации (PubMed — 82, Google Scholar — 54, Cochrane Library — 6, eLibrary — 12). После удаления дубликатов отобрано 118 записей. На этапе отбора по заголовкам и аннотациям для полнотекстового анализа выделено 52 работы. После полнотекстового анализа в итоговый обзор включена 31 научная публикация (оригинальные исследования, систематические обзоры и метаанализы), составившая доказательную базу настоящей статьи.

Помимо этого, при подготовке работы использованы 4 нормативных документа Российской Федерации (национальные стандарты ГОСТ Р 59921.2-2021 и ГОСТ Р 71672-2024, приказ Росздравнадзора №4472 от 21.07.2025, Кодекс этики применения искусственного интеллекта в здравоохранении), 3 информационно-аналитических источника и 2 описания коммерческих клинических систем, использованных в качестве примеров существующих решений. Общее число цитируемых источников составило 40.

Актуальность проблемы

Информационные потребности пациенток между консультациями специалистов

Традиционная модель медицинского наблюдения матери и ребенка предполагает периодические визиты к врачу с интервалом от двух недель до нескольких месяцев. В межвизитный период родители могут быть как лишены доступа к квалифицированной информационной поддержке, так и ограничены неформальными каналами — поисковыми системами, тематическими форумами и советами окружения. В свою очередь, врач также может не располагать данными о динамике состояния в промежутках между приемами (симптомы, поводы для беспокойства, вопросы, которые оставались неразрешенными, и др.), что стратегически важно, поскольку теряется преемственность между медицинскими специалистами и пациентами (на примере ситуации, связанной с пандемией COVID-19).

Наиболее остро данная проблема проявляется у первородящих женщин, не имеющих собственного опыта дифференцировки нормы и патологии. Типичные запросы, возникающие в межвизитном периоде, охватывают широкий спектр ситуаций: интерпретацию болевых ощущений и изменений самочувствия при беременности, оценку соответствия развития ребенка возрастным нормативам, допустимость применения тех или иных продуктов и лекарственных средств, тактику действий при повышении температуры тела у младенца. Каждый из этих вопросов потенциально значим для безопасности матери или ребенка и требует точного, контекстно-зависимого ответа.

Качество цифровых инструментов

Анализ цифровых инструментов для мониторинга беременности и раннего детства выявляет существенное несоответствие между потребностями пользователей и функциональными возможностями доступных решений. Согласно систематическому обзору N. Lazarevic и соавт. (2023), в мобильных приложениях для беременных выявлен низкий уровень научной обоснованности контента: только незначительная доля приложений базируется на актуальных клинических протоколах, тогда как большинство предлагает генерализованную и зачастую недостоверную информацию. Кроме того, имеющиеся приложения функционируют изолированно от клинических данных пациентки: они не содержат информации о сроке гестации (за исключением введенной вручную пользователем), не имеют доступа к результатам лабораторных и инструментальных исследований и не учитывают индивидуальные факторы риска [1].

Сохраняется также разрыв между потребительскими мобильными приложениями и медицинскими информационными системами (МИС). Многие популярные приложения для беременных не поддерживают стандарты обмена медицинскими данными (в частности, HL7 FHIR), что усложняет возможность системной двусторонней передачи информации между пациенткой и клиникой. Систематический анализ M. Nissen и соавт. (2024), охвативший 35 наиболее распространенных англоязычных приложений для беременных, подтверждает, что все рассмотренные приложения носят зачастую коммерческий характер, при этом только 15 из них декларируют участие медицинских экспертов в разработке контента, а ссылки на научные источники и доказательную медицину в большинстве случаев отсутствуют [2].

Дополнительным ограничением выступает низкая приверженность пользователей: по данным A. Pratap и соавт. (2020), медиана удержания участников в 8 исследованиях варьировала от 2 до 26 дней (медиана по всем исследованиям 5,5 дня). Недостаточная клиническая ценность имеющихся решений обусловливает низкий уровень долгосрочного вовлечения, что, в свою очередь, ограничивает их потенциальную клиническую эффективность [4].

Модель постоянного ведения как клинический стандарт

Преемственность медицинской помощи (continuity of care) рассматривается международным медицинским сообществом в качестве важного фактора улучшения перинатальных исходов. В Кокрановском обзоре J. Sandall и соавт. (2024), охватившем 18 533 женщины, установлено, что модели непрерывного акушерского сопровождения ассоциированы со статистически значимым снижением частоты кесаревых сечений и повышением вероятности самопроизвольных вагинальных родов. Наблюдалось снижение риска потери плода до 24-й недели гестации (на 18%), однако авторы оценивают достоверность этих данных как очень низкую. Статистически значимого влияния на риск преждевременных родов не было [5].

Ключевым механизмом, обеспечивающим положительный эффект преемственности, выступает знание данных пациентки: ее анамнеза, предшествующих жалоб, динамики клинических показателей. Именно этот механизм может быть воспроизведен в цифровом формате посредством интеграции ИИ-ассистента с МИС клиники. Такая интеграция позволяет формировать персонализированный профиль каждой пациентки, по существу ее виртуальную модель, и предоставлять контекстно-зависимые рекомендации на протяжении всего периода наблюдения.

Технологическая база: большие языковые модели (LLM) и RAG в медицине

Точность больших языковых моделей (LLM) в акушерстве и педиатрии

В области акушерства и гинекологии C. Martinelli и соавт. (2025) в кросс-секционном исследовании PERFORM сопоставили производительность восьми LLM и 24 врачей-ординаторов на 60 стандартизированных клинических сценариях. Лучшие модели — ChatGPT-o1-preview, GPT-4o и Claude Sonnet 3.5 — статистически значимо превосходили ординаторов младших лет обучения (p<0,001), при этом результаты ординаторов демонстрировали систематический рост от 44,7% на первом году до 87,1% на пятом [6]. Сходные результаты получены K.J. Eoh и соавт. (2024): на 116 вопросах ординаторских экзаменов по акушерству и гинекологии (из 170 за 2020—2023 гг., за вычетом вопросов с изображениями) средняя корректность ответов GPT-4 составила 79,31%, что статистически значимо не отличалось от результатов ординаторов [7]. F. Ługowski и соавт. (2025) при оценке ChatGPT-3.5 и ChatGPT-4 на 352 вопросах польских сертификационных экзаменов по акушерству и гинекологии получили для ChatGPT-4 точность от 76,5% до 89,6% в зависимости от сессии и языка [8].

В педиатрии Q. Wei и соавт. (2023) оценили точность ChatGPT (GPT-4) на 4160 клинических вопросах, охватывающих 104 педиатрических состояния. Общая точность достигла 82,2% (95% ДИ 81,0—83,4%), а для распространенных заболеваний доходила до 84,4% [9]. İ. Özer Aslan и соавт. (2025) при кросс-платформенном сравнении ИИ-чатботов в области грудного вскармливания выявили, что ChatGPT-4o Pro наиболее полно соответствовал рекомендациям Всемирной организации здравоохранения (ВОЗ), ACOG, CDC и NICE, набрав 38 из 40 возможных баллов по шкале соответствия клиническим руководствам (95% точности) на 20 стандартизированных вопросах [10]. Независимая оценка качества ответов чатботов, проведенная E.O. Kacer (2025), подтвердила высокую надежность генерируемой информации, но обнаружила проблему чрезмерной сложности языка ответов, для понимания которой необходим университетский уровень образования [11].

Применительно к вакцинации — еще одной ключевой теме для ИИ-ассистента — G. Deiana и соавт. (2023) установили, что точность ChatGPT при ответах на вопросы о мифах и заблуждениях ВОЗ о вакцинации достигает 85,4%. GPT-4 превосходил GPT-3.5 по корректности (+5,6%), ясности (+17,9%) и полноте (+9,3%) [12].

Следует подчеркнуть, что доля правильных ответов LLM заметно зависит от языка запроса. F. Ługowski и соавт. (2025) при сравнительном исследовании на польском и английском языках выявили статистически значимую разницу в пользу английского по всем тестам и версиям моделей (p<0,001 для каждого сравнения): для ChatGPT-3.5 разрыв составлял от 6 до 18,5 процентного пункта, для ChatGPT-4 — от 4,3 до 6,7 процентного пункта. Это подчеркивает необходимость тщательной локализации и валидации системы для русскоязычного контекста [8].

RAG-архитектура как механизм повышения точности и снижения галлюцинаций

Несмотря на высокую базовую верность ответов, LLM подвержены так называемым галлюцинациям — генерации правдоподобных, но фактически некорректных утверждений. В медицинском контексте это создает риск для безопасности пациентов. M. Omar и соавт. (2025) при анализе уязвимости LLM к атакам в клинических сценариях обнаружили, что при целенаправленном тестировании уровень галлюцинаций базовых моделей доходит до 50—82,7%. Без дополнительных механизмов контроля такие модели неприемлемы в клинической практике [13].

Архитектура RAG представляет собой подход, при котором информация генеративной модели дополняется извлеченной релевантной информацией из верифицированных источников: клинических протоколов, рекомендаций профессиональных сообществ, медицинской карты конкретного пациента. Это позволяет резко снизить частоту галлюцинаций. F. Neha и соавт. (2025) в систематическом обзоре подтвердили, что RAG повышает фактическую согласованность ответов LLM, эффективно применяется для диагностической поддержки, реферирования медицинских карт и медицинского консультирования и демонстрирует потенциал эффективного применения в клинической практике, в том числе для поддержки диагностических решений, структурирования медицинской документации, а также для информационного консультирования пациентов [14].

Количественные оценки эффективности RAG подтверждают эти выводы. В работе Y.H. Ke и соавт. (2025) на 10 языковых моделях точность GPT-4 с RAG на базе международных клинических рекомендаций составила 96,4%, статистически значимо превосходя врачей-клиницистов (86,6%, p=0,016), при полном отсутствии галлюцинаций [15]. K. Wołk (2025) при сравнении 12 вариантов RAG-архитектуры выявил, что механизм саморефлексивной генерации (SELF-RAG) снижает уровень галлюцинаций до 5,8%, а гибридные подходы — сочетание плотного и разреженного поиска с повторным ранжированием — дают наилучший баланс точности извлечения (Precision@5>0,68) и скорости ответа [16]. В работе A. Wada и соавт. (2025) применение RAG-дополненной локальной модели в радиологическом контексте привело к полному устранению галлюцинаций (снижение с 8% до 0%) при одновременном улучшении клинической точности и качества коммуникации [17].

S. Xu и соавт. (2025), разработавшие архитектуру MEGA-RAG с множественными источниками доказательств для верификации ответов, добились снижения галлюцинаций более чем на 40% по сравнению с базовыми моделями. Совокупность приведенных данных позволяет утверждать, что RAG является необходимым компонентом для безопасного использования LLM в клинической практике [18].

Языковая зависимость и задачи локализации

Зависимость точности LLM от языка запроса создает серьезный вызов для применения ИИ-ассистента на российском рынке. Прямой перенос англоязычных результатов в русскоязычную среду некорректен, и необходима самостоятельная валидация [8, 9]. Мы рассматриваем языковой барьер, а не технологические ограничения моделей как таковых как потенциально главное препятствие при адаптации зарубежного опыта.

Для решения этой проблемы в архитектуре описываемой системы предусмотрены следующие механизмы: формирование русскоязычной базы знаний RAG с опорой на актуальные российские клинические рекомендации и международные протоколы в авторизованном переводе; адаптация системных промптов для генерации ответов на доступном, не требующем специальной подготовки языке; независимая валидация точности на корпусе типичных вопросов пациенток на русском языке с привлечением экспертов-клиницистов. Кроме того, существенным фактором может быть использование отечественной LLM, обученной на широком корпусе русскоязычных текстов (GigaChat).

Общая концепция ИИ-ассистента (на основе обзора литературы и собственных предложений)

ИИ-ассистент — интеллектуальная диалоговая система, функционирующая в приложении клиники и (или) в популярных мессенджерах. Она предназначена для круглосуточного информационного сопровождения пациентки с момента планирования беременности (включая программы вспомогательных репродуктивных технологий) до достижения ребенком возраста 5 лет.

Отличие данной модели ассистента от существующих решений заключается в сочетании следующих характеристик: высокой точности ответов за счет современных LLM с RAG-архитектурой; персонализации через интеграцию с МИС клиники (виртуальная модель пациента); встроенной системы определения степени срочности, направляющей пациента к врачу при выявлении показаний и выполнении на русском языке. Это способствует повышению доступности для пациентов и практического здравоохранения в целом.

Тематический охват ассистента включает вопросы питания, симптоматики и самочувствия, результатов обследований, развития плода и ребенка, подготовки к родам, грудного вскармливания и введения прикорма, норм сна, психомоторного и речевого развития, вакцинации и профилактики.

Виртуальная модель пациента: интеграция с МИС

Центральным элементом персонализации выступает концепция виртуальной модели пациента. Речь идет о динамическом виртуальном профиле, который объединяет клинические данные из МИС клиники и историю взаимодействий в чате. V. Calcaterra и соавт. (2023), описавшие эту концепцию применительно к диаде «мать — плод», подчеркивают значение сбора мультимодальных данных для перехода от реактивного лечения к упреждающему прогнозированию осложнений [19].

Применительно к рассматриваемому ассистенту виртуальная модель включает следующие компоненты данных.

Из МИС клиники: срок беременности и предполагаемая дата родов; результаты лабораторных исследований (общий анализ крови, биохимия, гормональный профиль, скрининги); результаты инструментальных исследований (ультразвуковое исследование); диагнозы и факторы риска; назначенная терапия; возраст и антропометрические данные ребенка; календарь прививок и его выполнение.

Из истории чата: предыдущие вопросы и жалобы пациентки; динамика обращений (нарастающая частота вопросов по определенной теме); неразрешенные проблемы.

Благодаря интеграции с МИС ассистент может формировать ответы с учетом индивидуального контекста. Например, на вопрос о боли в пояснице система учитывает текущий срок беременности и наличие факторов риска; на вопрос о нормах развития — точный возраст ребенка и предшествующие показатели. По данным V. Kuwar и соавт. (2026), персонализация с использованием данных электронных медицинских карт статистически значимо повышает удовлетворенность пациентов, уровень вовлеченности и доверия к ИИ-системе [20].

J.N. Rivera Rivera (2024) описал реализацию послеродового чатбота в системе здравоохранения, где адаптация контента на основании данных медицинской карты (тип родов, практика грудного вскармливания) повышала соответствие предоставляемой информации потребностям пациенток [21]. Этот опыт подтверждает жизнеспособность подхода, положенного в основу нашей концепции.

С 2024 г. в Российской Федерации внедряются цифровые медицинские профили, объединяющие данные электронных медицинских карт и результаты обследований, что формирует нормативную и технологическую инфраструктуру для подобной интеграции [22].

Система определения степени срочности обращения

Ключевым компонентом безопасности является система определения степени срочности, устанавливающая, в какой ситуации вопрос пациентки может быть решен ассистентом самостоятельно, в каком случае следует рекомендовать наблюдение, а в какой ситуации необходимо немедленное направление к врачу или вызов скорой медицинской помощи.

Согласно систематическому обзору M. Kopka и соавт. (2025), охватившему 19 исследований, LLM обеспечивают умеренную, но стабильную точность при сортировке обращений по степени тяжести (57,8—76,0%), превосходя обычных пользователей (47,3—62,4%) [23]. V. Liu и соавт. (2024) установили, что уровень безопасности клинически валидированных систем с маркировкой медицинского устройства достигает 97,6%: при точности совпадения 53,7% подавляющее большинство отклонений приходится на консервативную сторону (направление к врачу при отсутствии строгих показаний), а не на пропуск опасных состояний [24].

В области педиатрии E. Aygun и соавт. (2026) в проспективном исследовании зафиксировали чувствительность GPT-4o 82,9% при обнаружении критических состояний у детей — заметно выше, чем у среднего медицинского персонала (37,2%) [25]. Вместе с тем, по данным H. Brown (2025), ИИ правильно идентифицирует все экстренные случаи (100% чувствительность для неотложных состояний), однако склонен к гипердиагностике — перенаправлению неэкстренных случаев в неотложную помощь [26].

Выбор четырехуровневой модели обусловлен, с одной стороны, клинической практикой триажа в педиатрии, а с другой — необходимостью минимизировать количество уровней для упрощения логики принятия решений. Мы намеренно отказались от дробных шкал (например, пятиуровневой, как в системе Infermedica), поскольку в контексте информационного ассистента, а не диагностической системы избыточная детализация увеличивает риск ошибочной классификации.

С учетом приведенных нами данных для ассистента выбрана следующая модель:

Уровень 1 — самостоятельный ответ: типовые вопросы о питании, допустимых продуктах, нормах развития, подготовке к процедурам. Ассистент предоставляет информационный ответ с опорой на проверенную экспертами базу знаний RAG.

Уровень 2 — ответ с рекомендацией наблюдения: вопросы о симптомах без признаков экстренности. Ассистент предоставляет информацию и рекомендует наблюдение с описанием критериев для обращения к врачу.

Уровень 3 — рекомендация планового обращения: наличие тревожных, но не экстренных признаков или повторяющиеся жалобы по одной теме. Ассистент предлагает записаться на прием к врачу.

Уровень 4 — немедленное направление: обнаружение симптомов, требующих экстренной медицинской помощи (кровотечение, резкая боль, высокая температура у младенца первых месяцев жизни, признаки нарушения дыхания). Ассистент настоятельно рекомендует немедленное обращение к врачу или вызов скорой помощи.

Модель реализует принцип «консервативной сортировки»: при неопределенности система скорее направит пациентку к врачу, чем пропустит потенциально опасное состояние. Такой подход соответствует мнению экспертного сообщества о предпочтительности умеренной гипердиагностики перед риском недодиагностики в контексте цифровой оценки срочности [23, 24].

Для повышения надежности применяется гибридный подход: генеративная модель (LLM) дополняется детерминистическими правилами, составленными по валидированным клиническим протоколам. Протоколы педиатрического телефонного триажа Бартона Шмитта, используемые в 95% медицинских колл-центров США и Канады и основанные на рекомендациях Американской академии педиатрии, служат примером такой доказательной базы правил [27]. Коммерческие диагностические системы, например вероятностные модели с поддержкой более 1000 симптомов и состояний и пятиуровневой шкалой сортировки, показывают возможность сочетания алгоритмических правил и машинного обучения [28].

Резюме для медицинских специалистов

При направлении на уровни 3 и 4 ассистент формирует структурированное резюме для врача. Это решает распространенную проблему: при стандартной записи на прием врач не располагает информацией о том, что именно беспокоило пациентку и какова динамика ее состояния. Резюме включает: идентификационные данные пациентки и ребенка; текущую жалобу; контекст из чата за предшествующий период (предыдущие вопросы, отмеченные симптомы, динамика); рекомендации, предоставленные ассистентом; причину направления.

Такой подход превращает каждое обращение к ИИ-ассистенту в дополнительный источник клинической информации, расширяя представление врача о состоянии пациентки за пределы данных, собираемых в ходе планового визита.

Дополнительные функции: напоминания, вакцинация, нутрициология

Помимо консультативной функции ИИ-ассистент может выполнять роль координатора медицинского обслуживания.

Вакцинация. Цифровые ассистенты с автоматизированным планированием и напоминаниями способны повышать уровень завершенности курса вакцинации у детей. Так, B. Baublitz и соавт. (2023) показывают, что в выбранных для исследования клиниках 57% детей в возрасте от 19 до 23 мес пропустили одну или более прививку и только 28% из них были записаны на последующий визит. Интеграция с МИС дает ассистенту возможность отслеживать фактическое выполнение прививочного календаря и заблаговременно напоминать о предстоящих вакцинациях [29].

Нутрициологическая поддержка. Как показали M. Haimi и соавт. (2025), дистанционное нутрициологическое ведение в педиатрии обеспечивает клинические результаты, сопоставимые с очными визитами, при ощутимом снижении логистической нагрузки на семью. ИИ-ассистент может предоставлять рекомендации по введению прикорма, режиму питания и допустимым продуктам, исходя из возраста ребенка и наличия аллергии [30].

Мониторинг развития. По данным M. Rodriguez-Marin и соавт. (2025), точность алгоритмов машинного обучения в диагностике нарушений физического развития у детей составляет 94,65% при чувствительности 91,03%. На основании этих данных ассистент способен выявлять отклонения от нормативных показателей роста и развития по данным из МИС и своевременно рекомендовать обращение к специалисту [31].

Запись на прием, планирование и организация визитов. Ассистент поддерживает запись, перенос и отмену визитов через интеграцию с системой расписания клиники.

Отправка результатов анализов. Автоматическое уведомление о готовности результатов обследований.

Безопасность и ограничения

Проблема галлюцинаций и меры противодействия

Как отмечалось выше, галлюцинации остаются основным риском применения LLM в медицине. Уровень галлюцинаций базовых моделей (без RAG) при состязательном тестировании доходит до 50—82,7% [13]. Использование RAG-архитектуры резко снижает этот показатель: до 5,8% для механизма SELF-RAG и до 0% для RAG-дополненных моделей с верифицированными клиническими рекомендациями [15—17].

Для защиты от ошибок в ассистенте предусмотрено несколько уровней контроля. Прежде всего, база знаний формируется только из проверенных источников: актуальных клинических рекомендаций российских и международных профессиональных сообществ, данных из МИС конкретной пациентки, внутренних протоколов клиники. Механизм саморефлексивной генерации оценивает применимость извлеченной информации и степень обоснованности ответа, отказываясь от ответа при недостаточной уверенности в его корректности. Для критических сценариев предусмотрены детерминистические правила: при выявлении симптомов, входящих в перечень экстренных состояний, система использует жестко заданные алгоритмы вместо генеративной модели. Наконец, действует система регулярного мониторинга качества с протоколированием всех взаимодействий и периодическим аудитом ответов с привлечением врачей-экспертов.

Риск гипердиагностики

Склонность ИИ-систем к гипердиагностике (направлению к врачу при отсутствии объективных показаний) создает обратный риск: чрезмерную нагрузку на клинику и формирование тревожности у пациенток. Мы полагаем, что на начальном этапе внедрения умеренная гипердиагностика предпочтительнее пропуска опасных состояний, однако без целенаправленной калибровки она способна подорвать доверие пользователей к системе. Согласно результатам L.M. Alomari и соавт. (2025), точность ИИ-сортировки в сравнении с «золотым стандартом» (консультант) составляет 42,8% при высоком уровне согласия с врачами приемного покоя (85,6%), что обусловлено именно тенденцией к переоценке тяжести состояния [32].

Наш опыт общения с практикующими врачами — акушерами-гинекологами показывает, что избыточные направления со стороны цифровых систем вызывают не меньшее раздражение врачей, чем пропущенные случаи. Поэтому калибровка порогов является, на наш взгляд, не второстепенной, а центральной задачей ИИ-ассистента, разрабатываемого на основе обзора литературы и собственного опыта.

Для минимизации этого риска в системе предусмотрены калибровка порогов направления по результатам пилотного исследования, мониторинг доли направленных обращений и их обоснованности, механизм обратной связи от врачей для корректировки алгоритмов оценки срочности.

Границы компетенции системы

Следует отметить, что ИИ-ассистент не предназначен для замены врача. Его роль определяется как информационное сопровождение и первичный фильтр, направляющий пациента к специалисту при наличии показаний. Система не ставит диагнозов, не назначает лечение, не интерпретирует результаты обследований в клиническом смысле (только предоставляет справочное пояснение) и не принимает решений, требующих врачебной экспертизы.

Это ограничение закреплено на уровне системных инструкций модели и в явной форме сообщается пользователю при каждом взаимодействии, затрагивающем клинически значимые вопросы.

Регуляторные требования и этические принципы

Нормативная база Российской Федерации

Российская Федерация располагает развитой нормативной базой регулирования ИИ-систем в медицине. Серия национальных стандартов ГОСТ Р 59921 устанавливает требования к жизненному циклу медицинского ИИ, включая программу и методику технических испытаний [33]. С 2026 г. вступают в силу требования по обязательной клинической валидации ИИ-систем, работающих с данными электронных медицинских карт, с использованием стандартизированных метрик (C-индекс, кривые калибровки) [34].

Особое значение имеет нормативное регулирование постмаркетингового надзора. Согласно требованиям Росздравнадзора, производители медицинских изделий с ИИ обязаны обеспечивать автоматическую передачу данных обо всех выявленных ошибках и качестве данных в информационную систему регулятора [35].

Согласно прогнозам, объем российского рынка ИИ в здравоохранении увеличится с 12 млрд рублей в 2024 г. до 78 млрд рублей к 2030 г., причем цифровые ассистенты рассматриваются как одно из приоритетных направлений [36]. Мы считаем целесообразным подчеркнуть, что рост рынка сам по себе не гарантирует качества решений; напротив, быстрое масштабирование без клинической валидации способно дискредитировать направление в целом.

Этические принципы

Кодекс этики применения ИИ в здравоохранении, утвержденный Минздравом России, устанавливает ряд принципов, непосредственно значимых для разработки ИИ-ассистента: принцип ограниченной автономности ИИ (система поддерживает, но не заменяет решение врача); право пациента на отказ от автоматизированного решения; требование прозрачности и объяснимости (пациент информирован о том, что взаимодействует с ИИ-системой, а не с врачом); ответственность оператора за результаты использования системы [37].

Обработка персональных и медицинских данных пациентов осуществляется в соответствии с требованиями законодательства о персональных данных и врачебной тайне с получением информированного добровольного согласия и применением технических мер защиты [38—40].

Заключение

Проведенный систематический анализ литературы позволяет нам сделать вывод, что технологии больших языковых моделей в сочетании с RAG-архитектурой, вероятно, достигли уровня зрелости, позволяющего рассматривать их как основу клинически полезного ИИ-ассистента в перинатальной и педиатрической помощи. Корректность ответов LLM в акушерстве (73—89%) и педиатрии (82—93%) сопоставима с результатами врачей-ординаторов, а применение RAG с опорой на верифицированные клинические рекомендации позволяет снизить долю недостоверных ответов до 0—5,8%.

Потенциальным преимуществом предложенной архитектуры является интеграция с медицинской информационной системой клиники, обеспечивающая формирование виртуальной модели пациентки и переход от универсальных справочных ответов к персонализированным рекомендациям, учитывающим индивидуальный анамнез и актуальные клинические данные. Встроенная четырехуровневая система определения степени срочности может реализовывать принцип консервативной сортировки: при неопределенности система направляет пациентку к врачу, что согласуется с данными литературы о предпочтительности умеренной гипердиагностики перед риском пропуска опасных состояний. Вместе с тем избыточные направления способны подорвать доверие и пользователей, и клиницистов, поэтому калибровка порогов сортировки является одной из центральных задач пилотного этапа.

Представленный обзор литературы и собственные данные закладывают теоретическую основу для последующей клинической апробации [41]. Отдельного внимания требует языковая адаптация. Большинство рассмотренных исследований точности LLM выполнены на англоязычном материале, а зависимость качества ответов от языка запроса, показанная авторами, делает самостоятельную русскоязычную валидацию обязательным условием внедрения.

Нормативная среда Российской Федерации — серия стандартов ГОСТ Р 59921 [34, 35], требования Росздравнадзора к постмаркетинговому надзору [36] и Кодекс этики применения ИИ [38] в здравоохранении — формирует правовую основу для создания подобных систем, однако вопросы классификации ИИ-ассистента как медицинского изделия требуют дополнительной проработки.

Внедрение подобных цифровых решений может иметь потенциал не только для совершенствования персонализированного сопровождения пациенток, но и для формирования новых возможностей мониторинга показателей здоровья матери и ребенка. Накопление структурированных данных о динамике состояния пациенток, особенностях течения беременности и послеродового периода, а также о параметрах раннего развития детей может способствовать повышению обоснованности управленческих решений в системе здравоохранения.

Кроме того, использование ИИ-ассистента как инструмента непрерывной коммуникации между пациентом и медицинской организацией способно повысить доступность своевременной медицинской информации и оптимизировать качество медицинской помощи. В перспективе это может стать важным элементом цифровой трансформации перинатальной службы и повышения качества медицинского сопровождения на всех этапах наблюдения.

Авторы заявляют об отсутствии конфликта интересов.

Литература / References:

Lazarevic N, Lecoq M, Bœhm C, Caillaud C. Pregnancy Apps for Self-Monitoring: Scoping Review of the Most Popular Global Apps Available in Australia. International Journal of Environmental Research and Public Health. 2023;20(2):1012. https://doi.org/10.3390/ijerph20021012
Nissen M, Huang SY, Jäger KM, Flaucher M, Titzmann A, Bleher H, Pontones CA, Huebner H, Danzberger N, Fasching PA, Eskofier BM, Leutheuser H. Smartphone pregnancy apps: systematic analysis of features, scientific guidance, commercialization, and user perception. BMC Pregnancy and Childbirth. 2024;24:782. https://doi.org/10.1186/s12884-024-06959-1
Готовность пациенток к цифровым инструментам мониторинга: результаты опроса. Блог Webiomed. 2024. Ссылка активна на 25.03.26. https://webiomed.ru/blog/standarty-dlia-sozdaniia-sistem-ii
Pratap A, Neto EC, Snyder P, Stepnowsky C, Elhadad N, Grant D, Mohebbi MH, Mooney S, Suver C, Wilbanks J, Mangravite L, Heagerty PJ, Areán P, Omberg L. Indicators of retention in remote digital health studies: a cross-study evaluation of 100,000 participants. NPJ Digital Medicine. 2020;3:21. https://doi.org/10.1038/s41746-020-0224-8
Sandall J, Fernandez Turienzo C, Devane D, Soltani H, Gillespie P, Gates S, Jones LV, Shennan AH, Rayment-Jones H. Midwife continuity of care models versus other models of care for childbearing women. The Cochrane Database of Systematic Reviews. 2024;4(4): CD004667. https://doi.org/10.1002/14651858.CD004667
Martinelli C, Giordano A, Carnevale V, Burk SR, Porto L, Vizzielli G, Ercoli A. The PERFORM Study: Artificial Intelligence Versus Human Residents in Cross-Sectional Obstetrics-Gynecology Scenarios Across Languages and Time Constraints. Mayo Clinic Proceedings. Digital Health. 2025;3(2):100206. https://doi.org/10.1016/j.mcpdig.2025.100206
Eoh KJ, Kwon GY, Lee EJ, Lee J, Lee I, Kim YT, Nam EJ. Efficacy of large language models and their potential in Obstetrics and Gynecology education. Obstetrics and Gynecology Science. 2024;67(6): 550-556. https://doi.org/10.5468/ogs.24211
Ługowski F, Babińska J, Ludwin A, Stanirowski PJ. Comparative analysis of ChatGPT 3.5 and ChatGPT 4 obstetric and gynecological knowledge. Scientific Reports.2025;15:21133. https://doi.org/10.1038/s41598-025-08424-1
Wei Q, Wang Y, Yao Z, Cui Y, Wei B, Li T, Xu X. Evaluation of ChatGPT’s performance in providing treatment recommendations for pediatric diseases. Pediatric Discovery. 2023;1(3):e42. https://doi.org/10.1002/pdi3.42
Özer Aslan İ, Aslan MT. Benchmarking AI Chatbots for Maternal Lactation Support: A Cross-Platform Evaluation of Quality, Readability, and Clinical Accuracy. Healthcare. 2025;13(14):1756. https://doi.org/10.3390/healthcare13141756
Kacer EO. Evaluating AI-based breastfeeding chatbots: quality, readability, and reliability analysis. PLoS One. 2025;20(3):e0319782. https://doi.org/10.1371/journal.pone.0319782
Deiana G, Dettori M, Arghittu A, Azara A, Gabutti G, Castiglia P. Artificial Intelligence and Public Health: Evaluating ChatGPT Responses to Vaccination Myths and Misconceptions. Vaccines. 2023; 11(7):1217. https://doi.org/10.3390/vaccines11071217
Omar M, Sorin V, Collins JD, Reich D. Large Language Models Are Highly Vulnerable to Adversarial Hallucination Attacks in Clinical Decision Support. medRxiv. 2025. https://doi.org/10.1101/2025.03.18.25324184
Neha F, Bhati D, Shukla DK. Retrieval-Augmented Generation (RAG) in Healthcare: A Comprehensive Review. AI. 2025;6(9):226. https://doi.org/10.3390/ai6090226
Ke YH, Jin L, Elangovan K, Abdullah HR, Liu N, Sia ATH, Soh CR, Tung JYM, Ong JCL, Kuo CF, Wu SC, Kovacheva VP, Ting DSW. Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness. NPJ Digital Medicine. 2025;8(1):187. https://doi.org/10.1038/s41746-025-01519-z
Wołk K. Evaluating Retrieval-Augmented Generation Variants for Clinical Decision Support: Hallucination Mitigation and Secure On-Premises Deployment. MDPI Electronics. 2025;14(21):4227. https://doi.org/10.3390/electronics14214227
Wada A, Tanaka Y, Nishizawa M, Yamamoto A, Akashi T, Hagiwara A, Hayakawa Y, Kikuta J, Shimoji K, Sano K, Kamagata K, Nakanishi A, Aoki S. Retrieval-augmented generation elevates local LLM quality in radiology contrast media consultation. NPJ Digital Medicine. 2025;8(1):395. https://doi.org/10.1038/s41746-025-01802-z
Xu S, Yan Z, Dai C, Wu F. MEGA-RAG: a retrieval-augmented generation framework with multi-evidence guided answer refinement. Frontiers in Public Health. 2025;13:1635381. https://doi.org/10.3389/fpubh.2025.1635381
Calcaterra V, Pagani V, Zuccotti G. Maternal and fetal health in the digital twin era. Frontiers in Pediatrics. 2023;11:1251427. https://doi.org/10.3389/fped.2023.1251427
Kuwar V, Kumari P, Uprety K, Gupta K. Chatbots in health care: AI-based personalization and EHR integration in patient-doctor communication. In: Intelligent Systems for Neurocognition and Human-Robot-Computer Interaction. 2026. https://doi.org/10.1016/B978-0-443-41660-6.00018-1
Rivera Rivera JN, Smith M, Mathur S, AuBuchon KE, Thomas AD, Arem H. Increasing Use of a Postpartum and Newborn Chatbot among Birthing Individuals and Caregivers: Development and Implementation Study. JMIR Pediatrics and Parenting. 2026;9: e81844. https://doi.org/10.2196/81844
ТАСС. Минздрав РФ внедрил 45 млн цифровых профилей пациентов. Дата сообщения ТАСС 14.02.2024. Ссылка активна на 01.04.26. https://tass.ru/obschestvo/19987195
Kopka M, von Kalckreuth N, Feufel MA. Accuracy of online symptom assessment applications, large language models, and laypeople for self-triage decisions. NPJ Digital Medicine. 2025;8:178. https://doi.org/10.1038/s41746-025-01566-6
Liu V, Kaila M, Koskela T. Triage Accuracy and the Safety of User-Initiated Symptom Assessment with an Electronic Symptom Checker in a Real-Life Setting: Instrument Validation Study. JMIR Human Factors. 2024;11:e55099. https://doi.org/10.2196/55099
Aygun E, Imdat A, Dalgic N. Should we leave paediatric emergency triage to artificial intelligence? A comparison of ChatGPT 4o and Grok 3. Frontiers in Pediatrics. 2026;14:1739217. https://doi.org/10.3389/fped.2026.1739217
Brown H. Evaluation of Artificial Intelligence for Patient Self-Triage: Comparison of General-Purpose AI Platforms With the NHS 111 Online Symptom Checker in the United Kingdom. Cureus. 2025; 17(11):e97834. https://doi.org/10.7759/cureus.97834
Self Care Decisions. Barton Schmitt Pediatric Protocols. 2024. Accessed April 01, 2026. https://www.selfcare.info/barton-schmitt-pediatric-protocols
Infermedica. Intelligent Diagnostic Engine. 2024. Accessed April 01, 2026. https://infermedica.com/inference-engine
Baublitz B, Brenda S, Devorah O, Rangel T. Customizing the Electronic Medical Record to Improve Pediatric Immunization Rates: A Brief Report. The Journal for Nurse Practitioners. 2023;19:104699. https://doi.org/10.1016/j.nurpra.2023.104699
Haimi M, Inchi L. Bridging Distance, Delivering Care: Pediatric Tele-Nutrition in the Digital Health Era — A Narrative Review. MDPI Healthcare. 2025;13(23):3107. https://doi.org/10.3390/healthcare13233107
Rodriguez-Marin M, Orozco-Alatorre LG. Advancing Pediatric Growth Assessment with Machine Learning: Overcoming Challenges in Early Diagnosis and Monitoring. Children (Basel). 2025; 12(3):317. https://doi.org/10.3390/children12030317
Alomari LM, Alshammari MM, Arbaeen AO, Alshehri RA, Almalki HS. Safety and accuracy of AI in triaging patients in the emergency department. International Journal of Emergency Medicine. 2025;18(1):243. https://doi.org/10.1186/s12245-025-01069-x
ГОСТ Р 59921.2-2021. Системы искусственного интеллекта в клинической медицине. Часть 2. Программа и методика технических испытаний. М.: Российский институт стандартизации; 2021. Ссылка активна на 01.04.26. https://files.stroyinf.ru/Data/768/76853.pdf
ГОСТ Р 71672-2024. Системы прогнозной аналитики на основе искусственного интеллекта в клинической медицине для анализа электронных медицинских карт. Методы испытаний. М.: Стандартинформ; 2024.
Приказ Федеральной службы по надзору в сфере здравоохранения от 21.07.2025 №4472 «Об утверждении Порядка автоматической передачи в автоматизированную информационную систему Федеральной службы по надзору в сфере здравоохранения информации об обрабатываемых данных, результатах действия программного обеспечения с применением технологий искусственного интеллекта, являющегося медицинским изделием, подлежащим обращению на территории Российской Федерации». Ссылка активна на 01.04.26. https://publication.pravo.gov.ru/document/0001202510140015
Шамардина Л. Российскому рынку ИИ в медицине прогнозируют рост до 80 млрд рублей. Медицинский вестник. 2025. Ссылка активна на 01.04.26. https://medvestnik.ru/content/news/Rossiiskomu-rynku-II-v-medicine-prognoziruut-rost-do-80-mlrd-rublei.html
Кодекс этики применения искусственного интеллекта в сфере охраны здоровья. Версия 2.1. Утв. Межведомственной рабочей группой при Минздраве России, протокол от 14.02.2025 №90/18-0/117. Ссылка активна на 01.04.26. https://www.garant.ru/products/ipo/prime/doc/411615533
Cevasco KE, Morrison Brown RE, Woldeselassie R, Kaplan S. Patient Engagement with Conversational Agents in Health Applications 2016—2022: A Systematic Review and Meta-Analysis. Journal of Medical Systems. 2024;48(1):40. https://doi.org/10.1007/s10916-024-02059-x
Yang R, Ning Y, Keppo E, Liu M, Hong C, Bitterman DS, Ong JCL, Ting DSW, Liu N. Retrieval-augmented generation for generative artificial intelligence in health care. npj Health Systems. 2025;2:2. https://doi.org/10.1038/s44401-024-00004-1
Cruz Rivera S, Liu X, Chan AW, Denniston AK, Calvert MJ; SPIRIT-AI and CONSORT-AI Working Group; SPIRIT-AI and CONSORT-AI Steering Group; SPIRIT-AI and CONSORT-AI Consensus Group. Guidelines for clinical trial protocols for interventions involving artificial intelligence: the SPIRIT-AI extension. Nature Medicine. 2020;26(9):1351-1363. https://doi.org/10.1038/s41591-020-1037-7
Адамян Л.В., Котова Е.Г., Пивазян Л.Г., Серёгина В.Ю., Аветисян Д.С., Маилова К.С., Осипова А.А. Искусственный интеллект в репродуктивной медицине и хирургии. Проблемы репродукции. 2025;31(4):10-25. https://doi.org/10.17116/repro20253104110