Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Решетников А.В.

ФГАОУ ВО «Первый Московский государственный медицинский университет имени И.М. Сеченова» Минздрава России (Сеченовский Университет)

Абаева О.П.

ФГАОУ ВО «Первый Московский государственный медицинский университет имени И.М. Сеченова» Минздрава России (Сеченовский Университет)

Бердутин В.А.

ФБУЗ «Приволжский окружной медицинский центр» Федерального медико-биологического агентства

Романова Т.Е.

ФГБОУ ВО «Приволжский исследовательский медицинский университет» Минздрава России

Романов С.В.

ФБУЗ «Приволжский окружной медицинский центр» Федерального медико-биологического агентства

Ковальчук А.В.

ФГБНУ «Федеральный исследовательский центр Институт прикладной физики им. А.В. Гапонова-Грехова Российской академии наук» Минобрнауки России

Наталия Сергеевна Голикова

ЧУОО ВО «Московский медицинский университет «РЕАВИЗ»

Присяжная Н.В.

ФГАОУ ВО «Первый Московский государственный медицинский университет имени И.М. Сеченова» Минздрава России (Сеченовский Университет)

Опыт создания нейросетевой диалоговой системы для ответов на письменные обращения населения в крупное федеральное учреждение здравоохранения

Авторы:

Решетников А.В., Абаева О.П., Бердутин В.А., Романова Т.Е., Романов С.В., Ковальчук А.В., Голикова Н.С., Присяжная Н.В.

Подробнее об авторах

Прочитано: 1139 раз


Как цитировать:

Решетников А.В., Абаева О.П., Бердутин В.А. и др. Опыт создания нейросетевой диалоговой системы для ответов на письменные обращения населения в крупное федеральное учреждение здравоохранения. Медицинские технологии. Оценка и выбор. 2025;47(2):48‑57.
Reshetnikov AV, Abaeva OP, Berdutin VA, et al. Experience in developing a neural network dialogue system for responding to written requests of the population to a large federal health care institution. Medical Technologies. Assessment and Choice. 2025;47(2):48‑57. (In Russ.)
https://doi.org/10.17116/medtech20254702148

Рекомендуем статьи по данной теме:

Введение

Важным индикатором удовлетворенности пациентов медицинской организацией наряду с результатами анкетирования являются письменные обращения граждан. Данные обращения содержат целый спектр вопросов, возникающих у пациентов и их родственников при получении медицинской помощи. Сюда относятся отзывы, жалобы, предложения, благодарности и прочее. Обработка и подготовка ответов на обращения, а тем более ведение письменного диалога — весьма трудоемкий процесс, отнимающий большое количество времени и ресурсов у ответственных за этот раздел работы специалистов. Например, в период пандемии новой коронавирусной инфекции (COVID-19) только в адрес Министерства здравоохранения Нижегородской области направлено письменных обращений: в 2019 г. — 4916, в 2020 г. — 14832, в 2021 г. — 18150 [1, 2].

Генерация текста — одна из ключевых задач, решаемых системами искусственного интеллекта (ИИ) и обработки естественного языка natural language processing (NLP), предназначенных для автоматизации процесса удаленной коммуникации пациентов медицинской организации с ее административными и/или диспетчерскими службами. На сегодняшний день наличие у отечественной медицинской организации эффективно работающей диалоговой системы для общения человека и машины является актуальной проблемой, для решения которой требуются далеко нетривиальные подходы. Очевидно, что совершенствование таковых систем идет рука об руку с прорывными достижениями в области ИИ. Коротко задачу диалоговой генерации можно сформулировать так: пациент отправляет некое сообщение, а нейросеть выдает соответствующий ответ на основе текущего сообщения и информации об истории переписки, конечно, если она имела место. Диалоговые системы обычно разделяются на два типа в зависимости от их функционального предназначения: 1) ориентированные на задачу, или системы с закрытыми доменами, и 2) не ориентированные на задачу, или системы открытого домена. Последние не рассматриваются в настоящей статье, так как не имеют конкретной цели и объекта обслуживания в лице пациентов, обращения или запросы которых отличаются выраженной спецификой и касаются частных случаев оказания качественной и доступной медицинской помощи.

Ранние версии диалоговых систем базировались на правилах и фреймах с заранее заданными ключевыми словами, с учетом которых формировалась структура ответного сообщения. Техническое понятие фрейм обозначает контекст выполнения кода или отдельную область памяти, где хранятся локальные переменные и данные функции. Современные же диалоговые системы главным образом основываются на генеративных моделях, формирующих свои ответы, непосредственно исходя из текстового обращения к нейросети [3, 4]. Подходы к генерации нейронного диалога можно условно разделить на несколько категорий, которые все же фундаментально связаны друг с другом. Метод, работающий по принципу «кодер-декодер», известен под именем «модель Seq2Seq» (sequence-to-sequence). Она достаточно проста и считается наименее эффективной генеративной моделью. Ее результатам не хватает разнообразия, актуальности, логичности и основательности. Более сложная модель HRED (Hierarchical Recurrent Encoder-Decoder), не имея ограничений в отношении обработки истории информационных сообщений, по-прежнему не способна улавливать контекст, поэтому ее ответы выглядят чересчур формальными. HRED — это иерархический кодер-декодер, пригодный для генерации многооборотных диалогов. Модель VAE (Variational Autoencoder) отличается способностью генерировать ответ путем выборки скрытых переменных из распределения Гаусса. К сожалению, и такой подход не гарантирует получение релевантных ответов на разнообразные вопросы от обслуживаемого медицинской организацией населения. Повышение целенаправленности и связности ответов при сохранении удовлетворительного уровня их информативности, а также решение задачи ведения многоходового диалога лучше всего обеспечивается моделью на основе RL (Reinforcement Learning). Эта модель тоже имеет свои недостатки: сложность решения реальных задач, высокая требовательность ко времени и ресурсам, проблемы с масштабированием и стандартизацией, чувствительность к начальным условиям, ограниченная переносимость между разными задачами [5, 6].

Рабочей гипотезой авторов данного исследования послужило предположение о возможности создания генеративной нейронной сети, способной автономно и персонализировано без участия оператора отвечать на поступающие текстовые обращения, исключительно силами инициативной группы, состоящей из врачей-специалистов, социологов медицины и ИТ-разработчиков, сформированной по заказу ФБУЗ «Приволжский окружной медицинский центр» ФМБА России. Достижение данной цели способствовало бы продвижению в жизнь принципа высококачественного, справедливого и инклюзивного медицинского обслуживания прикрепленного контингента. Таким образом, было бы достигнуто открытое, честное и уважительное общение в паре искусственный интеллект — пациент. Чтобы исчерпывающе удовлетворить ожидания всех интересантов, нейронная сеть должна суметь различить в ходе ведения текстового диалога истинные мотивы и потребности собеседника. Доверительная тональность коммуникации с использованием приемов иммерсионной цифровой психотерапии в перспективе могла бы служить цементирующим элементом экосистемы психологической устойчивости наиболее уязвимых слоев населения [7, 8].

В этой связи авторы остановили свой выбор на одной известной своей эффективностью предварительно обучаемой модели, которой является модель под названием BERT (Bidirectional Encoder Representations from Transformers). Она основывается на трансформной архитектуре, обучается на большом количестве неразмеченных текстов, приобретая способность по общему контексту предсказывать замаскированные языковые токены [9]. Кроме того, предварительно обучаемые модели типа BERT для русского языка имеют открытый исходный код [10].

Цель исследования — проанализировать результаты создания нейросетевой диалоговой системы для формирования релевантных ответов на письменные обращения населения в медицинскую организацию.

Материал и методы

Платформа машинного обучения с открытым исходным кодом BERT — недавно разработанная языковая модель, используемая для обработки естественного языка natural language processing (NLP). Платформа BERT разработана, чтобы помочь компьютеру понять значение неоднозначностей естественного языка, используя окружающий неразмеченный текст для установления контекста путем сопоставления противоположных семантических репрезентаций на разных уровнях. В результате предварительно обученная модель BERT может быть точно настроена с помощью всего лишь одного дополнительного выходного слоя для создания целевой платформы для решения широкого спектра задач, в том числе генерации текстового диалога с пациентами от лица медицинской организации. Преимущество модели состоит в том, что не требуются дополнительные затраты временных и финансовых ресурсов на модификацию ее архитектуры. Перечисленные достоинства BERT обусловили ее выбор авторами. Важно, что у специалистов в области ИИ BERT заслужила репутацию концептуально простой и эмпирически эффективной модели, демонстрируя впечатляющие результаты по 11 задачам обработки естественного языка, включая повышение показателей GLUE на 7,7%, точности MultiNLI на 4,6%, а теста SQuAD v.2 на 5,1 балла [11].

Для дообучения модели BERT на русифицированных медицинских данных применяли поэтапный подход. На первом этапе использовался датасет Yandex/geo-reviews (500 тыс. записей) для адаптации модели к бытовой лексике. На втором этапе модель оптимизировалась с помощью функций потерь (TripletLoss, ArccosMarginLoss), минимизирующих расстояния между эмбеддингами (embedding) одной категории и максимизирующих их для разных категорий. Эмбеддинг — это вектор в виде массива чисел, который получается после преобразования текста языковой моделью. На третьем этапе фиксированные эмбеддинги классифицировались методом SVM. Все этапы реализованы на Python с использованием библиотек Hugging Face Transformers и scikit-learn.

Команда разработчиков ФБУЗ ПОМЦ ФБМА России и ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Сеченовский Университет) провела оригинальное исследование по классификации запросов и отзывов граждан с использованием базы отзывов, состоящей из 2623 записей и разделенной на 18 категорий (табл. 1). Категории, количество примеров, в которых оказалось менее 20, изъяты по причине недостаточной репрезентативной емкости для дообучения нейронной сети. Таким образом, получен экспериментальный набор данных, состоящий из 12 классов. Для качественной оценки модели было решено разбить набор данных на обучающую и тестовую части в пропорции 8/2.

Таблица 1. Содержание категорий экспериментального набора

Категория

Количество сообщений

Жалобы на качество медицинского обслуживания

205

Отказ пациента от медицинской помощи

10

Отказ в оказании медицинской помощи

41

Грубое и невнимательное обращение с пациентом

65

Проблемы и нарушения при оформлении медицинской документации

287

Проблемы с доступностью медицинской помощи

271

Взимание денежных средств: платные услуги

27

Взимание денежных средств: передача денег персоналу

3

Разглашение врачебной тайны

27

Нарушения санитарно-гигиенических норм

24

Доступность медицинской помощи, нарушение доступной среды для маломобильных

6

Отсутствие QR-кода

0

Заявления, просьбы, рекомендации

41

Консультации

33

Благодарности

1553

Нарушение прав пациента (отказ родственникам в предоставлении информации)

0

Нарушение прав пациента (отказ родственникам в посещении или информации)

29

Нарушение этики и деонтологии

0

Для решения задачи классификации использована упомянутая выше модель BERT, обученная на русскоязычных текстах. Полная спецификация модели доступна в сети Интернет по ссылке DeepPavlov/rubert-base-cased Hugging Face. В ходе эксперимента по классификации задействовано внутреннее представление отзывов, называемое embeddings, токена CLS (Cumulative Layout Shift — совокупный сдвиг разметки) выходного набора модели. Это специальный символ, добавляемый перед каждым примером ввода. Токен CLS знаменует вероятность того, что одна фраза данного сообщения имеет некую смысловую связь с другой.

Модель дообучалась в 3 этапа. На первом этапе произведена адаптация модели ruBERT на домен текстов по открытой базе yandex/geo-reviews-dataset-2023 (github.com), содержащей 500 000 различных записей. На этом этапе модель училась правильно предсказывать значимое для контекста смысловое содержание, несмотря на отсутствовавшие в тексте слова, выставляя соответствующие итоговые рейтинги. Достигнутый результат использовали на следующих этапах.

На втором этапе модель тренировали определять embedding класса по сообщению таким образом, чтобы векторное описание разных сообщений одной категории было максимально близким, а разных категорий — максимально далеким. Для этого применялись функции потерь типа TripletLoss, ContrastiveLoss, а также вариант ArccosMarginLoss. На этом этапе изменялись веса модели ruBERT, и происходила точная настройка на целевой домен медицинских запросов и отзывов.

На заключительном этапе модель фиксировалась, и строились классификаторы по полученным на предыдущем этапе векторным представлениям embeddings. На этом этапе использовался ряд классических способов классификации, лучший результат получен для механизма опорных векторов Support Vector Machine (SVM). Это наиболее практичный способ классификации и регрессии, максимизирующий точность предсказаний модели без чрезмерной подгонки данных обучения. В частности, SVM подходит для анализа данных с очень большим числом предикторных полей, например, когда их количество превышает тысячу.

В качестве метрики качества выбран показатель f1-мера, который посчитан для каждой категории (табл. 2).

Таблица 2. Значение показателя по категориям

Категория

f1-мера

Благодарности

0,9889

Взимание денежных средств: передача денег персоналу

0,863

Взимание денежных средств: платные услуги

0,68

Грубое и невнимательное обращение с пациентом

0,7

Доступность медицинской помощи, нарушение доступной среды для маломобильных

0,5

Жалобы на качество медицинского обслуживания

0,3478

Заявления, просьбы, рекомендации

0,588

Консультации

0,30

Нарушение прав пациента (отказ родственникам в посещении или информации)

0,0

Нарушения санитарно-гигиенических норм

0,4

Отказ в оказании медицинской помощи

0,0

Отказ пациента от медицинской помощи

0,46

Проблемы и нарушения при оформлении медицинской документации

0,727

Проблемы с доступностью медицинской помощи

0,53

Разглашение врачебной тайны

0,0

Для программной реализации решения поставленной задачи использовались библиотеки языка программирования Python: transformers (для работы с BERT), scikit-learn (SVM, метрики).

Пациенты подписали форму информированного согласия на публикацию медицинской информации.

Результаты

В результате анализа, проведенного с помощью русифицированной модели ruBERT, установлено, что сообщения имеют сильное смысловое пересечение между категориями, в результате чего категории «Нарушение прав пациента», «Отказ в оказании медицинской помощи», «Разглашение врачебной тайны» не могут быть надежно разделены избранной моделью. Кроме того, сообщения могут содержать одновременно несколько обращений и/или отзывов, принадлежащих разным категориям (табл. 3).

Таблица 3. Примеры обезличенных отзывов, относящихся сразу к нескольким категориям (орфография сохранена)

Отзыв

Категория

Врачу-хирургу {ФИО_Х} не хватает времени разбираться в вопросах пациентов. С одной стороны, все понятно. В лечебном заведении она является единственным специалистом. Пациентов много, времени не хватает. Прием по записи не соблюдается. Запись с «15.00 до 16.00» означает, что пациента примут только ближе к 18.00. Пациенты с записью не попадают на свое время, возникает задержка. Поэтому, рекомендация администрации поликлиники, принять на работу еще одного специалиста. Свое мнение она считает приоритетным, пациента не слушает. В вопросах ДМС разбирается плохо. У своей страховой компании я впоследствии узнал, что хирург не может назначать на колоноскопию. Врач {ФИО_Х} меня на эту процедуру назначила. Дальнейшие последствия ее не интересовали. Может стоит проводить техучебу по вопросам ДМС. Получается, что пациент должен разбираться и в этих вопросах. Большое спасибо медсестре {ФИО_Х}. Она больше вникает в проблемы пациента.

1. Проблемы и нарушения при оформлении медицинской документации

2. Грубое и невнимательное обращение с пациентом

3. Благодарности

Добрый день. С каждым приемом удивляюсь хамству сотрудников. Начиная с регистратора и заканчивая врачами. Единственный человек, к которому можно обратиться, это ст. медсестра {ФИО_Х} Вот ей спасибо. Остальным нужно научиться этике и деонтологии.

1. Грубое и невнимательное обращение с пациентом

2. Благодарности

Хочу поблагодарить сотрудников скорой помощи {ФИО_Х} за оказанную помощь. Таких добрых людей редко встретишь в наше время, а особенно когда это выражается на деле. Мы с дочкой оказались в безвыходной ситуации, и нужно было срочно оказаться в больнице и быстрее оказать ей медицинскую помощь, была дочка в очень тяжелом состоянии. Объехав 3 больницы, куда нас принять отказались по разным причинам, например забита больница больными ковидом, или например вам в инфекционку мы не относимся никаким образом, или отделение Дерматологии не работает, хотя если человек в очень тяжелом состоянии любой врач в силах оказать первую помощь и найти место для очень тяжелобольного маленького 6-тилетнего человека, который уже на грани... Спустя 3 часа катания по городу {ФИО_Х}, после долгих звонков по другим больница, куда нас еще могут определить, но там тоже что-то не срослось, нашла выход из ситуации, вместе с ее главный врачем по скорой они не развели перед нами руками, а шли до последнего, возможно по головам. В итоге мы под наблюдением, благополучно лечимся и страшное позади. Побольше бы таких людей как {ФИО_Х}, заботливая, сильная и умная женщина, как сотрудник, так и человек в целом. Прошу не оставить без внимания ее действия.

1. Проблемы с доступностью медицинской помощи

2. Благодарности

Не оказывается лечение в полном объеме. Не предоставляется информация по лечению мужа супруге.

1. Жалобы на качество медицинского обслуживания

2. Нарушение прав пациента (отказ родственникам в посещении или информации)

Примечание. ДМС — добровольное медицинское страхование.

Когда запись содержит несколько похожих, но разнонаправленных по смыслу высказываний, то их многократные повторы приводят к феномену семантического коллапса, характеризующегося хаотичной интерпретацией одних и тех же лексем. Авторы также столкнулись с другими серьезными проблемами, а именно: грамматические неточности, сленговые обороты, грубые сематические смещения, соскальзывание с темы сообщения и прочее, вплоть до оскорбительного контента.

Для решения указанных проблем при обработке дискурса апробированы следующие подходы: наивный байесовский классификатор, логистическая регрессия, деревья решений, случайный лес, градиентный бустинг и метод опорных векторов. Однако наилучший результат получен благодаря использованию метода первых k ближайших соседей лучших категорий для классификации сообщения. В ходе эксперимента оценивалось качество среди лучших трех ответов модели. Ответы модели сравнивались с порогом 0,5 и в случае нескольких превышающих этот порог ответов, выбирались 3 лучших по f1-мера (табл. 4). Если среди этих ответов встречался целевой, то результат принимался как релевантный. Это позволило улучшить показатель f1-мера в самых запутанных случаях до 0,7.

Таблица 4. Выбор трех лучших ответов модели по f1-мера

Категория

f1-мера

Благодарности

0,9968

Взимание денежных средств: передача денег персоналу

0,9508

Взимание денежных средств: платные услуги

0,8780

Грубое и невнимательное обращение с пациентом

0,9412

Доступность медицинской помощи, нарушение доступной среды для маломобильных

0,6667

Жалобы на качество медицинского обслуживания

0,6250

Заявления, просьбы, рекомендации

0,6250

Консультации

1,0000

Нарушение прав пациента (отказ родственникам в посещении реанимации)

0,0

Нарушения санитарно-гигиенических норм

0,7143

Отказ в оказании медицинской помощи

0,0

Отказ пациента от медицинской помощи

0,7500

Проблемы и нарушения при оформлении медицинской документации

0,8000

Проблемы с доступностью медицинской помощи

0,6667

Разглашение врачебной тайны

0,0

На рис. 1 представлено сравнение результатов показателя f1-мера до и после использования метода первых k ближайших соседей. На рис. 2 представлена зависимость показателя f1-мера от количества поступивших в медицинскую организацию обращений пациентов и их представителей.

Рис. 1. Сравнение результатов показателя f1-мера до и после использования метода первых k ближайших соседей.

Рис. 2. Зависимость показателя f1-мера от количества обращений.

Обсуждение

Результаты исследования показали, что гипотеза о возможности полной автономии нейросетевой системы не подтвердилась. Модель BERT продемонстрировала низкую эффективность в классификации семантически пересекающихся категорий (например, «Нарушение прав пациента», f1-мера — 0,0) и обработке сообщений с эмоциональной окраской. Это объясняется ограниченной способностью модели анализировать контекст и игнорированием структурных зависимостей между предложениями. Полученные данные согласуются с работами, в которых отмечаются проблемы GPT-3 в генерации точных медицинских ответов из-за отсутствия верифицируемости [12]. В отличие от Seq2Seq, BERT обеспечивает лучшую семантическую связность, но уступает в гибкости RL-моделям при многозадачной обработке.

Известны разнообразные архитектуры глубокого обучения, такие как Seq2Seq, RNNSearch, генеративно-состязательные сети GAN (Generative adversarial nets), обучение с подкреплением и предварительно обученные языковые модели, которые можно использовать для генерации ответов, способных в теории удовлетворить весьма взыскательные требования отдельных индивидов [13]. Современные GPT-подобные модели, например, GPT-3, ChatGPT, демонстрируют высокую эффективность в генерации контекстно-зависимых ответов благодаря масштабному предобучению на разнородных данных. Однако их применение в медицинской сфере ограничено требованиями к точности и отсутствием гарантий корректности ответов. В отличие от BERT, такие системы часто генерируют правдоподобные, но неверифицируемые утверждения, что делает их менее пригодными для задач классификации обращений с юридической или этической ответственностью, что критически важно в сфере здравоохранения.

Что касается моделей на основе Seq2Seq, то они склонны давать чересчур общие и «пустые» ответы на поступающий запрос, а также «застревать» и бесконечно повторяться. Модели на основе обучения с подкреплением RL обеспечивают несколько большие разнообразие и контекстную зависимость переписки, поскольку используют для моделирования сразу две платформы Seq2Seq [14]. Наличие у RL специальных функций вознаграждения для оптимизации работы обеих платформ придает ей большую коммуникативную устойчивость, что усиливает интерактивность контента. К сожалению, качество исходящих формулировок остается нестабильным. Модели на основе GAN в задаче чат-бота превосходят модели Seq2Seq, но их показатели также далеки от совершенства из-за наличия узкого места, связанного с градиентным блоком дискретного текстового пространства. Тем не менее за последние годы использование языковых моделей предварительного обучения для решения множества проблем, связанных с NLP, включая задачу генерации текстовых ответов на запросы и обращения пациентов, можно считать мощным прорывным достижением в области ИИ, поскольку они производят семантические конструкции, которые более близки к естественному человеческому языку. При этом важно помнить, что их эффективность напрямую зависит от объема предварительного обучения и корректного выбора методов декодирования [15].

Очевидно, что избранная платформа ИИ, несмотря на применение всех доступных на момент исследования сил и средств, не позволяет решать весь комплекс поставленных задач, поскольку, согласно его результатам, модель BERT не может корректно устанавливать зависимости между предложениями. При обработке высказываний модель просто объединяет их в плоскую последовательность, а присущая объемной переписке информация о структуре уровня высказывания зачастую игнорируется. Кроме того, из-за встроенного механизма полного внимания BERT перманентно акцентируется на несущественных элементах сообщения, «тонет» в потоках избыточной информации, и поэтому плохо справляется выделением сути текста.

Тем не менее в литературе уже встречаются упоминания о новейших проектах сверточных нейронных сетей с расширенными графами реляционного внимания и плотными связями, которые используют преимущества в извлечении отношений между предложениями для улучшения понимания контекста в диалогах искусственный интеллект — пациент. В отличие от модели BERT такие нейросети могут естественным образом масштабироваться до значительно большего количества слоев, «не страдая» от снижения производительности и трудностей оптимизации [16].

Исследование с дообучением нейросети свидетельствует о существующей по настоящее время технологической ограниченности имеющихся диалоговых систем, которым трудно решать задачу по тонкой дифференцировке семантически сложных сообщений. Прежде всего это касается определения эмоциональной окраски отзывов пациентов о качестве и доступности медицинских помощи. Опция семантического анализа крайне необходима генеративной нейросети для формирования релевантной реакции на входящее обращение в медицинскую организацию. Диалоговая платформа с закрытым доменом должна быть гибкой, должна уметь принимать решения в интересах пациента и передавать управление опытному сотруднику, столкнувшись с пределом собственной компетентности [17, 18].

Необходимо отметить, что наше исследование имело ряд ограничений: 1) небольшой объем выборки (2623 записи) и исключение категорий с малым числом примеров; 2) отсутствие мультимодальных данных (анализировался только текст); 3) зависимость результатов от качества предобработки данных; 4) трудности в обработке грамматических ошибок, сленга и эмоционально окрашенных высказываний.

Результаты исследования убедительно свидетельствуют о существовании технологических ограничений, препятствующих полной автоматизации обработки обращений пациентов. Существующие нейросетевые модели, включая BERT, не обеспечивают достаточной точности для автономной обработки семантически сложных медицинских обращений [19]. Однако это именно конструктивный факт, потому что весь комплекс работ выполнен в полном объеме, корректно, последовательно и согласно плану. Кроме того, результаты полностью соответствовали пессимистическому сценарию, который мы никогда не сбрасывали со счетов, и который предусматривал все возможные технологические и ресурсные ограничения, особенно в области машинного сентимент-анализа текста.

Позитивный итог проведенного исследования — создание прототипа нейросетевой платформы, способной генерировать набор шаблонных ответов, семантическое содержание которых может быть приведено специалистом-оператором в полное соответствие входящему сообщению. По результатам работы в Роспатент подана заявка на полезную модель.

Представленный в настоящей работе эксперимент по дообучению генеративной диалоговой нейросети с закрытым доменом типа BERT с использованием русифицированных баз данных также продемонстрировал, что объем предварительной подготовки является важнейшим фактором для систем понимания естественного языка платформами ИИ с глубокой однонаправленной архитектурой. Однако, несмотря на то, что усиленное предварительное обучение языковой модели может существенно повысить ее эффективность, результаты исследования показали, что нежелательно ставить перед диалоговой системой слишком масштабные задачи при ограниченности вкладываемых в разработку ресурсов и изначально низком технологическом уровне доступных нейросетевых платформ. В этом случае достижение высоких показателей производительности ИИ вряд ли возможно. Тем не менее любая нейросетевая архитектура требует адекватных ей по структуре языковой модели, парадигмы обучения и аппаратного обеспечения. Каждый их перечисленных фактов является ключевым не только для успешного внедрения диалоговой системы в медицинской организации, но и для ее дальнейшего совершенствования. В целом же достигаемый благодаря ИИ прирост пропускной способности каналов обратной связи с пациентами приводит к увеличению коммуникационной транспарентности медицинской организации и более оперативному решению вопросов обеспечения населения качественной и доступной медицинской помощью [20].

Следует также отметить, что максимальная специализация языковой модели в ходе ее подготовки к эксплуатации в штатном режиме дает заметный прирост эффективности в долгосрочной перспективе за счет целенаправленно проводимой информационной сортировки, что доказывает ценность даже небольшого усилия по обогащению, изначально загружаемого в модель набора данных.

Заключение

Результаты исследования подтвердили, что полная автоматизация обработки обращений пациентов недостижима с использованием современных нейросетевых моделей, таких как BERT. Их ограниченная способность к семантической дифференциации и анализу эмоциональной окраски означает необходимость сохранения участия человека. Однако разработанный прототип системы демонстрирует потенциал в генерации шаблонных ответов, которые оператор может адаптировать к конкретному обращению. Ключевыми факторами эффективности таких систем остаются объем и качество предварительно обученных данных, что подчеркивает необходимость дальнейших исследований в области специализированных медицинских NLP-моделей.

Вклад авторов. Авторы декларируют соответствие своего авторства международным критериям ICMJE. Все авторы в равной степени участвовали в подготовке публикации: разработка концепции статьи, получение и анализ фактических данных, написание и редактирование текста статьи, проверка и утверждение текста статьи.

Авторы заявляют об отсутствии конфликта интересов.

Литература / References:

  1. Романова Т.Е., Абаева О.П., Присяжная Н.В., Романов С.В., Бердутин В.А. Взаимоотношения врачей и пациентов инфекционного госпиталя в периоды 1 и 2-й волн пандемии COVID-19. Терапевтический архив. 2024;96(1):42-44.  https://doi.org/10.26442/00403660.2024.01.202562
  2. Липатов К.С., Заречнова Н.В., Липатов Д.К. Формирование модели взаимоотношения в системе «врач-пациент» при лечении осложнений коронавирусной инфекции нового типа COVID-19. Главврач. 2020;(11):44-50.  https://doi.org/10.33920/med-03-2011-03
  3. Sun B, Li K. Neural Dialogue Generation Methods in Open Domain: A Survey. Natural Language Processing Research. 2021;1(3-4):56-70.  https://doi.org/10.2991/nlpr.d.210223.001
  4. Reshetnikov A, Berdutin V, Zaporozhtsev A, Romanov S, Abaeva O, Prisyazhnaya N, et al. Predictive algorithm for the regional spread of coronavirus infection across the Russian Federation. BMC Medical Informatics and Decision Making. 2023;23(1):48.  https://doi.org/10.1186/s12911-023-02135-1
  5. Dai Y, Li H, Tang C, Li Y, Sun J, Zhu X. Learning Low-Resource End-To-End Goal-Oriented Dialog for Fast and Reliable System Deployment. In: Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, Stroudsburg, PA, USA; 2020: 609-618.  https://doi.org/10.18653/v1/2020.acl-main.57
  6. Бердутин В.А. Робастное управление человеко-центрированной медицинской организацией. Главврач. 2020;(5):17-34.  https://doi.org/10.33920/med-03-2005-03
  7. Федонников А.С., Андриянова Е.А., Гришечкина Н.В., Норкин И.А. Возможности онлайн-коммуникации в управлении процессом реабилитации после эндопротезирования суставов. Здравоохранение Российской Федерации. 2022;66(1):34-40.  https://doi.org/10.47470/0044-197X-2022-66-1-34-40
  8. Романов С.В., Бердутин В.А., Запорожцев А.В., Абаева О.П., Романова Т.Е. Системный подход в медицинских организациях. Учебно-методическое пособие. М.: ФГБУ ГНЦ ФМБЦ им. А.И. Бурназяна ФМБА России; 2021.
  9. Devlin J, Chang MW, Lee K, Toutanova K. BERT: Pretraining of deep bidirectional transformers for language understanding. In: Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). Minneapolis, Minnesota. Association for Computational Linguistics. 2019: 4171-4186. https://doi.org/10.18653/v1/N19-1423
  10. Kuratov Y, Arkhipov M. Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language. arXiv. 2019;1905.07213. https://doi.org/10.48550/arXiv.1905.07213
  11. Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez AN, et al. Attention is all you need. arXiv. 2017;1706.03762. https://doi.org/10.48550/arXiv.1706.03762
  12. Smith DM, Gillett NP, Simpson I.R, Athanasiadis PJ, Baehr J, Bethke I, et al. Attribution of multi-annual to decadal changes in the climate system: The Large Ensemble Single Forcing Model Intercomparison Project (LESFMIP). Frontiers in Climate. 2022;4:955414. https://doi.org/10.3389/fclim.2022.955414
  13. Li Z, Maimaiti M, Sheng J, Ke Z, Silamu W, Wang Q, et al. An Empirical Study on Deep Neural Network Models for Chinese Dialogue Generation. Symmetry. 2020;12(11):1756. https://doi.org/10.3390/sym12111756
  14. Лапань М. Глубокое обучение с подкреплением. AlphaGo и другие технологии. ИД Питер; 2020.
  15. Li X, Li P, Bi W, Liu X., Lam W. Relevance-Promoting Language Model for Short-Text Conversation. arXiv. 2019:1911.11489. https://doi.org/10.48550/arXiv.1911.11489
  16. Zhao L, Xu W, Gao S, Guo J. Utilizing graph neural networks to improving dialogue-based relation extraction. Neurocomputing. 2021;456:299-311.  https://doi.org/10.1016/j.neucom.2021.05.082
  17. Русских Т.Н., Тинякова В.И., Кухарец Д.В. Семантический анализ отзывов пациентов для обеспечения поддержки принятия решений на рынке медицинских услуг. Креативная экономика. 2024;18(2):455-474.  https://doi.org/10.18334/ce.18.2.120366
  18. Присяжная Н.В., Садыкова М.Ф., Голикова Н.С., Борисова П.М. Высокотехнологичная медицинская помощь в практике российского здравоохранения. Медицинские технологии. Оценка и выбор. 2024;46(3):70-81.  https://doi.org/10.17116/medtech20244603170
  19. Малов Д.А. Глубокое обучение и анализ данных: практическое руководство. СПб: БХВ-Петербург; 2023.
  20. Черняков М.К. Системы искусственного интеллекта и машинное обучение: монография. Новосибирск: Изд-во НГТУ; 2024.

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail

Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.