Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Арзамасов К.М.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Васильев Ю.А.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Владзимирский А.В.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»;
ФГАОУ ВО «Первый Московский государственный медицинский университет им. И.М. Сеченова» Минздрава России (Сеченовский университет)

Омелянская О.В.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Бобровская Т.М.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Семенов С.С.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Четвериков С.Ф.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Кирпичев Ю.С.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Павлов Н.А.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Андрейченко А.Е.

ГБУЗ «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

Применение компьютерного зрения для профилактических исследований на примере маммографии

Авторы:

Арзамасов К.М., Васильев Ю.А., Владзимирский А.В., Омелянская О.В., Бобровская Т.М., Семенов С.С., Четвериков С.Ф., Кирпичев Ю.С., Павлов Н.А., Андрейченко А.Е.

Подробнее об авторах

Журнал: Профилактическая медицина. 2023;26(6): 117‑123

Просмотров: 971

Загрузок: 56


Как цитировать:

Арзамасов К.М., Васильев Ю.А., Владзимирский А.В., Омелянская О.В., Бобровская Т.М., Семенов С.С., Четвериков С.Ф., Кирпичев Ю.С., Павлов Н.А., Андрейченко А.Е. Применение компьютерного зрения для профилактических исследований на примере маммографии. Профилактическая медицина. 2023;26(6):117‑123.
Arzamasov KM, Vasilev YuA, Vladzymyrskyy AV, Omelyanskaya OV, Bobrovskaya TM, Semenov SS, Chetverikov SF, Kirpichev YuS, Pavlov NA, Andreychenko AE. The use of computer vision for the mammography preventive research. Russian Journal of Preventive Medicine. 2023;26(6):117‑123. (In Russ.)
https://doi.org/10.17116/profmed202326061117

Рекомендуем статьи по данной теме:
Ва­ли­да­ция рус­ско­языч­ной вер­сии Гос­пи­таль­ной шка­лы тре­во­ги и деп­рес­сии в об­щей по­пу­ля­ции. Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2023;(4):7-14
Воз­мож­нос­ти и ог­ра­ни­че­ния ис­поль­зо­ва­ния прог­рам­мных ин­фор­ма­ци­он­ных ус­тройств с ис­кусствен­ным ин­тел­лек­том для ди­аг­нос­ти­ки и ле­че­ния за­бо­ле­ва­ний. Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2023;(4):108-114
Циф­ро­вое раз­ви­тие эко­но­ми­ки здра­во­ох­ра­не­ния: от вы­яв­ле­ния тен­ден­ций — к пла­но­мер­но­му раз­ви­тию. Про­фи­лак­ти­чес­кая ме­ди­ци­на. 2023;(5):89-94
Ци­то­ло­ги­чес­кий ме­тод в ран­ней ди­аг­нос­ти­ке ра­ка шей­ки мат­ки: эво­лю­ция, прин­ци­пы, тех­но­ло­гии, пер­спек­ти­вы. Он­ко­ло­гия. Жур­нал им. П.А. Гер­це­на. 2023;(2):49-55
Тех­но­ло­гии ма­шин­но­го обу­че­ния в КТ-ди­аг­нос­ти­ке и клас­си­фи­ка­ции внут­ри­че­реп­ных кро­во­из­ли­яний. Жур­нал «Воп­ро­сы ней­ро­хи­рур­гии» име­ни Н.Н. Бур­ден­ко. 2023;(2):85-91
Ис­кусствен­ный ин­тел­лект в прог­но­зи­ро­ва­нии нас­туп­ле­ния бе­ре­мен­нос­ти. Рос­сий­ский вес­тник аку­ше­ра-ги­не­ко­ло­га. 2023;(2):83-87
Го­су­дарствен­ная ре­гис­тра­ция прог­рам­мно­го обес­пе­че­ния как ме­ди­цин­ско­го из­де­лия по пра­ви­лам Ев­ра­зий­ско­го эко­но­ми­чес­ко­го со­юза. Ме­ди­цин­ские тех­но­ло­гии. Оцен­ка и вы­бор. 2023;(2):32-49
Ха­рак­те­рис­ти­ка фа­го­ци­тар­но­го зве­на им­мун­ной сис­те­мы на ран­них ста­ди­ях ра­ка же­луд­ка. Он­ко­ло­гия. Жур­нал им. П.А. Гер­це­на. 2023;(4):30-34
Ис­поль­зо­ва­ние чат-бо­тов с при­ме­не­ни­ем ис­кусствен­но­го ин­тел­лек­та как эле­мен­та обу­че­ния при ра­бо­те с дер­ма­тос­ко­пи­чес­ки­ми изоб­ра­же­ни­ями. Кли­ни­чес­кая дер­ма­то­ло­гия и ве­не­ро­ло­гия. 2023;(4):447-453

Введение

На сегодняшний день рак молочной железы (РМЖ) — одно из самых распространенных, социально-значимых заболеваний во всем мире, в том числе и в России. В связи с этим задачи онкопрофилактики и раннего выявления РМЖ являются приоритетными в сфере здравоохранения нашей страны [1]. Для решения этих задач успешно применяются различные программы скрининга, позволяющие достичь и даже превысить национальные целевые показатели, например «Московский скрининг рака молочной железы» [2]. Для диагностики злокачественных новообразований (ЗНО) молочной железы в первую очередь используется рентгеновская маммография (ММГ), позволяющая выявлять патологический процесс на ранних стадиях, тем самым снизить смертность от онкологических заболеваний [3]. Однако ММГ нельзя считать совершенным методом по причине низкой диагностической точности [4]. С целью повышения метрик диагностической точности метода действующим законодательством Российской Федерации в сфере здравоохранения предусмотрен двойной просмотр результатов, так называемое «двойное чтение» [5]. В систематическом обзоре [6] показано, что двойное чтение в рентгенологии повышает чувствительность метода при снижении его специфичности, поэтому авторы рекомендуют использовать двойное чтение для таких заболеваний, при которых значительная польза достигается за счет раннего выявления, а пропуск патологии может иметь серьезные последствия, например, РМЖ. Как правило, врачи-рентгенологи, специализирующиеся на рентгенографии органов грудной клетки и ММГ, описывают наибольшее количество исследований в смену по сравнению со специалистами других модальностей и областей исследований [7]. В связи с различным уровнем подготовки и опыта рентгенологов при интерпретации ММГ могут встречаться ложные результаты. Поэтому на практике, особенно в период повышенной нагрузки на врачей-рентгенологов (пандемия COVID-19), сложно выделить качественные и достаточные ресурсы для осуществления двойного чтения. Организация скрининговой программы РМЖ также является трудоемкой задачей из-за большого потока пациентов, соответствующих критериям включения и проходящих скрининг [2], а двойное чтение результатов ММГ приводит к дополнительным экономическим затратам; вместе с тем, отказ от такой процедуры чреват выраженным снижением качества и выявления РМЖ.

Более того, есть данные литературы о том, что до 25% видимых на ММГ злокачественных новообразований все еще не выявляются при скрининге [8].

В последние годы отмечается активная разработка алгоритмов на основе искусственного интеллекта (ИИ-алгоритмов), способных анализировать цифровые рентгенологические исследования. Большое количество исследований посвящено валидации алгоритмов по выявлению РМЖ на ММГ [3, 9—11], что обусловлено высокой нагрузкой на врачей-рентгенологов, особенно в скрининговых программах. Проведены исследования, демонстрирующие сопоставимую с диагностической точностью врача-рентгенолога чувствительность отдельного ИИ-алгоритма [12], а также выполнены систематические обзоры [13, 14], которые показывают, что объединенные показатели чувствительности, специфичности и площади под характеристической кривой (далее — AUC от англ. area under curve) ИИ-алгоритмов не имеют статистически значимой разницы по сравнению с врачом-рентгенологом. Отдельные авторы указывают на статистически значимое превосходство диагностической точности ИИ по сравнению с врачом [9]. Зарубежный опыт использования ИИ-алгоритмов при скрининге РМЖ свидетельствует об отсутствии статистически значимых различий между двойным чтением врачами-рентгенологами и применением комбинации врача-рентгенолога с ИИ-алгоритмом [15, 16].

Указанные выше публикации демонстрируют потенциальную эффективность применения ИИ для ММГ, однако для оценки возможности применения ИИ-алгоритмов на практике необходимо определить пороговые значения метрик диагностической точности для допуска алгоритмов к практическому применению. В литературе существует единый стандарт порогового значения для площади под характеристической кривой для всех направлений и модальностей ИИ-алгоритмов — 0,81 [17], но отдельных данных по порогам метрик качества для профилактических исследований по ММГ на данный момент нет.

Цель исследования — оценить пороговые значения метрик качества ИИ-алгоритмов для анализа маммографических исследований в сопоставлении с диагностической точностью врача-рентгенолога.

Материал и методы

Дизайн исследования

Выполнено комбинированное ретро- и проспективное обсервационное когортное исследование, основанное на результатах ранее зарегистрированного и одобренного локальным этическим комитетом исследования «Эксперимент по использованию инновационных технологий в области компьютерного зрения для анализа медицинских изображений и дальнейшего применения в системе здравоохранения города Москвы» (далее — Московский Эксперимент). В настоящем исследовании учитывались результаты Московского Эксперимента за период с 2020 по 2021 г. Компании-разработчики предоставляли программные продукты — алгоритмы на основе ИИ, так называемые ИИ-сервисы, которые после прохождения тестирования встраивались в Единый радиологический информационный сервис Единой медицинской информационно-аналитической системы Москвы (ЕРИС-ЕМИАС) и проводили автоматизированный анализ результатов лучевых исследований по различным модальностям и направлениям, включая маммографию. ИИ-сервисы предоставляли результаты анализа, доступные врачам-рентгенологам, в следующем виде: сортировка исследований по приоритетности, разметка патологических находок на изображениях и текстовый протокол описания исследования. Все медицинские данные использовались исключительно в деперсонализированном виде.

ИИ-сервисы

В исследовании использовано 5 ИИ-сервисов для поиска патологии на цифровых маммографических изображениях. Алгоритм принимал на вход исследование в формате DICOM, содержащее изображения двух молочных желез, каждая из которых отсканирована в двух проекциях (CC и MLO). Ответы ИИ-сервисов получены в виде вероятности наличия злокачественных изменений в ММГ-исследовании в целом, а также в виде дополнительных DICOM-серий с графическим оконтуриванием областей интереса. Методология расчета вероятности наличия патологии каждым разработчиком выбиралась самостоятельно и в настоящей работе не являлась предметом изучения. Примеры результатов работы ИИ-сервисов представлены на рис. 1 на цв. вклейке.

Рис. 1. Примеры работы ИИ-алгоритмов (последовательность согласно табл. 1): указаны значения вероятностей наличия злокачественных изменений в графически оконтуренных областях интереса или только локализация патологической находки.

Веб-платформа для сбора оценок, выставленных врачами-рентгенологами

Получение и сохранение оценок от врачей-рентгенологов осуществлялось на специально разработанной для данной задачи цифровой платформе с веб-интерфейсом [18]. Доступ к платформе организован посредством сети Интернет. Отображение исследований осуществлялось интегрированным средством просмотра DICOM-исследований, функционал которого соответствовал общим требованиям для лучевой диагностики. Для каждого исследования предоставлялась информация о возрасте и поле обследованного пациента. Дополнительная клиническая информация отсутствовала, что обеспечивало одинаковые условия для врачей и ИИ. Пример визуализации исследования на платформе приведен на рис. 2 на цв. вклейке.

Рис. 2. Интерфейс платформы экспертного пересмотра.

Для решения задачи сравнения диагностической точности врачей и ИИ использованы оценки наличия патологического процесса во всем исследовании без дополнительной детализации по классификациям и локализациям находок. Для этого предлагалось выбрать один из вариантов ответа для каждого исследования: 1) определенно без патологии; 2) возможно без патологии; 3) затрудняюсь ответить; 4) возможно с патологией; 5) определенно с патологией. Каждый врач-рентгенолог мог проанализировать 20, 50 или 80 исследований [19].

Врачи-рентгенологи

В исследовании добровольно принимали участие врачи-рентгенологи из различных медицинских организаций Российской Федерации. Результаты оценки врачами, не закончившими разметку выбранного количества исследований, не использовались для последующего сравнительного анализа. Таким образом, в исследование включены результаты 113 врачей-рентгенологов, распределение которых по стажу работы по специальности было следующим: 0—1 год — 16 врачей, 1—5 лет — 32 врача, 5—10 лет — 28 врачей и 37 врачей со стажем более 10 лет. Сбор персональных данных врачей не осуществлялся.

Набор данных

В данную работу отбирались ММГ-исследования из ЕРИС-ЕМИАС, подвергнутые анонимизации и размеченные экспертами в рамках Московского Эксперимента. Исследование классифицировалось как патологическое в том случае, если врачом-рентгенологом при интерпретации выставлена одна из следующих категорий BI-RADS по диагностической шкале — 3, 4a, 4b, 4c или BI-RADS 0 по скрининговой шкале.

Исследование классифицировалось как патологическое при выполнении одновременно двух условий:

1. При достижении консенсуса между двумя экспертами с опытом работы более 3 лет по направлению «маммография».

2. Злокачественные новообразования верифицированы гистологическим методом (по результатам трепан-биопсии).

В случае разногласия двух экспертов подключался третий эксперт. Решение о включении исследования в набор данных принималось на основании согласия двух экспертов.

Исследование классифицировалось как нормальное в случае достижения консенсуса между двумя экспертами. В случае разногласия исследование не включалось в набор данных.

Критериями исключения при подготовке набора данных были состояния после оперативных вмешательств, технические дефекты и несоблюдение методики сканирования при выполнении исследования, а также отсутствие гистологической или экспертной валидации. Финальный набор данных состоял из 100 ММГ-исследований: 50 — с целевой патологией, 50 — без целевой патологии.

Оценка «среднего» врача-рентгенолога

На первом этапе для каждого исследования выставлялась оценка от 1 до 5 баллов в соответствии с ответами врачей. Далее для каждого исследования рассчитывалась медиана балльной оценки и приводилась к значению в диапазоне 0—100, после чего осуществлялась дальнейшая оценка методом ROC-анализа.

Статистическая обработка данных

Критерии включения в исследование: наличие ответа от всех ИИ-сервисов и наличие оценки минимум от трех врачей. Оценка диагностической точности врача-рентгенолога и алгоритмов ИИ осуществлялась на основании ROC-анализа, что позволило минимизировать субъективность оценки исследования врачом-рентгенологом. Площадь под характеристической кривой рассчитана с 95% доверительным интервалом (ДИ) методом Делонга (DeLong) [20]. Для определения оптимального порогового значения использован максимум индекса Юдена (Youden) [21], для данного порогового значения определены метрики — чувствительность, специфичность и точность. Все значения приведены с 95% ДИ. Сравнительный анализ AUC проведен с помощью перестановочного теста [22]. Проверена нулевая гипотеза H0 об отсутствии различий между ROC-кривыми против альтернативной H1 о существовании различий. Уровень значимости p<0,05.

Результаты

Для каждого ИИ-сервиса и «среднего» врача-рентгенолога построены характеристические кривые (рис. 3 на цв. вклейке), оптимальные пороговые значения по максимуму индекса Юдена отмечены маркером. ROC-кривые сглажены, точками отмечены значения вероятности наличия патологии, их количество обусловлено дискретностью этих значений.

Рис. 3. Результаты ROC-анализа «среднего» врача-рентгенолога и ИИ-алгоритмов при анализе маммографии для групп «с патологией» и «без патологии».

Увеличенным маркером отмечена точка с оптимальным значением метрик (с максимизацией индекса Юдена).

Метрики диагностической точности ИИ-сервисов и «среднего» врача-рентгенолога на тестовом наборе данных приведены в табл. 1.

Таблица 1. Метрики диагностической точности ИИ-сервисов и «среднего» врача-рентгенолога (95% ДИ)

Параметр

AUC

Чувствительность*

Специфичность*

Точность*

ИИ-1

0,713 (0,613—0,811)

0,812 (0,702—0,923)

0,600 (0,464—0,736)

0,704 (0,614—0,794)

ИИ-2

0,818 (0,736—0,897)

0,583 (0,444—0,723)

0,960 (0,906—1,000)

0,776 (0,693—0,858)

ИИ-3

0,893 (0,826—0,958)

0,750 (0,628—0,872)

0,940 (0,874—1,000)

0,847 (0,776—0,918)

ИИ-4

0,903 (0,841—0,963)

0,833 (0,728—0,939)

0,860 (0,764—0,956)

0,847 (0,776—0,918)

«Средний» врач-рентгенолог

0,928 (0,883—0,976)

0,792 (0,677—0,907)

0,940 (0,874—1,000)

0,867 (0,800—0,935)

ИИ-5

0,958 (0,923—0,994)

0,833 (0,728—0,939)

0,960 (0,906—1,000)

0,898 (0,838—0,958)

Примечание. * — метрики рассчитаны для порогового значения, определенного по максимуму индекса Юдена.

«Средний» врач-рентгенолог обладал следующими минимальными метриками диагностической точности (нижняя граница ДИ): AUC 0,883, чувствительность 0,677, специфичность 0,874, точность 0, 800.

Как следует из представленных данных, максимальной чувствительностью для порогового значения, определенного максимумом индекса Юдена, обладали два ИИ-сервиса: ИИ-4 и ИИ-5, которые по абсолютному значению превзошли результаты «среднего» врача-рентгенолога. Для ИИ-2 и ИИ-5 также получены максимальные значения для специфичности, рассчитанной для того же порогового значения.

Для комплексной оценки баланса чувствительности и специфичности можно использовать метрику точность. По абсолютным значениям этой метрики ИИ-5 превзошел результаты «среднего» врача-рентгенолога, однако превышение было статистически незначимо.

Важно отметить, что проведенное выше сравнение по метрикам не учитывало тот факт, что в границах доверительных интервалов метрики, обозначенных ИИ-сервисов, пересекаются. Для объективного сравнения ИИ-сервисов между собой, а также с результатами «среднего» врача-рентгенолога, использовали AUC — интегральную метрику диагностической точности, не зависящую от выбранного порогового значения, а также перестановочный тест для оценки уровня значимости. Полученные значения приведены в табл. 2.

Таблица 2. Сравнение AUC-алгоритмов искусственного интеллекта

i

j

ИИ-1

ИИ-2

ИИ-3

ИИ-4

«Средний» врач-рентгенолог

ИИ-5

ИИ-1

0,71

–0,11

–0,18

–0,19

–0,22

–0,25

ИИ-2

0,11

0,82

–0,07

–0,08

–0,11

–0,14

ИИ-3

0,18

0,07

0,89

–0,01

–0,04

–0,07

ИИ-4

0,19

0,08

0,01

0,90

–0,03

–0,06

«Средний» врач-рентгенолог

0,22

0,11

0,04

0,03

0,93

–0,03

ИИ-5

0,25

0,14

0,07

0,06

0,03

0,96

Примечание. На главной диагонали указаны значения AUC-алгоритмов, в остальных ячейках — разница AUC i—j. Серым цветом и жирным шрифтом выделены статистически значимые различия (p<0,05).

Данные, приведенные в табл. 2, указывают на статистически значимое превосходство диагностической точности «среднего» врача-рентгенолога над ИИ-1 и ИИ-2 и отсутствие статистически значимой разницы с ИИ-3, ИИ-4 и ИИ-5. В тройку с лучшими показателями по AUC помимо «среднего» врача-рентгенолога входят ИИ-4 и ИИ-5, между которыми не получена статистически значимая разница.

Обсуждение

При внедрении в клиническую практику новых методик или технологий необходимо понимание степени влияния на текущий процесс. То же самое применимо и к внедрению технологий на основе ИИ, в том числе в лучевой диагностике: необходимо определить оптимальную точку приложения этой технологии. Для скрининга ЗНО молочной железы оправдано и перспективно применение алгоритмов на основе ИИ [23]. В ряде работ уже продемонстрирована эффективность использования ИИ для первого или второго чтения исследований [11, 24].

В работе [16] авторы показали, что при скрининге РМЖ комбинация диагностической точности врача-рентгенолога и ИИ-алгоритма обладает большей чувствительностью и меньшей специфичностью по сравнению с врачом-рентгенологом, а также не имеют статистически значимой разницы по сравнению с двойным чтением врачами-рентгенологами.

В работе [15] чувствительность скрининга на основе ИИ оказалась не ниже, чем у врачей-рентгенологов без применения ИИ-алгоритмов, а специфичность статистически значимо превысила показатели врачей без ИИ-алгоритмов. При этом авторы использовали следующую схему скрининга: сначала данные анализировали с помощью ИИ-алгоритма, а второе чтение проводил врач-рентгенолог, тем самым повышалась чувствительность метода за счет алгоритма, а специфичность за счет врача.

Для принятия решения о применении конкретного ИИ-алгоритма в клинической практике следует определить приемлемый уровень диагностической точности. Для этих целей удобно использовать метрику, которая учитывает и чувствительность, и специфичность — AUC. С одной стороны, существует фиксированное значение AUC для принятия решения о допуске к клинической апробации сервиса на основе ИИ, равное 0,81 [17]. По этому критерию 4 из 5 ИИ-сервисов, представленные в настоящем исследовании, удовлетворяют требованию и могут быть рекомендованы к практическому использованию. Однако пороговое значение 0,81 для AUC носит рекомендательный характер и не зависит от конкретной модальности или вида исследования. В этом случае необходимо обратиться к научным исследованиям, проводящим оценку эффективности применения ИИ для ММГ. Из обзора литературы следует большой вариатив возможных значений AUC: от 0,706 [25] до 0,956 [26]. Однако систематический обзор, проведенный K. Freeman и соавт. [27], показал, что 34 из 36 ИИ-систем для диагностики РМЖ были менее точные по сравнению с врачом-рентгенологом и все уступали двойному чтению. Наше исследование показало, что ни один из оцениваемых ИИ-сервисов по значениям AUC статистически значимо не превзошел «среднего» врача-рентгенолога. С другой стороны, два ИИ-сервиса показали значения AUC, статистически значимо не отличающиеся от таковых для «среднего» врача-рентгенолога.

Важным результатом настоящей работы является оценка диагностической точности «среднего» врача-рентгенолога по данным 113 врачей-рентгенологов. В литературе можно встретить разные значения AUC для диагностической точности зарубежных врачей-рентгенологов: 0,778 [28], 0,816 [25], 0,87 [11]. При этом в отечественной литературе вопрос диагностической точности врача-рентгенолога при описании ММГ исследований затронут только в одной публикации П.И. Павлович и соавт. [29]. Однако в обозначенной работе проведен анализ работы двух врачей, которые пропустили 1 патологический случай из 49, при этом ROC-анализ не был проведен. Самое масштабное на сегодняшний день исследование по оценке диагностической точности врача-рентгенолога при описании ММГ основано на данных работы 101 врача: AUC составила 0,814 [11]. В нашем исследовании диагностическая точность врачей-рентгенологов оказалась выше, чем во многих зарубежных исследованиях. Целью данного исследования не являлась аналитика расхождения метрик диагностической точности «среднего» врача-рентгенолога с результатами зарубежных исследователей, мы можем лишь предположить, что на это могла повлиять специфика подготовки наших специалистов, а больший объем выборки является залогом статистической значимости результатов.

Полученные нами результаты важны для отечественной лучевой диагностики прежде всего тем, что при практическом внедрении алгоритмов ИИ для анализа ММГ необходимо предъявлять более жесткие требования по метрикам диагностической точности. Так, алгоритмы, описанные в зарубежной литературе, со значениями AUC менее 0,883 (нижняя граница ДИ для усредненного врача-рентгенолога) могут оказаться неэффективными за счет большого числа ложных срабатываний, обесценивая совместную работу пары «врач + ИИ».

Ограничения

К моменту выхода данной публикации в печать возможно появление более актуальных по сравнению с описанными в настоящей работе версий ИИ-сервисов. В настоящей работе мы не проводили оценку эффективности работы пары «врач + ИИ», которая является предметом дальнейших наших изучений.

Заключение

Для практического применения сервисов на основе искусственного интеллекта в условиях отечественной системы здравоохранения мы рекомендуем осуществлять независимую валидацию метрик диагностической точности и сопоставлять их со значениями для врачей-рентгенологов, которые будут работать с результатами этих алгоритмов. В качестве нижнего порога для показателя диагностической точности «площадь под характеристической кривой» рекомендуем использовать значение 0,883.

Участие авторов:

Концепция и дизайн исследования — А.В. Владзимирский, А.Е. Андрейченко, К.М. Арзамасов, Ю.А. Васильев; сбор и обработка материала — С.Ф. Четвериков, С.С. Семенов, К.М. Арзамасов; статистический анализ данных — Ю.С. Кирпичев, Т.М. Бобровская; написание текста — К.М. Арзамасов, Н.А. Павлов; редактирование — С.Ф. Четвериков, С.С. Семенов, Ю.С. Кирпичев, Т.М. Бобровская, О.В. Омелянская.

Источник финансирования:

Данная статья подготовлена авторским коллективом в рамках научно-практического проекта в сфере медицины (№ЕГИСУ: 122112400040-1) «Эталонные наборы данных для устойчивого развития технологий искусственного интеллекта в медицинской диагностике с целью минимизации долгосрочных последствий пандемии коронавирусной инфекции для здоровья населения города Москвы».

Авторы заявляют об отсутствии конфликта интересов.

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail



Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.