Использование модели помощи принятия врачебных решений «PathVision.ai» в морфологической диагностике рака предстательной железы в биопсийном материале
Журнал: Архив патологии. 2025;87(6): 34‑41
Прочитано: 252 раза
Как цитировать:
В России рак предстательной железы (РПЖ) является одним из наиболее распространенных злокачественных новообразований, занимает 2-е место по выявляемости и 3-е — в структуре смертности среди мужского населения [1, 2]. За последние 10 лет были созданы различные скрининговые программы, позволяющие выявлять эту патологию на ранней стадии и оказывать своевременную медицинскую помощь, улучшая качество и продолжительность жизни пациентов [3].
Морфологическая верификация (исследование биопсийного материала) является обязательной в диагностике РПЖ. Наиболее частый тип РПЖ — ацинарная аденокарцинома, на которую приходится примерно 95% от всех выявленных случаев.
У специалистов, не имеющих опыта в работе с онкоурологическим материалом, идентификация РПЖ вызывает трудности и может приводить как к гипер-, так и к гиподиагностике, а также к избыточному назначению иммуногистохимического окрашивания для подтверждения очевидных опухолевых структур, увеличивая сроки и стоимость проводимого исследования. Еще одной проблемой является неправильная интерпретация желез с неполной атрофией как ацинарной аденокарциномы градации 3.
Мы приняли решение разработать систему поддержки принятия врачебных решений на основе ИИ, которое было бы направлено на снижение нагрузки на врача-патологоанатома, уменьшение количества диагностических ошибок, а также избыточного назначения иммуногистохимического исследования в очевидных случаях.
Цель исследования — разработать модель помощи принятия врачебных решений на основе ИИ для диагностики РПЖ в биопсийном материале, а также сравнить результаты ИИ с оценками врачей-патологоанатомов с различным опытом в диагностике РПЖ.
Было проведено многоцентровое исследование, состоящее из двух этапов:
— разработка платформы «PathVision.ai» и модели ИИ для анализа изображений гистологических препаратов;
— проведение тестирования на платформе «PathVision.ai» среди врачей-патологоанатомов с различным стажем из разных российских медицинских учреждений, а также тестирование нейронной сети на слайдах из наборов 1 и 2 с последующим сравнением полученных результатов.
Схема проведенного исследования представлена на рис. 1.
Рис. 1. Дизайн исследования.
I этап — разработка модели и обучение нейронной сети; II этап — тестирование среди врачей-патологоанатомов и сравнение результатов диагностики РПЖ между врачами и ИИ. Диаграмма включает описание процедур отбора препаратов, формирования тестовых наборов, разделение участников исследования на группы в зависимости от стажа работы в патологической анатомии и опыта диагностики РПЖ.
Разработка программного обеспечения «PathVision.ai» проводилась компанией ООО «Цифровой онкоморфолог». Подбор и сканирование гистологических препаратов осуществлялись на базе ФГБУ «ГВКГ им. Н.Н. Бурденко», разметка полученных слайдов — врачами-патологоанатомами из различных медицинских учреждений РФ. В тестировании приняли участие врачи из ФГБУ «ЦКБ УДП РФ с поликлиникой», медицинской лаборатории «Гемотест», МММКЦ «Коммунарка», ФГБУ «ГВКГ им. Н.Н. Бурденко», ГБУЗ «МКНЦ им. А.С. Логинова Департамента здравоохранения города Москвы», а также из других медицинских организаций России.
В период с 2019 по 2021 г. проводили I этап исследования, с мая по июнь 2022 г. — II этап.
Для формирования обучающего датасета в 2019 г. на базе ФГБУ «ГВКГ им. Н.Н. Бурденко» из архива было отобрано 742 микроскопических препарата от 86 пациентов, 272 из них были исключены из выборки по приведенным ниже критериям. Препараты сканировали при увеличении в 20 раз на сканере Leica Aperio AT2. Для дальнейшей разметки из оставшихся 470 слайдов сформировали базу данных: 329 использовали для обучения, 141 — для валидации модели.
После верификации разметки было получено 964 изображения различных структур, которые имели следующее распределение: 39% (375/964) составляли изображения нормальных ацинусов предстательной железы, 61% (589/964) — РПЖ.
Для проведения тестирования дополнительно из архива ФГБУ «ЦКБ УДП РФ с поликлиникой» было отобрано 282 препарата, которые были отсканированы при увеличении в 20 раз на сканере Leica Aperio AT2. Из них были сформированы 2 отдельных набора (1 и 2) по 141 изображению каждый (табл. 1). Все препараты были оценены 2 врачами-патологоанатомами высшей категории (стаж более 13 лет) из ФГБУ «ЦКБ УДП РФ с поликлиникой».
Таблица 1. Распределение случаев после верификации экспертами в тестовых наборах
| Параметр | Наличие рака предстательной железы (n=201), абс. (%) | Без признаков рака (n=81), абс. (%) |
| Набор 1 | 99 (70,2) | 42 (29,1) |
| Градирующая группа | ||
| 1 | 43 (43,4) | |
| 2 | 22 (22,2) | |
| 3 | 10 (10,1) | |
| 4 | 7 (7,1) | |
| 5 | 7 (7,1) | |
| Набор 2 | 102 (72,3) | 39 (27,7) |
| Градирующая группа | ||
| 1 | 38 (37,3) | |
| 2 | 21 (20,6) | |
| 3 | 13 (12,7) | |
| 4 | 7 (6,9) | |
| 5 | 23 (22,5) |
В обучающий и тестовые наборы были включены гистологические препараты биопсийных столбиков ткани предстательной железы, окрашенные гематоксилином и эозином. Критериями исключения препаратов из набора данных являлись артефакты пробоподготовки биоматериала, наличие у стеклопрепарата сколов и трещин, которые не позволили провести сканирование, у отсканированных изображений — участков нарушения фокуса, выпадения или сшивания кластеров.
В тестировании приняли участие 20 врачей-патологоанатомов из 12 медицинских учреждений из разных городов России, с различным стажем, не проводивших разметку. Специалистов разделили на 2 группы — A (n=10) и B (n=10), сбалансированные по опыту работы участников. Каждая группа дополнительно была разделена на подгруппы по стажу диагностики РПЖ: менее 5 лет — начинающие врачи (n=12), более 5 лет — опытные специалисты (n=8). Каждая группа состояла из 6 начинающих и 4 опытных врачей. Врачи когорты A оценивали препараты из набора 2, врачи когорты B — из набора 1.
В основе системы обработки изображений лежала архитектура сегментирующих ИНС — U-Net. В качестве энкодера U-Net использовалась сверточная нейронная сеть EfficientNet B1, предварительно предобученная на датасете ImageNet, веса для которой были взяты из официального репозитория PyTorch. Для предсказания анализируемый слайд считывался в низком разрешении (8 мкм/пиксель), на котором происходила сегментация гистологических срезов для выделения релевантных для ИНС областей. Сегментация выполнялась с помощью медианных фильтров и отсечения экстремально ярких и темных областей изображения. В результате этих действий была получена бинарная маска для слайда, выделяющая столбик ткани предстательной железы.
Области слайда, соответствующие срезам ткани, разбивались на перекрывающиеся плитки и читались в большем для ИНС разрешении. Каждая плитка была прочитана из слайда с разрешением 2048×2048 пикселей и 1 мкм/пиксель. Далее плитка пропускалась через сегментирующую ИНС для получения маски с количеством каналов, равным количеству аннотаций (классов). Каждому пикселю изображения присваивалась специализированная метка. Пиксели с одинаковыми метками имели общие визуальные характеристики. Для уменьшения проводимых вычислений и экономии дискового пространства полученная маска представлялась в виде полигонов. При сохранении полигонов на диск производилась их группировка по изначальным биоптатам для получения предварительного диагноза на стороне сервера как, так и аннотирующего. Принцип работы модели представлен на рис. 2.
Рис. 2. Принцип работы модели «PathVision.ai».
Архитектура U-net включает энкодер с использованием EfficientNet-b1 и декодер для сегментации изображений биопсийного материала. Обработка изображения осуществляется через этапы down sampling, объединения признаков (copy, concatenate) и up sampling, что позволяет преобразовать входное изображение в сегментированное предсказание. Внизу представлены примеры входных изображений и соответствующих результатов сегментации, выполненных моделью.
Для обеспечения большей вариативности данных и повышения устойчивости нейросети к тренировочным данным в процессе обучения ИНС были применены следующие аугментации:
— зеркальные отражения изображений по вертикали, горизонтали;
— снижение качества изображения через сжатие кодеком JPG:
— эластичное искажение изображения. Для аугментаций, изменяющих размер и/или форму выбранного патча, использовались линейная интерполяция и отзеркаливание граничных областей;
— изменение яркости, контрастности и гаммы;
— перестановка каналов изображения;
— изменение оттенка и насыщенности;
— добавление шума.
В качестве функции потерь использовались CrossEntropyLoss и DiceLoss, для минимизации которых применялся оптимизатор Rectified Adam.
Разметку проводили 18 врачей с различным стажем работы в патологической анатомии (от 1 года и более) из различных медицинских учреждений на платформе «PathVision.ai» в личном кабинете.
Аннотации включали:
1) морфологический тип рака (ацинарная, протоковая аденокарцинома);
2) градацию Глисона (3, 4, 5);
3) структуры с нормальным гистологическим строением;
4) атрофию желез;
5) воспаление.
В биоптате с помощью инструментов разметки отмечали стромальный компонент и эпителиальные структуры. В случае, если эпителиальные структуры относились к одному классу, их выделяли вместе, не включая при этом строму. Каждой опухолевой структуре присваивали обозначение типа рака с соответствующей градацией Глисона.
Полученную разметку препаратов дополнительно проверяли 2 врача-эксперта в области урологической патологии (стаж более 13 лет), независимо друг от друга. Оценивали качество разметки: отделение стромы от эпителия и разделение эпителиальных структур по морфологическому типу (опухолевые, неопухолевые); у опухолевых структур — тип рака, градацию Глисона. В случае, если если проверяющий был не согласен с разметчиком, к аннотации привлекался второй валидирующий врач для принятия консенсусного решения. Если эксперты не приходили к согласию, эти структуры исключали.
Каждый врач исследовал 141 случай, затем при наличии РПЖ указывал его морфологический тип (ацинарная или протоковая аденокарцинома), отсутствие патологии специалист определял как нормальное гистологическое строение.
Проведение данного исследования было одобрено Этическим комитетом при ЦКБ УДП РФ с поликлиникой (выписка из протокола заседания №12Б Этического комитета при ФГБУ «ЦКБ УДП РФ с поликлиникой» от 22.12.22).
В основе статистического анализа лежала оценка результатов диагностики РПЖ, суммы Глисона и градирующей группы с последующим сравнением показателей врачей и ИИ. Из полученных данных составляли матрицу ошибок, на основе которой проводили расчеты чувствительности (sensitivity), специфичности (specificity), точности (accuracy), а также статистической значимости и доверительные интервалы (ДИ) с помощью статистического метода бутстрэп (Bootstrap), количество итераций 1000. За уровень статистической значимости принято значение α=0,05.
Для оценки внутригрупповой согласованности использовали каппу Флейсса и шкалу интерпретации каппа-статистики Landis & Koch, 1977.
Для проведения статистического анализа использовали библиотеки SciPy и NumPy из языка программирования Python.
Были разработаны платформа «PathVision.ai» и нейронная сеть, способная выявлять РПЖ в соответствии с клиническими рекомендациями.
Программное обеспечение для обработки цифровых изображений гистологических препаратов «PathVision.ai» состоит из трех компонентов: пользовательского веб-интерфейса, сервера платформы и системы для обработки изображений на основе ИИ. Пример работы «PathVision.ai» представлен на рис. 3.
Рис. 3. Пример работы «PathVision.ai».
ИИ «PathVision.ai» анализирует отсканированное изображение, выделяет железистые структуры и оценивает занимаемую ими площадь в трепанобиопсии. На представленном рисунке структуры аденокарциномы градации 3 отмечены фиолетовым цветом, более темным — структуры градации 4, голубым — нормальные железы.
В наборе препаратов 1 ИИ выявил все 99 случаев РПЖ. Чувствительность модели значительно превосходила результаты врачей, независимо от опыта диагностики РПЖ (p=0,01.10–7).
В наборе 2 ИИ также продемонстрировал высокие показатели, выявив РПЖ в 101 из 102 препаратов. При этом чувствительность модели была значительно выше результатов врачей (p=0,01.10–5).
В наборе 1 ИИ из 42 препаратов выдал 2 ложноположительных результата. Специфичность модели достигла результата начинающих врачей, статистически значимое различие не выявлено. Специфичность у опытных специалистов была выше, чем у ИИ, однако без статистической значимости.
В наборе 2 ИИ из 39 препаратов выдал 3 ложноположительных результата. Специфичность у врачей и ИИ была сопоставима с результатами набора 1. Несмотря на то что специфичность у модели превосходила таковую у начинающих врачей, статистически значимых различий не выявлено. Также статистически значимых различий между опытными специалистами и ИИ не установлено.
В наборе 1 точность модели значимо превосходила результаты врачей, независимо от опыта диагностики РПЖ (p=0,04.10–1).
В наборе 2 точность ИИ значительно превосходила результаты начинающих врачей (p=0,01.10–1), а также статистически значимо была выше, чем у опытных специалистов (p=0,03).
При сравнении полученных метрик ИИ в двух наборах препаратов было выявлено отсутствие статистически значимых различий, что подтверждает стабильность работы модели, независимо от используемого набора.
В двух наборах препаратов согласованность врачей была существенной (A — k=0,74 (95% ДИ 0,67—0,81); B — k=0,78 (95% ДИ 0,71—0,84)). В наборе 2 опытные врачи достигли полного согласия (k=0,82 (95% ДИ 0,74—0,89)). Полученные результаты представлены в табл. 2, сравнение метрик — на рис. 4.
Таблица 2. Результаты диагностики РПЖ врачей-патологоанатомов и ИИ
| Параметр | Набор 1 | Набор 2 | ||||||
| группа B | ИИ | группа A | ИИ | |||||
| стаж менее 5 лет | стаж более 5 лет | все врачи | стаж менее 5 лет | стаж более 5 лет | все врачи | |||
| Чувствительность [ДИ] | 0,93 [0,90—0,949] | 0,91 [0,88—0,94] | 0,92 [0,91—0,94] | 1,00 [0,95—1,00] | 0,92 [0,87—0,91] | 0,95 [0,93—0,97] | 0,93 [0,91—0,95] | 0,99 [0,94—0,99] |
| Специфичность [ДИ] | 0,94 [0,90—0,96] | 1,00 [0,972—1,00] | 0,96 [0,94—0,98] | 0,95 [0,83—0,99] | 0,84 [0,78—0,88] | 0,88 [0,81—0,92] | 0,85 [0,81—0,89] | 0,90 [0,75—0,97] |
| Точность [ДИ] | 0,93 [0,91—0,95] | 0,94 [0,92—0,96] | 0,94 [0,91—0,95] | 0,99 [0,94—0,99] | 0,90 [0,87—0,91] | 0,93 [0,91—0,95] | 0,91 [0,89—0,92] | 0,96 [0,91—0,99] |
Рис. 4. Сравнение качества диагностики РПЖ между ИИ и врачами с различным стажем.
В двух наборах препаратов ИИ статистически значимо превосходил врачей, независимо от стажа в чувствительности и точности определения РПЖ. Специфичность модели была на уровне опытных специалистов.
Разработанная в рамках данного исследования модель «PathVision.ai» продемонстрировала высокие показатели чувствительности, специфичности и точности в диагностике РПЖ — на уровне опытных врачей.
Значимость разработанной модели подтверждает сравнение с международными данными. На данный момент в мировой литературе описано множество статей, в которых ИИ достиг высоких показателей чувствительности, специфичности и точности в диагностике РПЖ с использованием архитектуры глубокого обучения, что согласуется с нашими результатами [4—7].
Модель «PathVision.ai» смогла продемонстрировать высокую воспроизводимость результатов в диагностике РПЖ, независимо от используемого набора. Помимо этого, по некоторым показателям точность диагностики ИИ превосходила таковую опытных специалистов.
Наше исследование имело некоторые ограничения. В обучение не были включены аннотации редких типов РПЖ (например, протоковой аденокарциномы), простатической интраэпителиальной неоплазии, интрадуктальной карциномы, а также периневральной инвазии и экстрапростатического распространения.
Модель «PathVision.ai» продемонстрировала высокую эффективность в диагностике РПЖ. Сравнение с международными исследованиями подтверждает конкурентоспособность нашей модели. С учетом различий в подходах оценки РПЖ между врачом-патологоанатомом и нейронной сетью вопрос о создании отдельных классификаций под модели ИИ представляет интерес для последующего изучения.
Научное исследование проведено при поддержке ООО «Цифровой онкоморфолог».
Авторы выражают свою искреннюю признательность Бобину А.Н., Плотницкому А.В., Жакоте Д.А., Каниболоцкому А.А. и Атласову Э.А. за помощь в развитии проекта.
Участие авторов:
Концепция и дизайн исследования — Попов Г.В., Кривопусков В.А.
Сбор и обработка материала — Овсянникова М.Р., Гадельшина Ю.А., Печерская М.С., Туровская Н.Ю., Ахмадиева В.Р., Кущ Д.С.
Создание нейронной сети — Маевских П.А., Чуб А.А., Юровский В.А., Оксаненко А.Е.
Статистическая обработка данных — Маевских П.А., Кущ Д.С.
Написание текста — Кущ Д.С.
Редактирование — Горбань Н.А., Демура Т.А.
Авторы заявляют об отсутствии конфликта интересов.
Литература / References:
Подтверждение e-mail
На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.
Подтверждение e-mail
Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.