Рак шейки матки (РШМ) занимает 4-е место среди наиболее часто диагностируемых опухолей у женщин, является 4-й по значимости причиной смертности от рака у женщин в среднем по миру и 1-й — среди причин женской смертности от рака в развивающихся странах [1, 2]. Кроме того, РШМ занимает 2-е место по частоте среди злокачественных новообразований генитальной сферы у женщин [3].
В целом раковые опухоли генитальных органов оказывают влияние на качество, продолжительность жизни пациентки и ее репродуктивную функцию. При этом в 20—40% случаев эти нозологии выявляются у женщин фертильного возраста [3]. В предшествующие 5 лет и до настоящего времени количество смертей от РШМ колеблется между 300 000 и 350 000 в год. Из них около 85% случаев смерти от РШМ в мире приходится на ряд стран с низким и средним уровнем дохода [1, 4, 5].
Рак шейки матки прогрессирует из предшествующих поражений, называемых цервикальной интраэпителиальной неоплазией (CIN), и часто развивается в результате персистирующей инфекции вирусом папилломы человека (ВПЧ) высокого риска (HR-HPV) [6]. ВПЧ — основной, хоть и не единственный, этиологический фактор в процессе формирования предраковых состояний и РШМ [7], что обусловливает высокую привентивность данной патологии посредством вакцинации и скринингов [7].
Цель обзора литературы — оценка возможности применения искусственного интеллекта (ИИ) для идентификации кольпоскопических паттернов в рамках скрининговых программ.
Скрининговые программы. Реестр методов скрининга РШМ представлен множеством неинвазивных скрининг-тестов (цитологическое исследование, ВПЧ-тестирование, молекулярный метод, иммуноцитохимическое исследование образцов шейки матки, кольпоскопия, визуализация после предварительной обработки уксусной кислотой и др.) [8]. Методы обследования включаются в скрининговые программы преимущественно в формате последовательных комбинативных цепей (дуплетов или триплетов). A. Cochrane и W. Holland в 1971 г. [9] сформулировали 7 основных критериев скрининговых программ: простота, приемлемость, точность, стоимость, воспроизводимость, высокая чувствительность, высокая специфичность, которые сохранили свою важность по сегодняшний день. Соответствие скрининговых программ этим критериям является условием их осуществимости и актуальности. Значимый индикатор эффективности скрининговой программы РШМ — использование тестов с максимальной выявляемостью женщин с предраковыми заболеваниями, имеющими высокий риск перехода в инвазивную форму рака, что позволит его своевременно предотвратить [9]. Опыт некоторых исследователей [9, 10] наглядно показывает, что клиническая эффективность скрининга в целом находится в непосредственной зависимости от множества факторов (алгоритм скрининговой программы, чувствительность и специфичность применяемых тестов, адекватность критериев выбора когорты и др.).
Как известно, цитологическое исследование является наиболее востребованным методом скрининга РШМ, особенно в странах с низким и средним уровнем дохода. Ложноотрицательный результат цитологического исследования наблюдается приблизительно в 30% случаев (что верифицировано обнаружением РШМ у женщин, регулярно проходивших профилактические осмотры с исследованием Пап-мазков). Этот факт может быть обусловлен неточной техникой забора материала, нарушением технологии нанесения его на предметное стекло, недостаточным опытом и квалификацией цитолога, неверной интерпретацией результата, неадекватной тактикой ведения пациентки и др. [10, 11]. Это способствует понижению эффективности скрининговых мероприятий, особенно в странах с низким уровнем доходов. Однако все же большинство опасений относительно ограничения эффективности скрининга РШМ сфокусировано именно на низкой чувствительности цитологических тестов [12].
Относительное повышение специфичности и чувствительности цитологического исследования достигается при использовании жидкостного метода приготовления препаратов. В этих случаях низкая чувствительность скринингового теста на РШМ преимущественно обусловлена ошибками аналитического этапа, непосредственно зависящими от квалификации и опыта цитолога [10, 12—15].
В свою очередь, ВПЧ-тестирование обеспечивает сравнительно высокую чувствительность в отношении CIN 2+ [12]. Данные рандомизированных клинических исследований и исследований по моделированию решений показывают, что скрининг с изолированным цитологическим исследованием шейки матки менее чувствителен для выявления CIN 2 и CIN 3, чем скрининг с использованием теста на наличие ВПЧ [16].
Замещение цитологического исследования изолированным первичным тестированием на ВПЧ в качестве первичного скрининга также обусловливает высокие показатели направления на дальнейшее кольскопическое обследование, что требует увеличения возможностей кольпоскопии и наличия системы мониторинга для обеспечения приемлемых показателей последующего наблюдения за ВПЧ-позитивными женщинами. Вышесказанное подчеркивает высокую актуальность дальнейшей разработки и внедрения нового поколения кольпоскопов с компьютерными системами визуализации и анализа, что явится залогом адекватной сортировки и менеджмента ВПЧ-позитивных пациентов [17—19].
J. Valls и соавт. [20] провели многоцентровое скрининговое исследование (ESTAMPA), целью которого было оценить результативность применения кольпоскопии для выявления предраковых состояний и РШМ. Результаты данного исследования позволили адекватно оценить важность кольпоскопии, особенно в плане дальнейшего распределения ВПЧ-позитивных женщин, и продемонстрировали возможность использования кольпоскопии в программах скрининга РШМ. При проведении кольпоскопии в качестве скрининговой меры обучение и опыт кольпоскопистов являются доминирующими факторами, определяющими клиническую эффективность скрининга, что приводит к низкой воспроизводимости и высокому разбросу показателей диагностической эффективности [11, 21—24]. Страны с низким и средним уровнем дохода сталкиваются с вопросом недостатка опытных кольпоскопистов, необходимостью регулярных курсов обучения кольпоскопии и повышения квалификации специалистов. Более того, проблема единого диагностического стандарта и строгого процесса контроля качества ограничивает преимущества использования кольпоскопии в программах скрининга РШМ [7, 24, 25]. Это делает необходимым внедрение более эффективных методологий.
Применение искусственного интеллекта в качестве компонента скрининговых мероприятий
Многими авторами анализируются эффективность и валидность применения ИИ для интерпретации результатов кольпоскопии [26—33].
Интенсивное развитие информационных технологий обусловливает не только доступность распознавания сложных закономерностей кольпоскопических паттернов посредством ИИ, но и оперативное решение вопроса недостатка хорошо обученного персонала. Таким образом, применение ИИ в медицинской сфере стало многообещающим для лечения предраковых поражений шейки матки и РШМ. В частности, рекомендации в отношении показаний, сроков и локаций биопсии, техники забора биоптата должны быть дополнены и доработаны в ближайшее время [30—33].
В области профилактики РШМ были предприняты усилия по разработке расчетных скоринговых систем и ИИ для повышения качества ведения женщин с аномальными результатами скрининга [34].
Современное здравоохранение заинтересовано в создании системы ИИ, которая бы идентифицировала кольпоскопические паттерны для высокоточного выявления предраковых поражений шейки матки высокой степени [34]. В связи с этим особую важность приобретает прикладная ценность ИИ — автоматизированная оценка кольпоскопических изображений для повышения объективности диагностики предраковых состояний шейки матки и РШМ. Показано, что посредством технологий ИИ достигается персонализация лечения именно в силу высокой точности дифференциации паттернов [34—38] при снижении нагрузки на медицинских работников и затрат ресурсов здравоохранения [32, 39].
В 2020 г. P. Xue и соавт. [40] опубликовали данные о разработке вспомогательной диагностической системы ИИ (CAIADS) для оценки кольпоскопических паттернов (и стандартизации протокола направления на биопсию). В результате проведенных опробационных исследований было сделано заключение о том, что система CAIADS обладает высокими чувствительностью и специфичностью, сравнимыми с кольпоскопией, интерпретируемой кольпоскопистами CAIADS, и может повысить точность диагностики и биопсии, осуществляемой начинающими специалистами. По заключению авторов [30, 40], CAIADS может быть многообещающим решением для улучшения качества кольпоскопии в низкоресурсных регионах с ограниченным числом квалифицированных специалистов.
Основной принцип диагностической «активности» ИИ заключается в следующем. После разделения изображения на слои и крошечные 3D-пиксели каждая из областей шейки матки классифицируется ИИ (выдающим двоичный ответ «да» или «нет») как нормальная или ненормальная по сравнению с тысячами загруженных в базу изображений, ранее проанализированных врачом-экспертом или ИИ-машиной [40]. Именно в сравнении с собственной базой (названной исследователями «черный ящик») стандартизированных изображений алгоритм ИИ может определить нормальное и ненормальное изображение. Однако такой процесс сравнения отличается от простого сопоставления нормального и ненормального изображения с атласным шаблоном. Учебная база данных позволяет классификатору «черного ящика» правильно идентифицировать и, соответственно, дифференцировать изображения шейки матки как ≥CIN2+ и <CIN2+. При этом каждый слой связан со следующим, а в процессе анализа паттерна ИИ принимаются во внимание конкретная локализация, степень ассоциированности с риском данного поражения, важность, вероятность конкретных результатов сравнения и др. Окончательное решение по направлению на биопсию принимает врач [40].
Хотя система CAIADS и показала удовлетворительную точность в контрольном тестировании, дизайн данного исследования был ретроспективным. Для дальнейшего подтверждения эффективности системы CAIADS и предоставления доказательств ее рентабельности в клинической практике скрининга РШМ авторами планируется проспективное исследование с верификацией паттернов предраковых состояний шейки матки и РШМ согласно гистологической классификации Bethesda [40, 41] и таких «находок», как полипы, стеноз, кондиломы и др.
Анализ полученных результатов привел исследователей к выводу, что на данном этапе разработки в силу ограниченности вышеупомянутых ресурсов CAIADS не может заменить клиническую оценку специалиста при верификации кольпоскопических оттисков и решении вопроса о проведении биопсии. При этом система CAIADS является ценным ассистентом в клинической практике кольпоскопистов (особенно начинающих специалистов) благодаря адекватной чувствительности [40].
Алгоритм EVA Visualcheck TM, использованный в исследовании A. Zimmer-Stelmach и соавт. [42], представляет собой инструмент принятия клинических решений на основе сверточной нейронной сети, используемый для правильной идентификации патологий шейки матки ≥CIN2+. Результаты проведенных исследований привели авторов к обобщенному заключению, что кольпоскопия с использованием ИИ не может служить полноценной заменой квалифицированному врачу-кольпоскописту. Однако ИИ — дополнительный эффективный инструмент (не производящий всестороннюю оценку состояния пациента), который может быть детектором патологии и осуществлять кольпоскопии на уровне скрининга. В этом случае ответственность за комплексную оценку клинической ситуации и окончательное решение полностью лежат на враче-гинекологе [42].
Одной из важнейших ближайших задач в плане усовершенствования системы ИИ, по мнению авторов данного исследования, также является разработка адекватных алгоритмов отбора контингента для направления на биопсию шейки матки [42].
Для повышения чувствительности биопсии под контролем кольпоскопии ряд авторов [43—45] предлагают проводить мультибиопсию и случайную (рандомную) биопсию из нормально выглядящих или цитологически нормальных квадрантов. Некоторыми авторами показано, что анализ кольпоскопических изображений посредством системы ИИ при обнаружении CIN2+ и CIN3+ по степени чувствительности абсолютно совпадал с таковой кольпоскопических исследований, произведенных профессиональными кольпоскопистами. При этом те же авторы [43] утверждают, что кольпоскопия с частичной интерпретационной поддержкой ИИ имеет значительно более высокую чувствительность при выявлении CIN2+ по сравнению с таковой без интерпретационной поддержки ИИ.
Как известно, обычно CIN2 имеет медленное прогрессирование (или спонтанную регрессию). Однако имеются данные [41, 46—49] о возможной скорой конверсии CIN2 в РШМ, чем обоснована необходимость цитологического исследования и кольпоскопии каждые 3—6 мес, а в некоторых случаях — тестирования на наличие ВПЧ для рассмотрения дальнейшей стратегии ведения пациенток с диагнозом CIN2 [50].
Перед описанием результатов следующих исследований, на наш взгляд, целесообразно представить термин «площадь под кривой» (AUC — area under the curve). Это мера способности бинарного классификатора различать классы, которая используется как сводная информация о кривой и обобщает оценку чувствительности, специфичности и дифференцирующих способностей конкретной системы ИИ. Чем выше AUC, тем лучше модель ИИ различает положительные и отрицательные классы (нормальные и ненормальные изображения). При AUC =1 классификатор адекватно различает все положительные и отрицательные точки данного класса. Когда 0,5<AUC<1, существует высокая вероятность дифференциации положительных и отрицательных значений класса, а при AUC=0 классификатор все отрицательные значения идентифицирует как положительные, а все положительные — как отрицательные [51].
В разработке цифровой кольпоскопии на основе ИИ был достигнут значительный прогресс в плане повышения эффективности и точности клинического диагноза. Опубликовано несколько успешных пилотных исследований [30, 52—55] компьютерных алгоритмов интерпретации кольпоскопических паттернов. Результаты свидетельствуют о диагностической ценности ИИ как фактора, способствующего повышению клинико-экономической эффективности скрининга РШМ.
Так, в 2020 г. Y. Miyagi и соавт. [53] представили результаты своих опробационных исследований по использованию технологий ИИ с целью классификации поражений плоского эпителия шейки матки по изображениям кольпоскопии в сочетании с типированием ВПЧ. Авторы пришли к выводу о применимости ИИ для классификации плоскоклеточного РШМ, эпителиальных поражений (SIL) посредством комбинированного анализа кольпоскопических паттернов и результатов тестирования на наличие ВПЧ определенных типов. Чувствительность, специфичность, положительная и отрицательная прогностическая ценность для кольпоскопии с применением ИИ в сочетании с типированием ВПЧ при сопоставлении с патолого-анатомическими результатами составили соответственно 0,956 (43/45), 0,833 (5/6), 0,977 (43/44), 0,714 (5/7).
Особого внимания, по нашему мнению, заслуживает полученный авторами вышеупомянутый показатель AUC±SE (стандартная ошибка), составивший 0,963±0,026, что, безусловно, подтверждает заключение об оптимальности применения технологий ИИ для дифференциации кольпоскопических паттернов.
L. Hu и соавт. [54] также представили данные о возможной имплементации автоматизированной визуальной оценки цервикограммы для высокоточного выявления случаев предрака/рака (AUC=0,91).
C. Yuan и соавт. [55] сообщают, что при тестировании своей системы ИИ получили данные о чувствительности, специфичности и точности модели классификации для дифференциации отрицательных кольпоскопических паттернов от положительных. Уровни указанных показателей соответственно составили 85,38; 82,62 и 84,10% при AUC=0,93. Авторы пришли к выводу о высокой точности модели в плане дифференциации патологии шейки матки, ориентированной на кластеризацию между LSIL (CIN1) или HSIL (CIN2/3) на основе ИИ.
X. Tan и соавт. [56] в 2021 г. сообщили, что технологии ИИ могут обеспечить высокоточный быстрый скрининг рака с использованием тонких препарированных цитологических тестовых изображений. Предложенная авторами система классифицирует изображения и создает отчет приблизительно за 3 мин при чувствительности 99,4%, специфичности 34,8% и AUC=0,67. По нашему мнению, уровни последних двух показателей не позволяют рекомендовать данную систему как оптимальный компонент скрининговой программы, так как низкая специфичность исследования приведет к множественным ложноположительным результатам и неоправданным направлениям пациенток на дальнейшее обследование, что обусловит низкую клинико-экономическую эффективность скрининговых мероприятий.
Заключение
В заключение следует отметить, что анализ вышеприведенных данных делает очевидной целесообразность дальнейшего усовершенствования и внедрения алгоритма скрининговой диагностики предраковых состояний шейки матки и выявления РШМ посредством ИИ. В целом мы разделяем мнение многих исследователей [26—33, 55], что у технологии кольпоскопии с использованием ИИ определенно есть значимое будущее. Наиболее актуальными критериями соответствия потребностям конкретных стран для подобных программ, несомненно, явятся их клинико-экономическая эффективность с учетом социально-демографической характеристики когорты, чувствительности и специфичности тестов, воспроизводимости компонентов программы и локального менталитета. В дальнейшем данный подход может послужить адекватной моделью для внедрения ее адаптированных модификаций в странах с аналогичными уровнем дохода и индикаторами харатеристики когорты. При этом одной из важнейших вех на пути повышения эффективности менеджмента данного контингента больных станет, на наш взгляд, применение системы ИИ в качестве облигатного базового компонента стратегии скрининговой диагностики РШМ. Более того, внедрение высокоточной системы ИИ не только послужит надежным «помощником» начинающим специалистам, но и в значительной мере будет способствовать повышению скорости их профессионального роста и, как следствие, улучшению качества услуг здравоохранения в данной сфере.
Автор заявляет об отсутствии конфликта интересов.