Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Кузнецов Н.С.

ФГБОУ ВО «Саратовский государственный медицинский университет им. В.И. Разумовского» Минздрава России

Скибицкая М.В.

ФГБУ «Национальный медицинский исследовательский центр эндокринологии» Минздрава России

Вайншток А.П.

ФГБУН «Институт проблем передачи информации им. А.А. Харкевича» Российской академии наук

Ващенко Е.А.

ФГБУН «Институт проблем передачи информации им. А.А. Харкевича» Российской академии наук

Прогноз рецидива при папиллярном раке щитовидной железы по дооперационным данным

Авторы:

Кузнецов Н.С., Скибицкая М.В., Вайншток А.П., Ващенко Е.А.

Подробнее об авторах

Прочитано: 1168 раз


Как цитировать:

Кузнецов Н.С., Скибицкая М.В., Вайншток А.П., Ващенко Е.А. Прогноз рецидива при папиллярном раке щитовидной железы по дооперационным данным. Хирургия. Журнал им. Н.И. Пирогова. 2024;(9):76‑85.
Kuznetsov NS, Skibitskaya MV, Vaynshtok AP, Vashchenko EA. Prediction of papillary thyroid cancer recurrence according to preoperative data. Pirogov Russian Journal of Surgery. 2024;(9):76‑85. (In Russ.)
https://doi.org/10.17116/hirurgia202409176

Рекомендуем статьи по данной теме:
Ос­лож­не­ния и тех­ни­чес­кие ас­пек­ты бе­зо­пас­ной дис­сек­ции тка­ней при про­ве­де­нии эн­дос­ко­пи­чес­кой ге­ми­ти­реоидэк­то­мии. Хи­рур­гия. Жур­нал им. Н.И. Пи­ро­го­ва. 2024;(9):66-74
Ле­че­ние вы­па­де­ния пря­мой киш­ки пос­ле прок­топ­лас­ти­ки у ре­бен­ка с ат­ре­зи­ей пря­мой киш­ки. Хи­рур­гия. Жур­нал им. Н.И. Пи­ро­го­ва. 2024;(9):106-109
Рос­сий­ский кон­сен­сус по ле­че­нию внут­ри­пе­че­ноч­ной хо­лан­ги­окар­ци­но­мы. Хи­рур­гия. Жур­нал им. Н.И. Пи­ро­го­ва. 2024;(10):7-20
Прог­нос­ти­чес­кая шка­ла для ран­не­го вы­яв­ле­ния ос­лож­нен­но­го те­че­ния пос­ле­опе­ра­ци­он­но­го пе­ри­ода у па­ци­ен­тов, опе­ри­ро­ван­ных на груд­ном от­де­ле аор­ты: post-hoc ана­лиз ди­на­ми­ки би­омар­ке­ров. Хи­рур­гия. Жур­нал им. Н.И. Пи­ро­го­ва. 2024;(10):38-48
Бо­ле­вые точ­ки те­ра­пии ак­не сис­тем­ным изот­ре­ти­но­ином. Кли­ни­чес­кая дер­ма­то­ло­гия и ве­не­ро­ло­гия. 2024;(4):459-466
Мес­то и роль ком­прес­си­он­ной те­ра­пии при сов­ре­мен­ном ма­ло­ин­ва­зив­ном ле­че­нии ва­ри­коз­ной бо­лез­ни. Фле­бо­ло­гия. 2024;(3):246-257
Прог­нос­ти­чес­кое зна­че­ние дис­фун­кции пра­во­го же­лу­доч­ка у па­ци­ен­тов с не­ком­пак­тным ми­окар­дом ле­во­го же­лу­доч­ка. Кар­ди­оло­ги­чес­кий вес­тник. 2024;(3):62-70
По­зит­рон­но-эмис­си­он­ная то­мог­ра­фия, сов­ме­щен­ная с ком­пью­тер­ной то­мог­ра­фи­ей, с 11С-ме­ти­они­ном как не­за­ви­си­мый пре­дик­тор без­ре­ци­див­ной вы­жи­ва­емос­ти у боль­ных с диф­фуз­ны­ми гли­ома­ми без му­та­ции в ге­не IDH1. Жур­нал «Воп­ро­сы ней­ро­хи­рур­гии» име­ни Н.Н. Бур­ден­ко. 2024;(5):6-13
Ана­лиз от­да­лен­ных ре­зуль­та­тов хи­рур­ги­чес­ко­го ле­че­ния па­ци­ен­тов с си­но­ви­аль­ны­ми кис­та­ми фа­се­точ­ных сус­та­вов по­яс­нич­но-крес­тцо­во­го от­де­ла поз­во­ноч­ни­ка. Жур­нал «Воп­ро­сы ней­ро­хи­рур­гии» име­ни Н.Н. Бур­ден­ко. 2024;(5):38-45

Введение

Современной задачей и тенденцией в медицине является персонализация лечебного процесса. Это требует анализа индивидуальных факторов больного, своевременной диагностики и выбора оптимальной тактики лечения [1]. Папиллярный рак щитовидной железы (ПРЩЖ) является наиболее распространенным эндокринным злокачественным заболеванием [2, 3]. Он составляет примерно 85% [4] среди дифференцированного рака щитовидной железы. Несмотря на то что ПРЩЖ хорошо дифференцирован и имеет низкую частоту местной инвазии, метастазы опухоли в лимфатические узлы (ЛУ) встречаются довольно часто [5]. Примерно у половины пациентов, у которых клинически диагностирован папиллярный рак, выявляется рецидив в течение 5 лет после первичного хирургического лечения [6]. Кроме того, выделяют гистологические варианты более агрессивного течения с отчетливыми клиническими, патологическими и молекулярными особенностями. К наиболее агрессивным вариантам относятся ПРЩЖ из высоких клеток, ПРЩЖ из столбчатых клеток, ПРЩЖ из клеток типа «сапожных гвоздей» (hobnail variant), а также диффузно-склерозирующий вариант ПРЩЖ. На его долю приходится около 5% [7, 8] всех случаев РЩЖ. Эти случаи имеют более высокую частоту рецидива и метастазирования, а также в некоторых наблюдениях отсутствует чувствительность к терапии радиоактивным йодом (RAI) [9].

Материал и методы

Эффективная тактика лечения ПРЩЖ учитывает стадию заболевания, которая устанавливается в процессе обследования. Если осуществляется хирургическое лечение, то стадия заболевания уточняется после операции (морфологического исследования). Предоперационное суждение (дооперационное стадирование, врачебный прогноз) о фактической стадии заболевания является приближенной оценкой послеоперационного стадирования и основывается на данных дооперационной диагностики (ультразвуковое исследование (УЗИ) щитовидной железы и региональных ЛУ, тонкоигольной аспирационной биопсии щитовидной железы — ТАБ). Различия в оценках до- и послеоперационного стадирования рассматриваются как диагностические ошибки. Эти ошибки, по данным работ [10, 11], встречаются в 25—40% случаев: гипердиагностика выявляется в 52—75% случаев, а гиподиагностика — в 20—25% случаев [11]. Наличие ошибок ведет либо к ухудшению результатов лечения больных (в случае недооценки стадии опухолевого процесса), либо к ухудшению качества жизни пациентов (в случае неадекватного объема оперативного вмешательства — 38,7%) [10].

Применяются две тактики хирургического лечения. Стандартной операцией при ПРЩЖ является экстрафасциальная тиреоидэктомия. Данный тип операции снижает риск летальности и прогрессирования заболевания, а также сопряжен с минимальным риском осложнений [12]. Гемитиреоидэктомию обычно выполняют у пациентов с папиллярной карциномой щитовидной железы низкого и среднего риска. Кроме того, по данным некоторых авторов [13], профилактическая центральная лимфодиссекция шеи значительно снижает риск рецидива в центральном отделе у пациентов, перенесших гемитиреоидэктомию.

Для выбора адекватной тактики лечения предпочтительно установить истинную стадию заболевания еще до операции. При выставлении стадии при ПРЩЖ опираются на результаты клинического, инструментального, гистологического и лабораторного обследования больного, а также на наличие или отсутствие отдаленных метастазов в региональные ЛУ [12].

Точность УЗ-диагностики в выявлении ЛУ различна, она во многом зависит от локализации ЛУ, качества аппаратуры, а также опыта исследователя [14, 15]. УЗ-характеристики ЛУ, включая увеличение объема, изменения формы, нечеткие границы, внутреннюю кальцификацию и некроз, имеют диагностическую ценность при дифференциации доброкачественных и злокачественных узлов [16, 17].

Таким образом, разработка методов прогнозирования фактической стадии ПРЩЖ и возможности рецидива на основе комплекса дооперационных показателей является актуальной проблемой при выборе тактики лечения заболевания в дооперационный период. Частным случаем этой проблемы является задача прогнозирования агрессивного статуса опухолевого процесса у больных с ПРЩЖ.

Материал исследования (выборка)

В работе использованы данные пациентов, представленные в историях болезни из базы данных ГНЦ РФ ФГБУ «Национальный медицинский исследовательский центр эндокринологии» Минздрава России. Материал содержит сведения о 1002 больных за период с 2017 по 2023 г. с диагнозом злокачественного новообразования щитовидной железы (ПРЩЖ) и проходивших оперативное лечение в хирургическом отделении НМИЦ эндокринологии. Из этих пациентов на данном этапе исследования выбран 101 пациент, из которых у 47 выявлен рецидив, и 54 пациента без рецидива в течение 5 лет после первичного оперативного лечения. На рис. 1 представлены гистограммы распределения пациентов по полу и возрасту. Средний возраст пациентов составил 45,7 лет.

Рис. 1. Гистограммы распределения пациентов по полу и возрасту.

Данные о пациентах включали: пол, возраст, дата первичной диагностики, дата первичной операции, УЗ-характеристики первичной опухоли (размер, контур, эхогенность, кальцинаты), количество метастазов; УЗ-характеристики ЛУ (количество пораженных ЛУ, контур, эхоструктура); уровень кальцитонина в крови, данные в соответствии с международной классификацией BETESDA (стандартизация цитологических критериев результатов тонкоигольной аспирационной биопсии узлов щитовидной железы); данные системы TIRADS для унифицированной оценки узловых образований щитовидной железы [18]; наличие микрокальцинатов; преобладание толщины узла над шириной (в УЗ-диагностике это соответствует термину «вертикальная пространственная ориентация узла» [19]); неровные контуры и выраженная гипоэхогенность [18, 19]; данные международной системы классификации TNM, описывающей распространение опухолевого процесса в щитовидной железе (T1—T4), вовлечение в процесс регионарных ЛУ (N0/N+) и отсутствие/наличие отдаленных метастазов (M0/M1); данные о послеоперационных осложнениях. Данные о наличии или отсутствии рецидива являлись целевым фактором.

Для ввода показателей пациентов в ЭВМ была применена специальная интерактивная программа, которая позволяет вводить числовые, текстовые и отдельные значения списочных данных. На выходе программы генерируется таблица в формате Excel, строками которой являются пациенты (объекты), а столбцами значения закодированных показателей и номер класса, к которому относится пациент (нет рецидива — 1, есть рецидив — 2). Эта таблица представляет конечный перечень объектов, для которых известно, к какому из классов они принадлежат и исходную информацию о них для решения задачи обучения классификации.

Для управления вводом данных применятся специальный язык разметки текста, который позволяет различать типы данных и осуществлять логические переходы, в зависимости от значения заглавного атрибута группы показателей, например, показатель «УЗИ ЛУ — патология» может принимать 2 значения: «патологии нет/патология есть». В случае если «патологии нет» при вводе автоматически пропускается запрос всех показателей, наблюдаемых при наличии патологии.

На рис. 2 представлена программа ввода: в левом окне осуществляется ввод значений показателей, а в правом отображаются введенные показатели, что позволяет проверить и исправить ошибки ввода непосредственно перед записью данных пациента в таблицу.

Рис. 2. Программа ввода показателей.

В левом окне осуществляется ввод значений показателей, а в правом — отображаются введенные показатели.

Полный список введенных в ЭВМ показателей, их идентификаторы и кодировка приведены в приложении 1.

В табл. 1 представлен фрагмент Excel-таблицы закодированных показателей (из-за размера таблицы она разделена в тексте на 2 части). Показатели дооперационного обследования pol — triads и reced используются для нахождения правил прогноза рецидива. Показатели post_oper — ipsi представляют послеоперационное обследование и будут применяться в последующих исследованиях.

Таблица 1. Фрагмент таблицы закодированных показателей (результат программы ввода)

id

nun

yearl

oper_dat

Pol

age

size

cant

Ca

eho

mets

uzi_nodes

Cont_nodes

Ca_nodes

eho_nodes

1

65780\A21

2021

2022

2

54

Z.D

1

2

3

10

2

2

2

4

2

1040\C2021

2020

03.02.2021

1

27

3,0

2

1

3

5

2

1

1

4

3

12116\c2021

2021

01.09.2021

1

43

3,0

2

2

1

5

2

2

1

4

4

7985\c2022

2021

11.02.2022

1

57

5,0

1

1

3

2

2

2

2

4

5

8591\C2022

2021

anp.21

1

27

3,0

2

1

3

1

2

2

1

4

id

nun

tumor

node

n_mtst

ca_bl

betesda

tirads

post_oper

postoper

sosud_omg

qtymorf

ipsi

raced

data_rec

1

657S0\A21

7

7

1

6

3

7

1

1

1

9

1

2

2023

2

1ОМДС2021

7

1

1

1

5

4

1

1

1

5

1

1

1

3

7

7

1

5

3

6

1

1

1

5

1

2

фев. 22

4

79S5\c2O22

ID

1

3

1

5

6

2

3

2

3

1

2

2022

5

S591\C2O22

5

7

1

2

5

5

1

1

1

1

1

2

ион. 21

Методы решения задачи

В качестве основы для нахождения решающих правил, разделяющих рассматриваемые 2 класса и позволяющих осуществлять прогноз рецидива, на данном этапе исследований был использован метод и программный комплекс «Фрагмент-потенциал», разработанный в Институте проблем передачи информации им. А.А. Харкевича РАН, в связи с решением задач диагностики и прогнозирования в медицине и обладающий широким диапазоном свойств и возможностей для решения задач в различных предметных областях.

Метод «Фрагмент-потенциал» основан на поиске подмножеств показателей (признаков) и правил попарно разделяющих классы (фрагмент) и последующем голосовании таких правил для принятия решения в «пространстве голосов» (потенциал) [20—23].

Идея алгоритма «Фрагмент» заключается в следующем: по учебной выборке, в которой известна принадлежность объектов к классам, в пространстве описаний для каждого показателя может быть найдена точка (узел), по одну из сторон от которой оказываются объекты какого-либо одного из классов, а по другую — все остальное (практически, однако, алгоритм допускает и не совсем «чистые» разделения). Условие, при котором объекты одного класса располагаются по одну сторону от выбранной точки, запоминается как условие выполнения правила узла. При обучении объекты, удовлетворяющие условию узла, отделяются и далее при построении данного правила не рассматриваются. Процесс продолжается до тех пор, пока не будут разделены все объекты обоих классов обучающей выборки, или дальнейшее разделение не будет возможно, или не будет выполнено ограничение по количеству показателей, входящих в правило. Алгоритмом допускается попадание в отделяемые объекты объектов другого класса, их доля определяется задаваемым параметром. Выбор показателей осуществляется по «качеству» разделения — при определении узла выбирается показатель, лучший по некоторому заданному критерию разделения классов. Простейший показатель качества — доля отделяемых объектов. Последовательное применение разделений объектов классов приводит к созданию кусочно-линейного решающего правила (разделителя). Таким образом, алгоритм «Фрагмент» позволяет находить маломерные (обычно их размерность до 5) просто интерпретируемые кусочно-линейные решающие правила на основании известных характеристик объектов.

Каждое решающее правило — это последовательность узлов, каждый из которых содержит имя и значение некоторого признака из выборки данных, условие «≤» или «>» для вычисления принадлежности объекта к классу, за который голосует данный узел, номер этого класса (неравенство в узле определяет с какой стороны от значения признака лежат убираемые объекты). В алгоритме настраиваются следующие параметры: минимальное и максимальное количество узлов в правиле, количество разрешенных отделяемых объектов альтернативного класса, количество генерируемых правил.

Пример структуры и свойств правила представлены в виде табл. 2. В выборке 101 пациент, из них объектов 1-го класса в выборке (пациенты без рецидива) — 54, объектов 2-го класса в выборке (пациенты с рецидивом) — 47.

Таблица 2. Пример структуры и свойств правила

Узел

Действие

Окл

Nокл

Nальт

Nост_окл

Nост_альт

1

nodle >6

2

25

3

22

51

2

size ≤0,3

2

1

0

21

51

3

tumor ≤2

2

1

0

20

51

4

cont_nodes ≤1

1

35

4

16

16

5

n_mtst ≤2

2

10

2

6

14

6

size ≤4

1

14

4

2

0

Примечание. Окл — номер отделяемого класса (1˅2); Nокл — количество убираемых объектов отделяемого класса; Nальт — количество убираемых объектов альтернативного класса; Nост_окл — текущее количество оставшихся объектов в отделяемом классе; Nост_альт — текущее количество оставшихся объектов в альтернативном классе.

В приводимом эксперименте программа построила 11 правил, при этом каждое правило может включать не более 7 показателей (задается параметром). Во все правила программа отобрала следующие 13 показателей: age, size, mets, uzi_nodes, cont_nodes, eho_nodes, qty_nodes, tumor, nodle, n_mtst, ca_bl, betesda, tirads (см. приложение 1).

Рассмотрим генерацию множества решающих правил («голосов»). Для поиска множества «голосов» применяется поиск с вычеркиванием. Для этого перед поиском следующего решающего правила исключаются признаки, с которых начинался синтез предшествующих правил. Таким образом, хотя каждое решающее правило маломерно, в получаемый набор «голосов» включается значительная часть показателей исходного пространства и тем самым реализуется избыточность, обеспечивающая надежность результатов.

Отметим, что исключение части признаков из рассмотрения в силу градиентного характера поиска алгоритмом «Фрагмент» решающего правила, не сильно влияет на возможности последующего синтеза. Нормой при этом является полная неповторимость последующих решающих правил, что особенно хорошо заметно при поиске таким способом первых решающих правил, когда свободных признаков еще много.

Кроме того, у алгоритма «Фрагмент» имеются различные возможности, основанные на вариациях основных параметров программы, определяющих конкретный вид оценки качества, приоритеты классов, расположение узлов, допустимую долю пропуска «чужих» при отделении объектов и т. д. Для нахождения решающих правил были опробованы различные варианты значений параметров. В приводимом эксперименте из последующего применения исключались показатели, выбираемые первыми на предшествующих шагах.

В исследовании применен метод классификации, когда решение принимается в результате голосования по некоторому множеству решающих правил. Метод основан на следующей гипотезе: если объект обладает большей частью закономерностей, которым удовлетворяет весь класс, то он удовлетворяет этому классу. Множество закономерностей может быть найдено лишь в том случае, если пространство показателей обладает избыточностью. Алгоритм голосования широко используется в задачах медицинской диагностики и прогнозирования.

Ниже приведены результаты экзамена для 3 пациентов, указаны показатели в правилах, по которым программой принимается решение о принадлежности к одному из классов, а также указан класс. Алгоритм допускает вхождение показателей в несколько правил. Приведем примеры голосования решающих правил, относящих пациента к одному из классов или отказу от классификации («не известно»).

Программа сгенерировала 11 решающих правил с максимальным числом узлов (показателей) равным 7, однако для каждого прецедента число сработавших правил может быть разным. В приводимом эксперименте решение принимается в пользу одного из классов при условии, если разница между голосами, отданными за классы, не менее 5 (порог может меняться), в противном случае, решение о принадлежности к одному из классов не принимается. Каждое правило представлено своими узлами», приведены узлы правил до момента принятия решения по данному пациенту.

Пример 1. Пациент Id=1, истинный класс — 2, экзамен (голосование) класс — 2. Все правила отнесли пациента ко 2-му классу — прогнозируется рецидив. В решение вошли 9 правил, все правила проголосовали за 2-й класс:

mets>0+tumor≤10+tirads≤7+age>18++age≤68+size≤3 2 класс

qty_nodes>0+tumor≤10+tirads≤7+age>18++age≤68+size≤3 2

uzi_nodes>1+tumor≤10+age≤68+age>18++tirads≤7+size≤3 2

eho_nodes>1+tumor≤10+age≤68+age>18++tirads≤7+size≤3 2

nodle>6 2

size>0.3+cont_nodes>1+age≤68+age>18++tirads≤7+n_mtst≤2 2

cont_nodes>1+age≤68+age>18+tirads≤7+n_mtst≤2 2

age≤68+tirads≤7+ca_bl>5 2

tirads≤7+ca_bl>0+ca_bl≤7+ca_bl>5 2

Кодированные значения вошедших в правила показателей пациента:

id

num

age

size

mets

uzi_ nodes

cont_ nodes

eho_ nodes

qty_ nodes

tumor

node

n_ mtst

ca_bl

betesda

tirads

reced

1

65780/ A21

54

2,0

10

2

2

4

9

7

7

1

6

3

7

2

Решающее правило можно условно записать в виде конъюнкции четырех неравенств соответствующих узлов, относящих прецедент к одному из классов (size — размер опухоли, nodle — N:TNM, n_mtst — метастазы M:TNM, ca_bl — кальцитонин): size≤3 ^ nodle>6 ^ n_mtst≤2 ^ ca_bl>5.

Пример 2. Пациент Id=11, истинный класс — 1, экзамен (голосование) класс — 1. Все правила отнесли пациента 1-му классу — рецидив не прогнозируется. В решение вошли 8 правил, все правила проголосовали за 1-й класс:

mets>0+tumor>10 1 класс

qty_nodes>0+tumor>10 1

uzi_nodes>1+tumor>10 1

eho_nodes>1+tumor>10 1

nodle≤6+size>0.3+tumor>2+cont_nodes≤1 1

tumor>3+size>0.3+cont_nodes≤1 1

size>0.3+cont_nodes≤1 1

cont_nodes≤1 1

Значения вошедших в правила показателей пациента:

id

num

age

size

mets

uzi_ nodes

cont_ nodes

eho_ nodes

qty_ nodes

tumor

node

n_mtst

ca_bl

betesda

tirads

reced

11

12116/ C20

43

4,0

3

2

1

4

4

12

5

1

2

3

4

1

Решающее правило можно условно записать в виде конъюнкции значений двух соответствующих узлов, относящих прецедент к одному из классов (tumor — T:TNM, cont_nodes — контур л/у): tumor>10 ^ cont_nodes=1.

Пример 3. Пациент Id=19, истинный класс — 1, экзамен (голосование) класс не определен, 4 правила отнесли пациента к 1-му классу, 3 правила — ко 2-му классу. В решение вошли 7 правил:

mets>0+tumor>10 1 класс

qty_nodes>0+tumor>10 1

uzi_nodes>1+tumor>10 1

eho_nodes>1+tumor>10 1

nodle≤6+size>0.3+tumor>2+cont_nodes>1+n_mtst≤2 2

size>0.3+cont_nodes>1+age≤68+age>18+tirads≤7+n_mtst≤2 2

cont_nodes>1+age≤68+age>18+tirads≤7+n_mtst≤2 2

Значения вошедших в правила показателей пациента:

id

num

age

size

mets

uzi_nodes

cont_nodes

eho_nodes

qty_nodes

tumor

node

n_mtst

ca_bl

betesda

tirads

reced

19

14454/ C20

28

1,0

4

2

2

4

4

13

2

1

4

4

6

1

Решающее правило можно записать в виде конъюнкции двух показателей (tumor — T:TNM, n_mtst — M:TNM): tumor>10 ^ n_mtst≤2.

Выполнен экзамен на обучающей выборке и методом скользящего контроля. Результаты экзамена на учебной выборке представлены в табл. 3. Класс 1 — нет рецидива, класс 2 — рецидив.

Таблица 3. Результаты экзамена на учебной выборке

Level

True

Error

True_1

True_2

False_1

False_2

Unm_1

Unm_2

Sum_1

Sum_2

1

86

13

43

43

10

3

1

1

54

47

2

85

13

42

43

10

3

2

1

54

47

3

81

12

42

39

9

3

3

5

54

47

4

79

6

42

37

3

3

9

7

54

47

5

79

5

42

37

3

2

9

8

54

47

Примечание. Level — порог (разница между количеством голосующих правил за каждый класс); True — количество правильно классифицируемых пациентов в обоих классах; Error — количество ошибок в двух классах; True_1 и True_2 — количество правильно классифицируемых пациентов за 1-й и 2-й классы соответственно; False_1 и False_2 — количество ошибок за 1-й и 2-й классы соответственно; Unm_1 и Unm_2 — «не знаю» за 1-й и 2-й классы соответственно; Sum_1 и Sum_2 — количество пациентов в 1-м и 2-м классах соответственно.

Исходя из результатов в табл. 3, определяется порог (Level), используемый для прогноза в рабочем режиме. Для описываемого эксперимента целесообразно значение порога 2 или 3. При Level=2 доля правильно классифицированных рецидивов (вероятность обнаружения рецидива, чувствительность) TPR=True_2/Sum_2=43/47=0,91, доля «пропущенных» случаев рецидива (вероятность пропуска цели) FNR=1-TPR=0,09, доля правильно классифицированных «не рецидивов» (специфичность) TNR=True_1/Sum_1=42/54=0,78, доля (вероятность) ложных тревог (рецидива нет, а прогноз рецидива есть) FPR=1-TNR=0,22. Доля ошибочных классификаций Perr=(False_1+ False_2)/(Sum_1 +Sum_2)=(10+3)/(54+47)=0,13.

Другими словами, чувствительность прогностического алгоритма достигает 91% при специфичности 78%, а вероятность ошибки составляет 13%.

Метод скользящего контроля

Скользящий контроль или кросс-проверка или кросс-валидация (cross-validation, CV) — процедура эмпирического оценивания качества алгоритмов, обучаемых по прецедентам. Фиксируется некоторое множество разбиений (обычно 5—10) исходной выборки на две подвыборки: обучающую и контрольную. Для каждого разбиения выполняется настройка алгоритма по обучающей подвыборке, затем оценивается его средняя ошибка на объектах контрольной подвыборки. Оценкой скользящего контроля называется средняя по всем разбиениям величина ошибки на контрольных подвыборках. Если выборка независима, то средняя ошибка скользящего контроля дает несмещенную оценку вероятности ошибки. Скользящий контроль является стандартной методикой тестирования и сравнения алгоритмов классификации, регрессии и прогнозирования.

В наших экспериментах мы использовали 10 разбиений, таким образом в контрольную выборку включались 10 пациентов, случайно отобранных из всей выборки. Для каждой группы проводилось обучение на оставшихся 91 пациенте, подобным путем было выполнено 10 испытаний.

Пример одного испытания — скользящий контроль №3.

Экзаменационная (контрольная) выборка:

num obj 37 43 68 83 57 48 86 20 27 15

true_cl 2 1 2 1 2 1 1 1 2 2

exm_cl 2 2 2 1 2 2 1 1 0 2,

где num obj — номер пациента из полной выборки, true_cl — истинный класс, exm_cl — результат экзамена для каждого пациента.

Результат экзамена:

ex_1Cl ex_2C unkn_cl sum

1Cl 4 1 0 5

2Cl 0 4 1 5

Ntrue=8 Nerr=1 Nunkn=1,

где ex_1Cl, ex_2Cl — результат экзамена в соответствующих классах, unkn_cl — класс «не знаю», sum — количество пациентов в каждом классе, Ntrue — количество правильных, Nerr — количество неправильных, Nunkn — количество «не знаю».

Агрегированные результаты 10 испытаний методом скользящего контроля представлены в табл. 4.

Таблица 4. Агрегированные результаты 10 испытаний методом скользящего контроля

ex_1Cl

ex_2Cl

unkn_cl

Sum

ex_1Cl

ex_2Cl

unkn_cl

Sum

1Cl

5

2

0

7

2Cl

0

3

0

3

1Cl

3

1

0

4

2Cl

1

5

0

6

1Cl

4

1

0

5

2Cl

0

4

1

5

1Cl

3

0

0

3

2Cl

1

5

1

7

1Cl

4

1

0

5

2Cl

0

4

1

5

1Cl

3

3

0

6

2Cl

0

4

0

4

1Cl

3

2

0

5

2Cl

0

4

1

5

1Cl

4

2

0

6

2Cl

0

4

0

4

1Cl

4

1

0

5

2Cl

0

5

0

5

1Cl

5

0

0

5

2Cl

0

4

1

5

1Total

38

13

0

51

2Total

2

42

5

49

Суммарные результаты по всем группам

ex_1Cl

ex_2Cl

unkn_cl

sum

1Cl

38

13

0

51

2Cl

2

42

5

49

Суммарные показатели по 2-м классам:

Ntrue=80, Nerr=15, Nunkn=5.

Суммарная доля правильно классифицированных рецидивов по 10 испытаниям скользящего контроля (вероятность обнаружения рецидива, чувствительность)

TPR=ex_2Cl_Total/Sum_2Total=42/49=0.86,

доля «пропущенных» случаев рецидива (вероятность пропуска цели) FNR=1-TPR=0,14, суммарная доля правильно классифицированных «не рецидивов» (специфичность)

TNR=ex_1Cl_Total/Sum_1Total=38/51=0,75,

суммарная доля (вероятность) ложных тревог (рецидива нет, а прогноз рецидива есть) FPR=1-TNR=0,25, суммарная доля ошибочных классификаций

Perr=(ex_2Cl_1Total+ex_1Cl_2Total)/(Sum_1Total+ Sum_2Total)=(13+2)/(51+49)=0,15.

Таким образом, при экзамене методом скользящего контроля чувствительность прогностического алгоритма достигает 86% при специфичности 75% и вероятности ошибки 15%. Полученные результаты близки к результатам по полной выборке, что подтверждает эффективность используемого метода для прогноза рецидивов.

Заключение

Таким образом, выполненные пилотные эксперименты показали наличие закономерностей в данных, позволяющих решать задачу прогноза рецидивов по показателям дооперационного обследования, и перспективность применяемого метода. Продолжение исследований предполагает увеличение выборки минимум до 200 пациентов, привлечение неформализованных врачебных знаний для формирования решений, применение других методов классификации.

Дальнейшее изучение проблемы может помочь врачам в принятии решений, а также внести значительные коррективы в тактику ведения пациентов с ПРЩЖ.

Авторы заявляют об отсутствии конфликта интересов.

Приложение/Application 1

Полный список введенных в ЭВМ показателей, их идентификаторы и кодировка

1. Номер карты: num.

2. Пол [женский — 1; мужской — 2]: pol.

3. Возраст (18—110): age (1—110).

4. 1-я диагностика, год: year 1.

5. Дата операции: oper_dat.

6. УЗИ опухоли:

— размер опухоли, см: size;

— контур — неровность\нечеткость [нет — 1; да — 2]: cont;

— кальцинаты [нет — 1; да — 2]: Ca;

— эхоструктура [изоэхогенная — 1; гиперэхогенная — 2; гипоэхогенная — 3]: eho.

7. Метастазы, кол-во: mets.

8. УЗИ лимфатических узлов, патология [НЕТ — 1; ДА — 2]: uzi_nodes:

— контур — неровность\нечеткость [нет — 1; да — 2]: cont_nodes;

— кальцинаты [нет — 1; да — 2]: Ca_nodes;

— эхоструктура [изоэхогенная — 2; гиперэхогенная — 3; гипоэхогенная — 4]: eho_nodes;

— количество метостатических узлов: qty_nodes.

9. TNM:

T [T –1; Tx –2; T0 –3; T1 –4; T1a –5; T1b –6; Т2 –7; Т3 –8; Т3а –9;

Т3b –10; Т4 –11; Т4а –12; Т4b –13]: tumor

N [Nx –1; N0 –2; N0a –3; N0b –4; N1 –5; N1a –6; N1b –7]: nodle

M (metastases) [M0 –1; M1 –2; MX –3]: n_mtst.

10. Кальцитонин, кровь пг/мл: ca_bl.

11. BETESDA — диагностическая категория, риск %.

[Недиагностический или неудовлетворительный пунктат (1—4) — 1; доброкачественный (0—3) — 2; атипичная или фолликулярные изменения неопределенного значения (5—15) — 3; фолликулярная или подозрение на фолликулярную неоплазию (15—30) — 4; подозрение на рак (60—75) — 5; Рак (97—99) — 6 ]: betesda.

12. TIRADS [TIRADS 1-1; TIRADS 2-2; TIRADS 3-3; TIRADS 4a-4; TIRADS 4b-5; TIRADS 4c-6; TIRADS 5-7; TIRADS 6-8]: tirads.

13. Послеоперационные осложнения: [НЕТ — 1; ДА — 2]: post_oper.

14. Осложнение [кровотечение — 2; парез возвратного нерва — 3; гипокальцемия — 4]: postoper.

15. Сосудистая инвазия (морфология) [НЕТ — 1; ДА — 2]: sosud_inv.

16. Количество пораженных лимфатических узлов (морфология): qty_morf.

17. Геми+ипсилатеральная лимфоаденоктомия [НЕТ — 1; ДА — 2]: ipsi.

18. Рецидив [НЕТ — 1; ДА — 2]: reced.

19. Дата рецидива: data_rec.

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail

Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.