Серьезную проблему для практических врачей до настоящего времени представляет диагностика характера образований яичников. Вместе с тем для выбора правильной тактики оперативного вмешательства необходимо с определенной долей вероятности знать характер образования [1—9].
В современной медицине диагноз опухоли яичников устанавливают в основном на основании трансабдоминального и трансвагинального ультразвукового сканирования, исследования кровотока по методу Допплера и магнитно-резонансной томографии, определения опухолевых антигенов. Однако дооперационное определение истинной природы образований и опухолей яичников встречает значительные трудности. Точность безопасной эхографической диагностики, по данным разных авторов, колеблется от 50 до 80% [10—13].
Целью настоящего исследования явилось улучшение качества дифференциальной диагностики доброкачественных, пограничных и злокачественных опухолей яичников с помощью эхографии и допплерометрии и построения логистической регрессионной модели на примере наличия этой патологии у беременных.
Материалы и методы
В статистическое исследование включили данные о 222 проспективно обследованных в 12—39 нед беременности пациенток, у которых при УЗИ обнаруживались опухолевидные образования или опухоли яичников.
У 14 пациенток в момент обследования гестационный возраст плода составил до 12 нед, у 67 — от 12 до 24 нед, у 55 — от 24 до 36 нед и у 86 — более 37 нед. До 12 нед беременности использовали влагалищный датчик, от 12 до 24 нед — влагалищный и абдоминальный датчики, после 24 нед — только абдоминальный. Оперативному вмешательству в I—II триместре подверглись 12 пациенток, в III — 4, кесарево сечение с удалением образования яичника было проведено у 47 пациенток, прооперированы в течение 3 мес после родов — 85, от 3 мес до 1 года — 64 пациентки, у которых были выявлены доброкачественные образования сразу после родов. Полученные результаты сопоставлялись с морфологическим исследованием.
На основании ультразвукового и морфологического диагнозов пациентки были разделены на две группы.
В 1-ю группу вошли 83 беременные, у которых были выявлены опухолевидные образования: у 25 — киста желтого тела, у 1 — лютеома беременных, у 1 — фолликулярная киста, у 30 — параовариальная киста и у 26 — эндометриоидная киста. Во 2-ю группу включили 126 беременных, у которых выявили истинные опухоли яичников: у 58 — эпителиальные опухоли (46 серозных и 12 муцинозных цистаденом), у 6 — опухоли стромы полового тяжа (4 фибромы и 2 текомы), у 62 — тератомы.
Кроме того, были обследованы 13 пациенток, из которых у 8 выявили пограничные папиллярные серозные цистаденомы, у 2 — дисгерминомы, у 2 — незрелые тератомы и у 1 — андробластому.
Ультразвуковое исследование (УЗИ) проводили на аппарате Сименс Х-300, модель СА 94043 (США). При проведении УЗИ определяли размер яичниковых образований, одно- или двустороннюю локализацию, структуру, количество камер, эхогенность, толщину стенки образования и ее наружные и внутренние контуры, толщину неизмененной ткани яичника, локализацию сосудов и показатели допплерометрии — индекс резистентности (ИР) и пульсационный индекс (ПИ). Затем изучаемые показатели кодировали следующим образом.
1. Локализация: односторонняя — 1, двусторонняя — 2.
2. Ткань яичника: определяется — 1, не определяется — 2.
3. Величина неизмененной ткани яичника: не визуализируется — 1, визуализируется менее 1 см — 2, визуализируется более 1 см — 3.
4. Количество камер: однокамерное — 1, двухкамерное — 2, многокамерное — 3.
5. Размер образования: 3—5 см — 1, 6—10 см — 2, более 10 см — 3.
6. Толщина стенки: 1—3 мм — 1, более 3 мм — 2.
7. Структура: кистозная — 1, кистозно-солидная — 2, солидно-кистозная — 3, солидная — 4.
8. Содержимое: однородное жидкостное — 1, неоднородное жидкостное со взвесью — 2, неоднородное жидкостное с перегородками — 3, неоднородное жидкостное с папиллярными разрастаниями — 4, иные структуры — 5, недифференцируемая ткань — 6, плотная ткань — 7.
9. Наружные контуры: четкие — 1, нечеткие — 2, бугристые — 3, ровные — 4.
10. Внутренние контуры: ровные — 1, неровные — 2, четкие — 3, нечеткие — 4, не определяются — 5.
11. Эхогенность: высокая — 1, средняя — 2, низкая — 3, анэхогенная — 4, анэхогенная с плотным компонентом — 5.
12. Локализация сосудов: в папиллярных разрастаниях — 1, в стенке — 2, в перегородках — 3, в пристеночном компоненте — 4, другое — 5, не определяется — 6, в стенке и разрастаниях — 7, в плотном компоненте — 8.
13. Кровоток: определяется — 1, не определяется — 2.
14. Характер кровотока: артериальный — 1, венозный — 2, мозаичный — 3.
15. Индекс резистентности: высокий (более 0,7) — 1, средний (0,5—0,7) — 2, низкий (менее 0,5) — 3, нет — 4.
16. Пульсационный индекс: высокий (более 1,5) — 1, средний (1—1,5) — 2, низкий (менее 1) — 3.
На этапе подготовки ультразвуковые и допплерометрические данные, полученные при описании визуализируемых опухолевидных образований и опухолей малого таза, преобразовывались в коды. Для статистической обработки данных применяли прикладной пакет программ SPSS 15.0, использовали описательную статистику и корреляционный анализ по методу Спирмена. Для поиска достоверных различий между выборками использовали критерий Вилкоксона—Манна—Уитни, различия считались статистически значимыми при значении p<0,05. Кроме того, данные подвергали частотному анализу путем построения кросс-таблиц.
Прогностические модели создавались для дифференциальной диагностики истинных опухолей от опухолевидных образований и доброкачественных опухолей от пограничных и злокачественных.
Среди 222 пациенток истинные опухоли были у 139, опухолевидные образования — у 83. Пациенток с пограничными и злокачественными опухолями в массиве было 13, отсутствие злокачественной опухоли установлено у 210 (табл. 1).
Для обоих прогнозируемых состояний было проведено разбиение (общепринятая терминология математиков) исходных данных на обучающую и тестовую выборки в соотношении 60/40%. В группах сохранялось соотношение наблюдений исследуемому состоянию.
Затем была произведена оценка значимости различий по всем входным параметрам. Оказалось, что УЗ-параметры имеют статистически значимые различия (табл. 2).
Для построения моделей использовали методы бинарной логистической регрессии и дискриминантного анализа.
Бинарная логистическая регрессия — метод нелинейного регрессионного анализа, позволяющий прогнозировать параметры, имеющие два состояния. Этот метод активно используется для построения прогностических моделей в биологии и медицине. Для логистической регрессии вероятность попадания в исследуемую группу рассчитывается по формуле
где πi = многочлен Bi*xi I = 0...n
Построение модели сводится к нахождению коэффициентов B[i](I = 0...n, B[0] — регрессионная константа).
Оценка переменных происходит методом минимизации логарифмической функции подобия (Log likehood function), являющейся аналогом расстояния в линейных регрессионных моделях.
Log likehood function:
где yi — наблюдаемые значения.
Дискриминантный анализ использовался для принятия решения о том, какие переменные различают (дискриминируют) две или более возникающие совокупности (группы). В ходе построения модели строилась функция (дискриминант), значение которой определяет отнесение к одной или другой группе. В ходе исследования использовался линейный дискриминантный анализ. Значение дискриминантной функции, разделяющее две группы, всегда принималось равным 0. Для проверки точности построенных моделей использовались методы скользящего экзамена и метод bootstrap.
Скользящий экзамен позволяет проверить качество обучающей выборки. Для проведения анализа из обучающей выборки исключалось одно наблюдение и строилась требуемая модель. Затем проверялась точность диагностики для исключенного наблюдения. Так делалось для определенного количества (или для всех) наблюдений в обучающей выборке. Затем считали количество верных срабатываний модели. Это число являлось уточняющей точности модели, построенной на всей обучающей выборке.
Метод bootstrap заключается в повторяющемся разбиении массива данных на обучающую и тестовую выборки и проверке построенных моделей. Распределение значений точности показывает случайность разбиения исходных данных на обучающую и тестовую выборки, т.е. исключает возможность случайного (и неверного) увеличения точности построенных моделей. В исследовании при проверке методом bootstrap повторение разбиения проводилось 1000 раз.
Для оценки точности моделей, помимо собственно процента верных отнесений, учитывались параметры чувствительности (Se) и специфичности (Sp). Чувствительность равна доле верно определенных случаев более тяжелого состояния среди всех наблюдений с более тяжелым состоянием. Специфичность рассчитывается аналогично для менее тяжелого состояния. Необходимость использования именно этих параметров наиболее актуальна для моделей с неравным разделением по наблюдениям, что имеется в нашем исследовании в части диагностики злокачественных новообразований.
Результаты исследования
Модель для диагностики пограничных и злокачественных опухолей у беременных
С помощью пошагового метода в модель были включены четыре параметра: ткань яичника, ИР, ПИ, расположение сосудов.
Включенные параметры незначительно коррелируют друг с другом, за исключением пары «ИР» — «Расположение сосудов». Однако при удалении любого из этой пары точность модели снижается. Это касается всех последующих моделей (табл. 3).
Полученная модель на тестовой выборке продемонстрировала чувствительность 100% и специфичность 92,3% при суммарной точности модели 92,8%.
Проверка с помощью скользящего экзамена и методом bootstrap показала устойчивость модели. Следует учитывать, что при оценке модели приоритет остается за чувствительностью, а не за точностью модели в сумме.
Построение дискриминантной функции осуществлялось на основе тех же параметров, что и для модели регрессии. Незначительная разница коэффициентов позволяет перейти от сложной функции к модели балльной оценки. Наибольшую значимость имеет коэффициент при параметре (ИР), поэтому высокое значение приравнивается к 2 баллам, каждый из остальных параметров дает один балл. Дискриминантная функция в таком виде приобретает форму суммы баллов. Критическое значение 2 балла, т.е. сумма баллов до 2 включительно означает низкую вероятность злокачественной опухоли, более 2 баллов — высокую вероятность.
На имеющихся данных правило определяет все случаи со злокачественными образованиями и 94% случаев с отсутствием злокачественного образования.
Модель имеет преимущество над непрерывными моделями, в частности в связи с неоднозначностью расположения кодов для расположения сосудов. Простое умножение кода, используемое в непрерывных моделях, уступает по точности определению диагностически важных значений (табл.4).
Дискретная модель обладает сравнимой точностью с непрерывной моделью, при этом имея большую практическую ценность, поскольку может применяться в клинических условиях без необходимости использования вычислительной техники.
Площадь под графиком ROC-кривой для суммы баллов составляет 0,988 (рис. 1).
Модель для диагностики доброкачественных опухолей у беременных
Аналогично с моделью для диагностики злокачественных образований на первом этапе строилась модель логистической регрессии с целью отбора параметров, имеющих максимальное прогностическое значение.
Для диагностики доброкачественных опухолей были отобраны следующие параметры: ткань яичника, структура, количество камер и неизмененная ткань яичника. Корреляция между параметрами незначительная, максимальное значение не превышает 0,3 (табл. 5).
Построенная модель на основе бинарной логистической регрессии имела чувствительность 97% и специфичность 96%. Проверка с помощью скользящего экзамена и методом bootstrap показала устойчивость модели. При скользящем экзамене неправильно диагностировано было лишь одно наблюдение из правильно определенных моделью.
Случайные модели, построенные при проверке методом bootstrap, в среднем были точны на 96,7% (рис. 2).
В отличие от предыдущей модели общая точность определяет качество модели.
Значения коэффициентов одного порядка, отрицательное значение коэффициента для параметра (величина неизмененной ткани яичника) означала то, что принятая кодировка обратно пропорциональна диагностическому значению параметра. В результате мы можем построить дискретную диагностическую функцию, как и в случае со злокачественными новообразованиями. По каждому параметру добавляется 1 балл. Истинная опухоль вероятна при любой сумме баллов выше 0 (табл. 6).
Чувствительность и специфичность модели составляют 97 и 95% соответственно (рис. 3).
Площадь под графиком ROC-кривой для суммы баллов составляет 0,98. Это очень высокий результат, характеризующий высокую эффективность модели для диагностики наличия опухолей.
Обсуждение
Проведенные исследования показали, что предложенные нами логистические регрессионные модели для дифференциальной диагностики доброкачественных, пограничных и злокачественных опухолей яичников у беременных высоко воспроизводимы, обладают высокой чувствительностью и специфичностью. При диагностике доброкачественных опухолей яичников у беременных чувствительность и специфичность модели составляют 97 и 95% соответственно. При диагностике пограничных и злокачественных опухолей яичников у беременных чувствительность модели составляет 100% и специфичность 92,3% при суммарной точности 92,8%. По данным Е.Г. Новиковой и соавт. [10, 11], при оценке ультразвуковых параметров, полученных высококвалифицированными специалистами, возможность выявления пограничных опухолей яичников составила более 50 %. В исследованиях М.А. Громовой и соавт. [12] эта патология выявлялась в 72,6%, по данным Ю.И. Липатенковой и соавт. [13], — в 89% наблюдений. Исследования проводились у небеременных. Зарубежные авторы считают, что у высококвалифицированных врачей при УЗИ чувствительность диагностики рака яичников достигает 96%, специфичность — 90%. У менее квалифицированных врачей эти показатели составляют 86 и 80% соответственно [14].
Таким образом, проведенные нами исследования показали возможность регрессионных логистических моделей помочь практическому врачу своевременно проводить дифференциальную диагностику опухолей яичников у беременных и тем самым использовать рациональную тактику их лечения.