Шаги к персонифицированной терапии рассеянного склероза: прогнозирование безопасности терапии с использованием математического моделирования
Журнал: Журнал неврологии и психиатрии им. С.С. Корсакова. Спецвыпуски. 2018;118(8‑2): 70‑76
Прочитано: 1022 раза
Как цитировать:
Медицинский прогноз определяется как предсказание будущего курса и исхода процессов, связанных с заболеванием, как в случае лечения, так и в случае естественного течения заболевания [1]. Модели медицинской прогностики используются как на индивидуальном уровне для поддержки принятия решений о будущем курсе лечения, так и на уровне групп пациентов для управления ресурсами в здравоохранении [2]. Медицинский прогноз представляет собой рассуждение в условиях неопределенности [3].
На настоящий момент определение прогноза по безопасности используемой терапии является в определенной мере искусством, помноженным на опыт и интуицию врача, однако, учитывая возможности современных методов обработки, выработка прогностического заключения может быть сформулирована как математическая задача, а следовательно, автоматизирована. В этом случае медицинская задача прогнозирования, т. е. классифицирования и отнесения к определенной группе, становится математической задачей распознаваний образцов.
Математические модели медицинского прогнозирования позволяют классифицировать текущее состояние пациента по категориям риска, связанным с его будущим состоянием. Такие модели позволяют численно измерить тяжесть заболевания, состояние здоровья пациента и прогноз эффективности и безопасности будущей терапии. Количественная оценка риска альтернативных медицинских вмешательств позволяет минимизировать риски развития нежелательных явлений и принимать обоснованные решения, как со стороны лечащего врача, так и со стороны пациента [4]. Известны примеры построения прогностических моделей в областях онкологии [5] и инфекционных заболеваний [6].
Для корректного решения этой задачи необходимо определить признаки, обладающие прогностической ценностью, т. е. информативностью. Наиболее пригодным для распознавания объекта является информационный подход, согласно которому информация о признаке рассматривается как достоверное различие между классами образов в пространстве признаков. В гетерогенном признаковом пространстве следует использовать лишь те признаки, которые, с одной стороны, наиболее информативны, а с другой — могут быть в принципе определены имеющимися в распоряжении врача средствами диагностики. Пространство информативных признаков может быть сформировано любым методом, базирующимся на определении расчета информативности и диагностической ценности, наиболее популярным из которых является метод Кульбака: J (xy/A1, xy/A2).
Методика расчета информативности признаков по Кульбаку базируется на определении диагностических коэффициентов, рассчитанных для групп пациентов с наличием и отсутствием признака.
Несмотря на неплохие результаты использования данных методов в клинической практике, инструмент не обладает достаточной гибкостью для принятия решения в реальном времени. В этом случае одним из наиболее удобных инструментов для решения задач прогнозирования являются искусственные нейронные сети — мощный и одновременно гибкий метод имитации процессов и явлений. Нейронные сети бывают разные по структуре и по форме, однако у них есть несколько общих черт. Нейросеть получает на входе набор сигналов и выдает соответствующий им ответ (выходные сигналы), являющийся решением некоторой задачи. Как и реальный нейрон, его математический аналог характеризуется своим состоянием и по аналогии может быть либо возбужден, либо заторможен. У каждого нейрона есть входы (афферентное звено — дендриты), на которые нацелены выходы нейронов от предыдущего уровня, а также единственный выход (аксон), сигнал с которого поступает на входы (дендриты) нейронов следующего уровня. Каждый вход (афферентный синапс) характеризуется величиной синаптической связи (также называемой весом Wi), по физическому смыслу, вес каждой синаптической связи — величина возбуждающего или тормозного постсинаптического потенциала. Суммация данных потенциалов в реальности может приводить к формированию критического уровня деполяризации в области аксонального холмика, что в свою очередь сопровождается появлением потенциала действия по аксону. Для математической модели нейрона это соответствует суммированию пришедших к нему сигналов с некоторыми весовыми коэффициентами и дополнительному нелинейному преобразованию этой взвешенной суммы входных данных. Процесс работы нейросети представляет собой движение потока внешних сенсорных данных (от некоторого «входа» к «выходу») и преобразование этих данных. Структура нейросети (количество слоев, их связанность) может быть адаптирована к задаче.
Отличительное свойство нейронных сетей состоит в их способности обучаться на основе экспериментальных данных предметной области. Применительно к медицинской тематике экспериментальные данные представляются в виде множества исходных признаков или параметров объекта и поставленного на их основе диагноза. Наиболее часто обучение нейронной сети представляет собой интеративный процесс (обработка данных, когда действия повторяются многократно, не приводя при этом к вызовам самих себя), в ходе которого подбирается оптимальная комбинация весовых коэффициентов, минимизирующая погрешность определения класса образа, что можно интерпретировать как поиск скрытых нелинейных зависимостей между исходными параметрами и конечным диагнозом [7].
Существует несколько подходов к обучению нейросети, наиболее распространенным методом является так называемое «обучение с учителем», в процессе которого на вход нейронной сети подается последовательность исходных параметров, для которых известен конечный результат [8]. Тщательное формирование обучающей выборки определяет качество работы, а также уровень погрешности нейронной сети. Одной из главных проблем применения нейросетевых технологий является заранее неизвестная степень сложности проектируемой нейронной сети, которой будет достаточно для достоверной постановки диагноза. Так, например, модели с однослойным персептроном способны решать только линейно разделяемые задачи, однако это ограничение преодолимо при использовании многослойных нейронных сетей. В качестве активационной функции для нейронов сети обычно используется наиболее распространенная в многослойных персептронах нелинейная логистическая функция активации.
Обучающая выборка формируется из примеров, каждый из которых представляет собой результат эксперимента предметной области с определенным ответом, объем обучающей выборки определяется эмпирически с учетом имеющегося у исследователя общего объема данных. Если погрешность работы нейронной сети с данными, не участвующими в процессе обучения, находится в пределах установленной нормы, то она обладает хорошей прогностической способностью. Контрольное тестирование проводится на выборке, составленной из случаев, не участвовавших в обучении нейронной сети. С учетом частой в медицинской практике ситуации с отсутствием части исходных данных входной слой модели нейронной сети может быть модифицирован для достижения возможности решения задачи в условиях неполной информации.
На настоящий момент нейросети активно используются для прогнозирования в медицинской практике: в работе W. Hо и соавт. [9] на основании имеющихся на момент начала лечения данных о пациенте прогнозируются исходы лечения гепатоцеллюлярной карциномы, а в работе Е. Fernandez-Blanco и соавт. [10] — потенциальные предикторы частоты эпилептических приступов. В течение 2017 г. было отмечено значимое увеличение исследований, касающихся проблематики рассеянного склероза (РС), в том числе работы, посвященные прогнозированию прогрессирования заболевания [11]. В доступной отечественной и зарубежной литературе отсутствуют сведения об использовании данного метода в прогнозировании безопасности терапии по отдельным нежелательным побочным реакциям (НПР).
В качестве объекта для разработки модели прогнозирования был выбран ГПС как наиболее значимо влияющий на удовлетворенность терапией ПИТРС [12]. В качестве исследуемой популяции — группа больных, использующих ПИТРС, для которых было известно об исходе — наличии или отсутствии НПР через 6 мес терапии.
На первом этапе проводилась оценка достоверного различия по частоте исследуемого фактора в сравниваемых группах с использованием W-критерия Вальда—Вольфовица (данные не представлены в статье в связи с большим объемом информации), затем вычислялись прогностические коэффициенты (ПК), а также коэффициент информативности Кульбака (КИ) для каждой градации фактора. Для определения предсказательной способности признаков использовался r-критерий Спирмена. Прогностический коэффициент рассчитывали по формуле:
ПК=100·lg (Р1/Р2) при наличии фактора;
ПК=100·lg (1—Р1/1—Р2) при отсутствии фактора,
где Р1 и Р2 — частота фактора в сравниваемых группах.
Оценивались также чувствительность и специфичность шкалы, было определено пороговое значение показателя с чувствительностью более 70% и максимальной специфичностью.
На втором этапе на основании полученных данных строилась модель нейронной сети со сложной архитектурой. Для реализации была выбрана модель двуслойной нейронной сети прямого распространения, при этом количество нейронов первого слоя соответствовало числу входящих параметров, число нейронов скрытого слоя подбиралось экспериментально, а число нейронов последнего слоя соответствовало количеству исходов.
Цель исследования — построение математической модели, способной прогнозировать лекарственную безопасность пациента, получающего ПИТРС, в реальном времени на примере прогнозирования риска появления (ГПС).
Были обследованы 457 пациентов с достоверным РС в возрасте от 18 до 68 лет, средний возраст — 38,79 года (37,71—39,87, α<0,05), среди них 112 (24,51%) мужчин и 345 (75,49%) женщин, средняя длительность заболевания на момент обследования составила 122,58 мес (111,15—134,01, α<0,05). Верификация диагноза РС была произведена на основании критериев McDonald (2005 и 2010), клинических данных и характерной картины МРТ. Было исключено наличие других заболеваний, сходных с РС; уровень по шкале EDSS на момент включения составлял от 0 до 6,5 балла, в среднем 2,80 балла (2,63—2,97, α<0,05). В предварительную выборку вошли данные пациентов, полученные в ходе трехлетнего проспективного динамического исследования с частотой наблюдения 1 раз в 6 мес, в окончательную выборку были включены данные тех осмотров, при которых было известно наличие или отсутствие ГПС в течение последующих 6 мес. Всего в анализ было включено 1203 случая, из которых 869 не имели ГПС через 6 мес, и 334 — которые имели ГПС. Наличие ГПС определяли по разработанной ранее методике [13].
В качестве признаков, подлежащих оценке, были использованы только те, которые могли быть определены как при начале терапии у наивных получателей, так и при очередном контрольном визите у опытных получателей. Признаки были проанализированы на предмет достоверности различий с использованием W-критерия Вальда—Вольфовица, на основании полученных данных был проведен расчет ПК и КИ по методу Кульбака для показателей, продемонстрировавших значимые различия. Факторами, повышающими риск развития ГПС в течение следующих 6 мес, являлись: использование ИФН-β-1а, значимая усталость, депрессия и эйфория на момент осмотра, наличие острых респираторных инфекций в течение 2 мес перед осмотром (острый ларингит, Herpes labialis), предыдущее использование ИФН, хронический пиелонефрит и аллергический ринит в анамнезе. Условно «протективными» факторами являлись: использование инъектора, выполнение инъекции до 16:00, аллергия на цитрусовые в анамнезе, получение глатирамера ацетата до момента осмотра.
С целью формирования шкалы оценки риска возникновения ГПС был проведен дополнительный корреляционный анализ с использованием r-критерия Спирмена с целью выявления показателей, обладающих максимальной предсказательной способностью. В качестве референтного показателя была выбрана интенсивность ГПС через 6 мес. С учетом полученных данных из критериев, использовавшихся для расчета коэффициента риска развития ГПС, были исключены показатели с низкими показателями r: хронический пиелонефрит в анамнезе, аллергия на цитрусовые. Остальные показатели были включены в итоговую шкалу, при этом их вес определяли по значению коэффициентов информативности Кульбака, суммарный показатель рассчитывался путем сложения баллов за отдельные показатели с учетом веса и знака (см. таблицу). 

Полученные выше сведения были учтены при анализе данных, полученных в ходе обучения и контрольного тестирования созданной нейронной сети. В качестве исходных данных использовались параметры, продемонстрировавшие наибольшую связь с фактором ГПС, по методу главных компонент. Как указано выше, все имеющиеся значения были случайным образом разделены на две группы, проведено их сравнение по всем исследуемым параметрам, не установлено статистически значимых различий между указанными выборками. В качестве обучающей выборки были отобраны 300 случаев из исследуемой выборки, на которых и была обучена и протестирована нейронная сеть заданной архитектуры. Контрольное тестирование проводилось на выборке, составленной из 904 случаев, не участвовавших в обучении нейронной сети.
Входной слой нейронной сети, выполняющий задачу передачи входных значений на скрытый слой, состоял из 18 нейронов, что соответствовало количеству рассматриваемых исходных параметров для постановки диагноза. В результате экспериментов был выбран персептрон с двумя скрытыми слоями, при этом выходной слой состоял из 1 нейрона, который соответствует вероятностям появления или непоявления ГПС в течение следующих 6 мес.
В процессе обучения было исследовано 576 типов внутренней архитектуры нейросетей, в качестве финальной была выбрана сеть с уровнем предсказательности 80,2%. Модель, приведенная на рис. 2, имеет 
Использование простых методов прогнозирования, например с расчетом КИ по Кульбаку, дает относительно приемлемые значения чувствительности и специфичности для определения 6-месячного риска развития ГПС у пациентов, получающих ПИТРС, как при исходном назначении, так и продолженном наблюдении. По результатам данного этапа работы выявлены факторы, способствующие и препятствующие появлению ГПС, определена методика расчета рисков на основании подсчета интегративного показателя — коэффициента риска развития ГПС в течение последующих 6 мес. Результаты обучения и проверки работоспособности спроектированной нейронной сети показывают ее успешное применение для решения поставленной задачи и способность находить сложные закономерности и взаимосвязи между различными объектами, относящимися к одному классу данных. В частности, использование описанного алгоритма позволяет существенно увеличить чувствительность прогноза с использованием ограниченного массива данных. С математической точки зрения впервые были определены механизм и возможности использования нейросети в условиях неполной исходной информации.
Авторы заявляют об отсутствии конфликта интересов.
*e-mail: nnspirin@yandex.ru
Подтверждение e-mail
На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.
Подтверждение e-mail
Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.