Введение
По данным международной медицинской статистики, преждевременными родами (ПР) заканчиваются от 5 до 18% беременностей [1]. ПР по праву считают главной причиной неонатальной смертности и второй по значению причиной смерти детей в возрасте до 5 лет [2].
По оценкам экспертов, 15 млн недоношенных детей ежегодно сталкиваются с многочисленными угрозами здоровью. Отсутствие должной иммунологической компетентности подвергает недоношенных повышенному риску развития инфекционных осложнений, включая пневмонию, менингит и сепсис [3]. В результате незрелости органов и систем у младенцев возникает риск развития тяжелых, инвалидизирующих неонатальных осложнений, включая внутрижелудочковые кровоизлияния, некротизирующий энтероколит, респираторный дистресс-синдром, детский церебральный паралич, задержку развития, сенсорные нарушения — зрительный и слуховой дефицит. В старшем возрасте дети, рожденные до доношенного срока, нередко сталкиваются с проблемами обучения в школе и расстройствами поведения. [4]. ПР также ассоциируются с более высоким риском развития хронических заболеваний, особенно часто — с сердечно-сосудистой патологией и сахарным диабетом 2-го типа. Помимо медицинских, социальных и психологических проблем ПР наносят ощутимый экономический ущерб здравоохранению и государству. Это связано с высокими финансовыми затратами интенсивной терапии недоношенных, длительной госпитализацией и дорогостоящим медикаментозным лечением, реабилитацией, применением социальных и специализированных образовательных услуг [5].
R. Romero и соавт. в ходе метаанализа и систематического обзора выявили эффективность препаратов прогестерона для вагинального введения в профилактике ПР. Метаанализ показал, что применение препаратов прогестерона для вагинального введения на 41% снижает частоту неонатальной смерти и наиболее распространенных неонатальных осложнений, включая респираторный дистресс-синдром, внутрижелудочковые кровоизлияния, некротизирующий энтероколит и неонатальный сепсис [6]. В ходе метаанализа, выполненного Z. Jin и соавт., оценена польза применения акушерского разгружающего пессария. Эта мера снижает частоту токолиза и абдоминального родоразрешения, не повышает риск преждевременного разрыва плодных оболочек и не влияет на перинатальные исходы [7]. В результате систематического обзора, проведенного R. Brown и соавт., беременным с преждевременными родами в анамнезе и укорочением шейки матки менее 25 мм рекомендован цервикальный серкляж с профилактической целью [8]. Таким образом, результаты проведенных масштабных исследований свидетельствуют о том, что прогестерон для вагинального введения, акушерский разгружающий пессарий и цервикальный серкляж являются эффективными мерами профилактики ПР. Между тем применение указанных мер является обоснованным у беременных группы высокого риска и необходимым для предотвращения возможного наступления ПР у данной категории пациенток, исключая неоправданную госпитализацию и медицинские вмешательства.
В результате многоцентровых исследований выявлены основные детерминанты ПР. К ним относятся: индекс массы тела (ИМТ), возраст [9], паритет, уровень артериального давления, многоплодие, раннее начало половой жизни, преждевременные роды в анамнезе [5], предшествующая клиновидная биопсия шейки матки [10], укороченная длина шейки матки [11], биомеханические свойства шейки матки [12], миома матки и аденомиоз, повышение концентрации фибронектина плода [13], инфекции, гастроэзофагеальная рефлюксная болезнь (ГЭРБ), Helicobacter pylori, системная красная волчанка и применение гидроксихлорохина [10].
Несмотря на внушительные изыскания в области оценки риска ПР с установлением предикторов ПР и разработкой эффективных мер профилактики, вопрос прогнозирования и предупреждения ПР остается открытым, поскольку на протяжении многих лет отсутствует заметное снижение частоты ПР. Для решения поставленной задачи разработаны калькуляторы, приложения и шкалы. К их числу относится упрощенный калькулятор, представленный Фондом фетальной медицины (The Fetal Medicine Foundation), он предназначен для расчета риска по данным анамнеза и результатам цервикометрии [5]. Для количественной оценки риска ПР исследователи King’s College London разработали мобильное приложение QUiPP, которое включает сведения акушерского анамнеза, историю коррекции истмико-цервикальной недостаточности, цервикометрию, количественную оценку фибронектина плода (qfFN) [14]. I. Tekesin и соавт. продемонстрировали шкалы прогноза ПР CLEOPATRA I и CLEOPATRA II, основанные на оценке возраста беременной, акушерского анамнеза, данных цервикометрии и уровня фетального фибронектина [15].
Известные нам исследования по прогнозированию ПР охватывают только ограниченное количество факторов риска, исходя из априорного ложного представления, что в отношении остальных факторов сохраняются равные условия. Все прочие «переменные», за исключением изучаемых факторов риска, принимались исследователями как «постоянные». Следовательно, такие прогнозы могут отличаться недостаточно высокой точностью в условиях реальной клинической практики. Устранение указанного недостатка возможно за счет включения в прогнозные алгоритмы большего числа признаков и учета сложных взаимосвязей этих признаков с точки зрения прогноза, что эффективно решается с помощью различных методов машинного обучения. Консолидация достижений медицинской науки, современных информационных технологий, таких как искусственный интеллект, облачные вычисления и большие данные, позволяет повысить точность прогнозирования неблагоприятных исходов беременности, предоставляя клиницистам возможность своевременной эффективной профилактики осложнений.
Искусственный интеллект
С каждым годом понятия «искусственный интеллект», «машинное обучение» и «глубокое обучение» получают все более широкое распространение и вызывают все больший интерес во всем мире. Эта тенденция прослеживается по росту количества указанных ключевых слов с 10 до 100, зарегистрированных в поисковой системе Google, за период с 2013 по 2018 г. [10].
Искусственный интеллект (ИИ, англ. Artificial Intelligence, AI) — термин, описывающий применение компьютерных технологий с целью моделирования интеллектуального поведения и критического мышления, сопоставимого с человеческим. Впервые этот термин предложил Джон Маккарти в 1956 г. на конгрессе, посвященном данному вопросу, и описал научные и технические подходы к созданию машин, обладающих интеллектом [16]. Однако проблема имитации человеческого поведения и мышления была поднята еще раньше, в 1950 г., Аланом Тьюрингом. С тех пор вычислительная мощность компьютеров выросла до мгновенных вычислений и возможности оценивать данные в режиме реального времени [17]. ИИ прочно укрепился во многих сферах повседневной жизни, существенно облегчая ее. Прежде всего его влияние прослеживается в автоматизированном производстве и роботизированной технике, общественном транспорте, системах наблюдения, банковских системах, системах статистики, умном быте и личных помощниках (Siri, Alexa, Google Assistant и др.). В последние годы ИИ начали активно внедрять в различные сферы медицины, открывая огромные перспективы для улучшения качества здравоохранения, и одним из важнейших аспектов применения ИИ является прогнозирование и выявление групп риска.
Машинное обучение (МО, англ. Machine Learning, ML) является одной из ключевых технологий искусственного интеллекта. МО предназначено для извлечения знаний из больших массивов данных [18]. Относительно эффективности МО действует следующее правило: чем больше данных, тем точнее прогноз. Медицина является областью знаний, в которой накоплены колоссальные объемы данных, следовательно, применение МО в медицине, безусловно, оправданно и весьма выгодно экономически. По предварительным оценкам, использование МО на больших наборах данных в медицине и фармацевтике может сократить расходы на $70—100 млрд в год [19].
Наиболее рациональным представляется применение методов МО в медицине для диагностики, классификации и прогнозирования. Традиционные, широко используемые статистические методы, в числе которых следует отметить линейную и логистическую регрессию, позволяют делать прогнозы относительно новых данных, но основная цель применения названных методов заключается в поиске взаимосвязей между известными переменными [20]. Между тем в клинической практике вклад предикторов разный, отношения не линейны, и описать взаимоотношения между переменными крайне сложно. Таким образом, получить точный прогноз при помощи простого статистического анализа будет практически невозможно. На решение таких сложных задач с множеством неравнозначных переменных и направлены технологии МО. Ключевое различие между традиционными статистическими подходами и МО заключается в том, что в случае МО математическая модель учится на примерах, а не программируется с помощью правил [19].
МО включает в себя элементы математики, статистики и информатики [20]. Весь процесс МО представляет собой последовательные шаги.
Первый шаг — это импорт входных данных, а также их подготовка с целью дальнейшего анализа, в результате чего формируются матрицы терминов [21].
Второй шаг — обучение алгоритмов МО. Наиболее распространенными в медицине алгоритмами являются дерево решений, наивный байесовский классификатор, случайный лес, машина опорных векторов, искусственная нейронная сеть и глубокая нейронная сеть [10].
Дерево решений (Decision tree) является структурой по типу блок-схемы по методу ветвления, которая отображает каждый возможный итог принятия решений. Дерево решений состоит из внутренних узлов (каждый означает тест на независимую переменную), ветвей (каждая обозначает результат теста) и конечных узлов (каждый представляет зависимую переменную) [10].
Наивный байесовский классификатор (Naive Bayes classifier) делает прогнозы на основе теоремы Байеса. Суть теоремы в том, что вероятность зависимой переменной при определенных значениях независимых переменных может быть получена из вероятностей независимых переменных, исходя из заданного значения зависимой переменной [10]. При помощи данного метода возможен расчет более точного прогноза относительно новой информации на основе уже имеющихся данных.
Случайный лес (Random forest) представляет собой комбинацию нескольких деревьев решений, каждое из которых строится по выборке, получаемой из исходной обучающей выборки с помощью бутстрэппинга (bootstrap — это метод определения доверительных интервалов статистических оценок) [22, 23]. В процессе алгоритма данные разбиваются на множество выборок, для каждой из которой создается модель. Когда необходим прогноз, его вычисляет каждая модель, а затем значения усредняются, тем самым повышается точность оценки выходного значения. Данный метод имеет такие преимущества, как гарантия от переобучения (overfitting), возможность выявления наиболее информативных признаков, возможность производить измерение признаков на разных шкалах (числовых, порядковых, номинальных) [23].
Машина опорных векторов (Support vector machine, SVM) создает линию или пространство («гиперплоскость»), разделяющее данные с максимальным расстоянием между разными группами [18]. Суть метода заключается в сортировке данных по категориям при помощи алгоритма. Это происходит при наличии набора обучающих примеров, которые помечены как принадлежащие к той или иной категории. После обучения алгоритм строит модель, которая также будет относить новые данные к одной из категорий.
Искусственная нейронная сеть (ИНС, Artificial neural network, ANN) — это сеть узлов ввода/вывода (так называемых нейронов), связанных между собой. Данный алгоритм представляет собой имитацию работы головного мозга человека. Искусственная нейронная сеть обычно состоит из одного входного слоя, одного, двух или трех скрытых слоев и одного выходного слоя. Связь нейронов происходит на основании весов (числовых значений, показывающих, какое влияние оказывают нейроны предыдущего слоя на нейроны последующего слоя) в порядке от входного слоя с каждым последующим. Этот процесс называется алгоритмом прямой связи. Затем эти веса корректируются в зависимости от того, какой вклад они внесли в потери (разница между фактическими и прогнозируемыми конечными результатами). Данная операция выполняется в порядке весов в выходном слое и каждом предыдущем слое. Этот процесс называется алгоритмом обратного распространения ошибки. Алгоритмы повторяются до тех пор, пока не формируется определенная модель для точного прогнозирования зависимой переменной [18].
Глубокая нейронная сеть (глубокое обучение, Deep neural network, Deep learning) — это подгруппа искусственной нейронной сети, число скрытых слоев которой больше пяти [10].
Все перечисленные методы могут быть использованы как по отдельности, так и в различных комбинациях (ансамблевое обучение).
Третий шаг — проверка алгоритмов МО. Производится проверка путем сравнения прогнозов, полученных при помощи алгоритмов, с истинными прогнозами, составленными на основании уже известных данных.
Четвертый шаг — оценка чувствительности (доля истинно положительных результатов), точности (доля верно классифицированных случаев) и специфичности метода (доля истинно отрицательных результатов).
Пятый шаг — построение кривых рабочих характеристик приемника (ROC-кривых, кривых ошибок). Они показывают зависимость количества положительных случаев от количества неверно классифицированных отрицательных случаев. При визуальном сравнении нескольких ROC-кривых не всегда можно выявить наиболее эффективную модель. В таком случае используется метод сравнения кривых, называемый оценкой площади под кривыми (AUC). При этом можно считать, что чем выше показатель AUC, тем более высокой прогностической ценностью обладает модель (все прогнозы верны, если AUC равна 1).
Шестой шаг — использование моделей на новых данных.
Алгоритмы МО можно разделить на два больших класса: без учителя (Unsupervised learning) и с учителем (Supervised learning) — в зависимости от того, на каком опыте они могут обучаться [24]. В случае обучения без учителя алгоритм должен самостоятельно выявить нужные переменные в наборе данных, содержащих множество признаков. Поскольку данные не маркируются метками (не размечены), алгоритм должен извлечь данные из общего массива без подсказки. При обучении с учителем алгоритму предлагается датасет, в котором каждый пример маркирован меткой (размечен). В процессе такого обучения происходит наблюдение нескольких примеров. Считается, что эти метки установлены неким учителем, который объясняет алгоритму, что ему нужно делать. Одним из частных вариантов обучения с учителем является обучение с подкреплением (Reinforcement learning), где учителем назначена внешняя среда, при этом между внешней средой и алгоритмом обучения формируется контур с обратной связью.
Примеры успешного применения алгоритмов искусственного интеллекта для прогнозирования преждевременных родов
Интеллектуальные алгоритмы имеют большие перспективы в оценке риска ПР, и работы по внедрению МО в прогнозную аналитику проводятся в медицинских центрах многих стран.
I. Vovsha и соавт. в Центре вычислительных систем Колумбийского университета (США) провели исследование по расчету риска ПР при помощи алгоритмов ИИ с участием 2929 женщин. Авторы сравнили чувствительность и специфичность логистической регрессии и машины опорных векторов, и последний метод показал наиболее высокую чувствительность — 60%. Что касается логистической регрессии, то чувствительность метода составила 24,2% у первобеременных и 18,2% у повторнобеременных. В ходе данного исследования определены следующие факторы риска: материальный статус, раса и возраст матери [25].
Исследование A.-G. Malea и соавт. в Политехническом университете Тимишоары (Румыния) с целью прогноза ПР при помощи алгоритмов МО проведено на основе данных, полученных из записей 546 медицинских карт в больнице Тимишоары. Дизайн исследования представлен несколькими этапами. На первом этапе проводилась предварительная обработка данных, которая включала их выборку и разметку. Следующим этапом была кластеризация — привязка к каждому объекту набора измерений, формирующих векторы. Кластеризацию проводили при помощи алгоритмов Agglomerative Nesting (AGNES) и DIvisive ANAlysis (DIANA), после чего осуществляли классификацию с применением наивного байесовского классификатора и SVM для перекрестной проверки. В результате исследования выявлены следующие факторы риска ПР: курение, возраст старше 35 лет, низкий уровень образования. При этом применение наивного байесовского классификатора показало точность 88% [26].
Для оценки эффективности прогнозирования сверхранних ПР C. Gao и соавт. провели исследование с применением ансамбля рекуррентных нейронных сетей (RNNs). Исследование выполнено на основе данных 25 689 электронных медицинских карт, собранных за 10 лет в Медицинском центре Университета Вандербильта (Нашвилл, штат Теннесси, США). Структура исследования построена на сочетании обработки естественного языка (NLP) и МО. Процесс состоял из четырех последовательных этапов: 1) встраивание слов; 2) бутстрэппинг с целью формирования когорт; 3) МО на основе упорядоченной логистической регрессии, SVM и RNNs; 4) ранжирование медицинских концепций на основе статистических моделей. В результате исследования установлены основные факторы риска ПР, такие как многоплодие, короткая длина шейки матки, гипертонические расстройства, системная красная волчанка, а также прием гидроксихлорохина. При этом выявлена высокая производительность RNNs (чувствительность 0,965, AUC 0,827) по сравнению с логистической регрессией (чувствительность 0,819, AUC 0,749) и SVM (чувствительность 0,660, AUC 0,728) [4].
A. Koivu и M. Sairanen из Университета Турку в Финляндии (факультет технологий будущего) провели исследование с целью оценки эффективности алгоритмов МО. Для исследования использованы данные почти 16 млн наблюдений из Центра по контролю и профилактике заболеваний США (CDC) и Департамента здравоохранения и психической гигиены (NYC), полученные за 3 года. Определено 26 предикторов мертворождения и ПР, в отношении которых проводился корреляционный анализ. После обезличивания массива проведена подготовка данных посредством применения критериев включения, разметки и стандартизации. Для обучения алгоритмов применены 70% массива данных, 10% — для построения моделей и 10% — для оценки эффективности. Из алгоритмов МО применялись ИНС, дерево решений с повышением градиента и ансамбли алгоритмов. В качестве метода сравнения применена логистическая регрессия. Среди предикторов ПР прогностическую значимость продемонстрировали диабет, артериальная гипертензия, ПР в анамнезе, лечение бесплодия и вспомогательные репродуктивные технологии, а также семейное положение. В ходе исследования выявлена высокая эффективность методов МО (AUC для ПР составила 0,64) [27]. Этот показатель значительно превышал данные, полученные при помощи стандартных методов статистики, что говорит о высокой прогностической способности алгоритмов МО.
Результаты исследования, проведенного на основе медицинских карт 596 пациентов клиники Анам (Сеул, Корея), представили K.-S. Lee и K. Ahn из Медицинского колледжа Корейского университета, Сеул, Корея (соответственно из Центра искусственного интеллекта и с кафедры акушерства и гинекологии). В исследование включены данные, содержащие демографические показатели, ИМТ, употребление алкоголя или табакокурение, наличие сахарного диабета или артериальной гипертензии. Данные разделены следующим образом: 50% — для обучения, 50% — для контроля. С целью анализа применены шесть методов МО: ИНС, логистическая регрессия, дерево решений, наивный байесовский классификатор, случайный лес и SVM. Определены наиболее значимые предикторы ПР: низкий уровень образования, низкий уровень дохода, значение ИМТ, артериальная гипертензия, сахарный диабет, клиновидная биопсия шейки матки, возраст, наличие ПР в анамнезе, миома матки и аденомиоз. При этом алгоритмы МО продемонстрировали высокую точность — 0,9 для ИНС и логистической регрессии, 0,89 для случайного леса, а также показатели AUC — 0,62 для ИНС и 0,64 для случайного леса [28].
Задача исследования, проведенного K. Lee и соавт. в отделении акушерства и гинекологии клиники Анам (Сеул, Корея), заключалась в оценке значимости факторов риска ПР — ГЭРБ и периодонтита. В работе использованы сведения 731 родильницы с ПР. В исследование включены следующие оценочные признаки: 1) демографические показатели, социально-экономические факторы, уровень образования и дохода, регион проживания; 2) наличие или отсутствие периодонтита, ГЭРБ, инфицирования Helicobacter pylori; 3) ИМТ, уровень артериального давления, курение, употребление алкоголя, наличие сахарного диабета, прием лекарств, паритет, анамнез ПР, наличие или отсутствие гинекологических заболеваний, искусственное оплодотворение, предшествующая биопсия шейки матки, пол ребенка. Полученные данные разделены 50:50 для обучения и тестирования. Для анализа использованы следующие методы: логистическая регрессия (как метод контроля), дерево решений, случайный лес, наивный байесовский классификатор, SVM, ИНС. В результате исследования выявлено, что наибольший вклад в развитие ПР вносили такие предикторы, как ИМТ, возраст, паритет, уровень систолического артериального давления, многоплодие, образование, пол ребенка, ПР в анамнезе, заболевания верхних отделов желудочно-кишечного тракта, наличие инфицирования Helicobacter pylori, регион проживания и гестационный сахарный диабет. Вклад ГЭРБ и периодонтита в развитие ПР оказался не столь существенным, указанные факторы заняли 13-е и 22-е места соответственно. В описанном исследовании точность и AUC случайного леса (0,868 и 0,69) и логистической регрессии (0,873 и 0,76) сопоставимы [29], что говорит о перспективности методов МО.
Сотрудники кафедры акушерства и гинекологии Университета науки и технологий (Иордания) и Школы информационных технологий короля Абдаллы II (Иорданский университет, Амман, Иордания) H. Rawashdeh и соавт. при помощи алгоритмов МО разработали модели прогноза для беременных с высоким риском ПР, перенесших процедуру серкляжа. Цель создания первой модели заключалась в разработке системы принятия решений для врачей касательно необходимости применения серкляжа. Модель предсказывает, будет ли беременность пролонгирована более 26 нед и есть ли потенциальная ценность процедуры наложения шва на шейку матки для пролонгирования беременности. Вторая модель направлена на прогнозирование срока наступления спонтанных родов после процедуры серкляжа с целью своевременного применения необходимых мер акушерской и неонатальной помощи. Исследование проведено на основе данных 274 беременных высокого риска с перенесенной процедурой серкляжа, полученных из отдела фетальной медицины больницы Нового Южного Уэльса (Австралия) в период с января 2003 г. по декабрь 2014 г. При построении моделей учитывались следующие предикторы ПР: возраст матери, акушерский и гинекологический анамнез, аномалии матки, длина шейки матки, кровотечение из половых путей, срок беременности на момент процедуры, данные ультразвукового исследования, тип шва (Макдональда или Широдкара), количество плодов, применение вагинального прогестерона. После предварительной обработки данных задействованы алгоритмы МО: дерево решений, случайный лес, ИНС и метод k-ближайших соседей (k-NN, алгоритм, который учится маркировать точки на основе уже промаркированных соседних точек). Для получения более сбалансированных данных использованы коэффициенты предискретизации от 100 до 400%. Для первой модели лучшую эффективность показал случайный лес с G-средним 0,96 (среднее геометрическое значение чувствительности и специфичности) и чувствительностью 1,0. Для второй модели также наилучшая модель построена на алгоритме случайного леса, ее коэффициент корреляции составил 0,752. Авторы планируют дальнейшую модификацию моделей и внедрение разработанных моделей в клиническую практику [30].
H.-Y. Chen и соавт. из Национального университета Тайваня оценили факторы риска ПР при помощи искусственной нейронной сети и дерева решений. Для анализа получены данные 910 пар «мать — ребенок» из Национального регистра Тайваня. Исследование состояло из сбора и подготовки данных в виде опроса, включающего возраст, образование, род деятельности, рост, вес, образ жизни и уровень дохода. Все данные разделены на 50% для обучения и 50% для тестирования. Из тысячи входных данных при помощи ИНС выделены 15 наиболее важных предикторов, а при помощи дерева решений данные классифицированы. ИНС показала высокую точность, составляющую от 80 до 100% для разных факторов риска. В результате исследования выявлено, что наибольший вклад в развитие ПР имели многоплодие, кровотечение во время беременности, возраст, гинекологические заболевания, ПР в анамнезе, масса тела до беременности, употребление алкоголя и курение матери, а также факторы, связанные с образом жизни отца, такие как курение и употребление алкоголя [31].
Результаты приведенных выше исследований представлены в сводной таблице.
Таблица. Результаты исследований по применению методов машинного обучения в прогнозировании преждевременных родов
Исследование (страна) | Выборка, n | Методы МО | Оценка эффективности | Факторы риска |
США (Колумбийский Университет) | 2929 | SVM | Чувствительность 0,60 | Материальный статус; раса; возраст |
Румыния | 546 | Наивный байесовский классификатор; SVM | Точность 0,88 | Курение; возраст >35 лет; низкий социальный статус |
США (Университет Вандербильта) | 25 689 | SVM | Чувствительность 0,96; AUC 0,822 | Многоплодие; короткая шейка матки; гипертония; системная красная волчанка; гидроксихлорохин |
RNNs | Чувствительность 0,66; AUC 0,72 | |||
Финдяндия | Около 16 млн | ИНС; дерево решений | AUC 0,64 | Диабет; гипертония ПР в анамнезе; бесплодие; ВРТ; семейный статус |
Корея (Медицинский колледж Корейского университета) | 596 | ИНС | Точность 0,9; AUC 0,62 | Низкий уровень образования; низкий уровень дохода; ИМТ; гипертония; диабет; биопсия шейки матки; возраст; ПР в анамнезе; миома матки; аденомиоз |
Случайный лес | Точность 0,89; AUC 0,64 | |||
дерево решений; наивный байесовский классификатор; SVM | ||||
Корея (клиника Анам Корейского университета, Сеул) | 731 | Дерево решений; случайный лес; наивный байесовский классификатор; SVM; ИНС | Точность 0,86; AUC 0,69 | ИМТ; возраст; паритет; уровень АД; многоплодие; образование; пол ребенка; ПР в анамнезе; заболевания верхних отделов ЖКТ; H. pylori; регион проживания; ГСД |
Иордания | 274 | Случайный лес; дерево решений; ИНС; k-NN | G-среднее 0,96; чувствительность 1,0 | Возраст матери; акушерский и гинекологический анамнез; аномалии матки; длина шейки матки; кровотечение; данные УЗИ; тип шва; количество плодов; вагинальный прогестерон |
Тайвань | 910 | ИНС; дерево решений | Точность от 0,80 до 1,0 | Многоплодие; кровотечение; возраст; гинекологические заболевания; ПР в анамнезе; курение и употребление алкоголя; масса тела |
Примечание. ИНС — искусственная нейронная сеть; МО — машинное обучение; k-NN — метод k-ближайших соседей; SVM — машина опорных векторов; RNNs — рекуррентные нейронные сети; ПР — преждевременные роды; ВРТ — вспомогательные репродуктивные технологии; ИМТ — индекс массы тела; АД — артериальное давление; ЖКТ — желудочно-кишечный тракт; ГСД — гестационный сахарный диабет.
Ограничения применения методов искусственного интеллекта
Как и любой прогностический метод, МО не лишено ограничений и недостатков.
Этические аспекты. Используемые данные должны быть конфиденциальны, поэтому необходимо регулировать доступ к персональным сведениям о пациентах для соблюдения конфиденциальности, но без ограничения процессов МО [32]. Наиболее рациональным решением соблюдения защиты персональных данных при использовании технологий ИИ является создание «цифровых двойников» — обезличенных копий сведений о пациентах.
Качество данных (Data quality). Заполнение медицинской документации зачастую не преследует цели их статистической обработки, поэтому вносимая информация нередко носит неструктурированный характер. Ведение документации в электронном виде активно развивается практически во всех странах мира, однако большинство врачебных записей и протоколов диагностики и лечения представлены в неструктурированном виде. В решении этой проблемы поможет компьютерная обработка текста на естественном языке — NLP.
Поиск «правды». Источники могут содержать сложные описания, не передающие истинных данных в контексте. В таком случае трудно определить, какие данные являются «правдивыми». Кроме того, по мере появления научных достижений ранее «правдивые» научные данные могут стать «неправдивыми» [33].
Выбор моделей обучения. В случае, когда выбирают слишком сложную модель обучения, вероятность ошибки алгоритма при тестировании существенно выше, чем средняя ошибка, полученная при обучении. Такой неудачный выбор обозначают термином «переобучение». В случае, когда выбрана недостаточно сложная модель обучения, алгоритм не полностью использует данные и не обеспечивает получение достаточно малой величины средней ошибки на обучающей выборке. Указанный неподходящий выбор именуют «недообучением».
«Пропасть» ИИ (AI chasm). Проблема внедрения обученных и проверенных алгоритмов МО в клиническую практику заключается в том, что даже качественный, точный алгоритм может оказаться неэффективным при использовании данных другого качества.
Заключение
Преждевременные роды на протяжении многих лет остаются ведущей причиной неонатальной заболеваемости, инвалидизации и перинатальной смертности. Предмет обсуждения носит социальный, медицинский и экономический характер, приводит к значительным демографическим потерям и наносит ощутимый финансовый ущерб государству. Разработанные меры профилактики преждевременных родов эффективны в группах высокого риска, однако существующие методы оценки риска базируются на сведениях об установленных предикторах, значимость которых точно не определена, поэтому в настоящее время продолжается активный поиск достоверных и надежных методов прогноза. В обзоре показано, что наиболее перспективным способом решения проблемы предикции преждевременных родов может стать внедрение в прогнозную аналитику технологий искусственного интеллекта. Такая консолидация медицинской науки и передовых компьютерных технологий позволит установить триггеры преждевременных родов, точнее прогнозировать неблагоприятные исходы беременности, что предоставит клиницистам возможность своевременной эффективной профилактики перинатальных потерь.
Финансирование: исследование выполнено при финансовой поддержке Министерства науки и высшего образования Российской Федерации в рамках Соглашения №075-15-2021-665.
Исследование выполнено на уникальной научной установке «Многокомпонентный программно-аппаратный комплекс для автоматизированного сбора, хранения, разметки научно-исследовательских и клинических биомедицинских данных, их унификации и анализа на базе ЦОД с использованием технологий искусственного интеллекта» (регистрационный номер 2075518).
Авторы заявляют об отсутствии конфликта интересов.