Технологии машинного обучения в КТ-диагностике и классификации внутричерепных кровоизлияний

Читать метаданные

В данном литературном обзоре рассматривается объединенный опыт создания, применения и оценки эффективности технологий машинного обучения в компьютерно-томографической диагностике внутричерепных кровоизлияний. Была проанализирована 21 оригинальная статья по ключевым словам «intracranial hemorrhage», «machine learning», «deep learning», «artificial intelligence», опубликованная за период 2015—2022 гг. Обзор содержит в себе общую информацию о базовых понятиях машинного обучения, а также более подробно рассматривает такие аспекты, как технические характеристики наборов данных, используемых при создании интеллектуальных алгоритмов по описываемому типу клинической задачи, их возможное влияние на эффективность применения и опыт клинической апробации.

Ключевые слова:

внутричерепные кровоизлияния

машинное обучение

искусственный интеллект

глубокое обучение

Авторы:

Сморчкова А.К.

ГБУЗ города Москвы «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы»

ORCID: 0000-0002-9766-3390

Хоружая А.Н.

ORCID: 0000-0003-4857-5404

Кремнева Е.И.

ФГБНУ «Научный центр неврологии»

Петряйкин А.В.

ORCID: 0000-0003-1694-4682

Дата поступления:

13.12.2022

Дата принятия в печать:

27.01.2023

Список литературы:

Cordonnier C, Demchuk A, Ziai W, Anderson CS. Intracerebral haemorrhage: current approaches to acute management. Lancet. 2018;392(10154):1257-1268. https://doi.org/10.1016/S0140-6736(18)31878-6
Expert Panel on Neurologic Imaging; Salmela MB, Mortazavi S, Jagadeesan BD, Broderick DF, Burns J, Deshmukh TK, Harvey HB, Hoang J, Hunt CH, Kennedy TA, Khalessi AA, Mack W, Patel ND, Perlmutter JS, Policeni B, Schroeder JW, Setzen G, Whitehead MT, Cornelius RS, Corey AS. ACR Appropriateness Criteria® Cerebrovascular Disease. Journal of the American College of Radiology. 2017;14(5S):34-61. https://doi.org/10.1016/j.jacr.2017.01.051
Jiang B, Guo N, Ge Y, Zhang L, Oudkerk M, Xie X. Development and application of artificial intelligence in cardiac imaging. The British Journal of Radiology. 2020;93(1113):20190812. https://doi.org/10.1259/bjr.20190812
Fusco R, Grassi R, Granata V, Setola SV, Grassi F, Cozzi D, Pecori B, Izzo F, Petrillo A. Artificial Intelligence and COVID-19 Using Chest CT Scan and Chest X-ray Images: Machine Learning and Deep Learning Approaches for Diagnosis and Treatment. Journal of Personalized Medicine. 2021;11(10):993. https://doi.org/10.3390/jpm11100993
Inkeaw P, Angkurawaranon S, Khumrin P, Inmutto N, Traisathit P, Chaijaruwanich J, Angkurawaranon C, Chitapanarux I. Automatic hemorrhage segmentation on head CT scan for traumatic brain injury using 3D deep learning model. Computers in Biology and Medicine. 2022;146:105530. https://doi.org/10.1016/j.compbiomed.2022.105530
Phaphuangwittayakul A, Guo Y, Ying F, Dawod AY, Angkurawaranon S, Angkurawaranon C. An optimal deep learning framework for multi-type hemorrhagic lesions detection and quantification in head CT images for traumatic brain injury. Applied Intelligence. 2022;52(7):7320-7338. https://doi.org/10.1007/s10489-021-02782-9
Wang X, Shen T, Yang S, Lan J, Xu Y, Wang M, Zhang J, Han X. A deep learning algorithm for automatic detection and classification of acute intracranial hemorrhages in head CT scans. Neuroimage: Clinical. 2021;32:102785. https://doi.org/10.1016/j.nicl.2021.102785
Kumaravel P, Mohan S, Arivudaiyanambi J, Shajil N, Venkatakrishnan HN. A Simplified Framework for the Detection of Intracranial Hemorrhage in CT Brain Images Using Deep Learning. Current Medical Imaging. 2021;17(10):1226-1236. https://doi.org/10.2174/1573405617666210218100641
Xu J, Zhang R, Zhou Z, Wu C, Gong Q, Zhang H, Wu S, Wu G, Deng Y, Xia C, Ma J. Deep Network for the Automatic Segmentation and Quantification of Intracranial Hemorrhage on CT. Frontiers in Neuroscience. 2021;14:541817. https://doi.org/10.3389/fnins.2020.541817
Santhoshkumar S, Varadarajan V, Gavaskar S, Amalraj JJ, Sumathi A. Machine Learning Model for Intracranial Hemorrhage Diagnosis and Classification. Electronics. 2021;10(21):2574. https://doi.org/10.3390/electronics10212574
Mansour RF, Aljehane NO. An optimal segmentation with deep learning based inception network model for intracranial hemorrhage diagnosis. Neural Computing and Applications. 2021;33(20):13831-13843. https://doi.org/10.1007/s00521-021-06020-8
Ker J, Singh SP, Bai Y, Rao J, Lim T, Wang L. Image Thresholding Improves 3-Dimensional Convolutional Neural Network Diagnosis of Different Acute Brain Hemorrhages on Computed Tomography Scans. Sensors. 2019;19(9):2167. https://doi.org/10.3390/s19092167
López-Pérez M, Schmidt A, Wu Y, Molina R, Katsaggelos AK. Deep Gaussian processes for multiple instance learning: Application to CT intracranial hemorrhage detection. Comput Methods Programs Biomed. 2022;219:106783. https://doi.org/10.1016/j.cmpb.2022.106783
Meng F, Wang J, Zhang H, Li W. Artificial Intelligence-Enabled Medical Analysis for Intracranial Cerebral Hemorrhage Detection and Classification. Journal of Healthcare Engineering. 2022;2022:2017223. https://doi.org/10.1155/2022/2017223
Schmitt N, Mokli Y, Weyland CS, Gerry S, Herweh C, Ringleb PA, Nagel S. Automated detection and segmentation of intracranial hemorrhage suspect hyperdensities in non-contrast-enhanced CT scans of acute stroke patients. European Radiology. 2022;32(4):2246-2254. https://doi.org/10.1007/s00330-021-08352-4
Alis D, Alis C, Yergin M, Topel C, Asmakutlu O, Bagcilar O, Senli YD, Ustundag A, Salt V, Dogan SN, Velioglu M, Selcuk HH, Kara B, Ozer C, Oksuz I, Kizilkilic O, Karaarslan E. A joint convolutional-recurrent neural network with an attention mechanism for detecting intracranial hemorrhage on noncontrast head CT. Scientific Reports. 2022;12(1):2084. https://doi.org/10.1038/s41598-022-05872-x
McLouth J, Elstrott S, Chaibi Y, Quenet S, Chang PD, Chow DS, Soun JE. Validation of a Deep Learning Tool in the Detection of Intracranial Hemorrhage and Large Vessel Occlusion. Frontiers in Neurology. 2021;12:656112. https://doi.org10.3389/fneur.2021.656112
Buls N, Watté N, Nieboer K, Ilsen B, de Mey J. Performance of an artificial intelligence tool with real-time clinical workflow integration — Detection of intracranial hemorrhage and pulmonary embolism. Physical Medicine. 2021;83:154-160. https://doi.org/10.1016/j.ejmp.2021.03.015
Danilov G, Kotik K, Negreeva A, Tsukanova T, Shifrin M, Zakharova N, Batalov A, Pronin I, Potapov A. Classification of Intracranial Hemorrhage Subtypes Using Deep Learning on CT Scans. Studies in Health Technology and Informatics. 2020;272:370-373. https://doi.org/10.3233/SHTI200572
Ginat DT. Analysis of head CT scans flagged by deep learning software for acute intracranial hemorrhage. Neuroradiology. 2020;62(3):335-340. https://doi.org/10.1007/s00234-019-02330-w
Kuo W, Hӓne C, Mukherjee P, Malik J, Yuh EL. Expert-level detection of acute intracranial hemorrhage on head computed tomography using deep learning. Proceedings of the National Academy of Sciences. 2019;116(45):22737-22745. https://doi.org/10.1073/pnas.1908021116
Ye H, Gao F, Yin Y, Guo D, Zhao P, Lu Y, Wang X, Bai J, Cao K, Song Q, Zhang H, Chen W, Guo X, Xia J. Precise diagnosis of intracranial hemorrhage and subtypes using a three-dimensional joint convolutional and recurrent neural network. European Radiology. 2019;29(11):6191-6201. https://doi.org/10.1007/s00330-019-06163-2
Ginat D. Implementation of Machine Learning Software on the Radiology Worklist Decreases Scan View Delay for the Detection of Intracranial Hemorrhage on CT. Brain Sciences. 2021;11(7):832. https://doi.org/10.3390/brainsci11070832
O’Neill TJ, Xi Y, Stehel E, Browning T, Ng YS, Baker C, Peshock RM. Active Reprioritization of the Reading Worklist Using Artificial Intelligence Has a Beneficial Effect on the Turnaround Time for Interpretation of Head CT with Intracranial Hemorrhage. Radiology: Artificial Intelligence. 2020;3(2):e200024. https://doi.org/10.1148/ryai.2020200024
Arbabshirani MR, Fornwalt BK, Mongelluzzo GJ, Suever JD, Geise BD, Patel AA, Moore GJ. Advanced machine learning in action: identification of intracranial hemorrhage on computed tomography scans of the head with clinical workflow integration. NPJ Digital Medicine. 2018;1:9. https://doi.org/10.1038/s41746-017-0015-z
Choy G, Khalilzadeh O, Michalski M, Do S, Samir AE, Pianykh OS, Geis JR, Pandharipande PV, Brink JA, Dreyer KJ. Current Applications and Future Impact of Machine Learning in Radiology. Radiology. 2018;288(2):318. https://doi.org/10.1148/RADIOL.2018171820
Ardila D, Kiraly AP, Bharadwaj S, Choi B, Reicher JJ, Peng L, Tse D, Etemadi M, Ye W, Corrado G, Naidich DP, Shetty S. End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography. Nature Medicine. 2019;25(6):954-961. https://doi.org/10.1038/s41591-019-0447-x
Flanders AE, Prevedello LM, Shih G, Halabi SS, Kalpathy-Cramer J, Ball R, Mongan JT, Stein A, Kitamura FC, Lungren MP, Choudhary G, Cala L, Coelho L, Mogensen M, Morón F, Miller E, Ikuta I, Zohrabian V, McDonnell O, Lincoln C, Shah L, Joyner D, Agarwal A, Lee RK, Nath J; RSNA-ASNR 2019 Brain Hemorrhage CT Annotators. Construction of a Machine Learning Dataset through Collaboration: The RSNA 2019 Brain CT Hemorrhage Challenge. Radiology: Artificial Intelligence. 2020;2(3):e190211. https://doi.org/10.1148/ryai.2020190211
Huang J, Ling CX. Using AUC and accuracy in evaluating learning algorithms. IEEE Transactions on Knowledge and Data Engineering. 2005;17(3):299-310. https://doi.org/10.1109/tkde.2005.50
Brown JB. Classifiers and their metrics quantified. Molecular Informatics. 2018;37(1-2):1700127. https://doi.org/10.1002/minf.201700127
Pavlov NA, Andreychenko AE, Vladzymyrskyy A V., Revazyan AA, Kirpichev YS, Morozov SP. Reference medical datasets (MosMedData) for independent external evaluation of algorithms based on artificial intelligence in diagnostics. Digital Diagnostics. 2021;2(1):49-66. https://doi.org/10.17816/dd60635
Zhao X, Chen K, Wu G, Zhang G, Zhou X, Lv C, Wu S, Chen Y, Xie G, Yao Z. Deep learning shows good reliability for automatic segmentation and volume measurement of brain hemorrhage, intraventricular extension, and peripheral edema. European Radiology. 2021;31(7):5012-5020. https://doi.org/10.1007/s00330-020-07558-2
Li D, Ma L, Li J, Qi S, Yao Y, Teng Y. A comprehensive survey on deep learning techniques in CT image quality improvement. Medical and Biological Engineering and Computing. 2022;60(10):2757-2770. https://doi.org/10.1007/s11517-022-02631-y
Национальный стандарт Российской Федерации ГОСТ Р 59921.1-2022 Системы искусственного интеллекта в клинической медицине. Часть 1. Клиническая оценка. М. 2022 https://allgosts.ru/11/040/gost_r_59921.1-2022.pdf
Lee H, Yune S, Mansouri M, Kim M, Tajmir SH, Guerrier CE, Ebert SA, Pomerantz SR, Romero JM, Kamalian S, Gonzalez RG, Lev MH, Do S. An explainable deep-learning algorithm for the detection of acute intracranial haemorrhage from small datasets. Nature Biomedical Engineering. 2019;3:173-182. https://doi.org/10.1038/s41551-018-0324-9
Mutasa S, Sun S, Ha R. Understanding artificial intelligence based radiology studies: What is overfitting? Clinical Imaging. 2020;65:96-99. https://doi.org/10.1016/j.clinimag.2020.04.025
Chilamkurthy S, Ghosh R, Tanamala S, Biviji M, Campeau NG, Venugopal VK, Mahajan V, Rao P, Warier P. Deep learning algorithms for detection of critical findings in head CT scans: a retrospective study. Lancet. 2018;392(10162):2388-2396. https://doi.org/10.1016/S0140-6736(18)31645-3
Zech JR, Badgeley MA, Liu M, Costa AB, Titano JJ, Oermann EK. Confounding variables can degrade generalization performance of radiological deep learning models. PLoS Med. 2018;15(11):e1002683. https://doi.org/10.1371/journal.pmed.1002683
Park SH, Han K. Methodologic guide for evaluating clinical performance and effect of artificial intelligence technology for medical diagnosis and prediction. Radiology. 2018;286(3):800-809. https://doi.org/10.1148/radiol.2017171920
Kulberg NS, Reshetnikov RV, Novik VP, Elizarov AB, Gusev MA, Gombolevskiy VA, Vladzymyrskyy AV, Morozov SP. Inter-observer variability between readers of CT images: all for one and one for all. Digital Diagnostics. 2021;2(2):105-118. https://doi.org/10.17816/DD60622
Artificial Intelligence in radiology. mosmed.ai. Accessed December 13, 2022. https://mosmed.ai/
Морозов С.П., Владзимирский А.В., Ледихова Н.В., Андрейченко А.Е., Арзамасов К.М., Баланюк Э.А., Гомболевский В.А., Ермолаев С.О., Живоденко В.С., Идрисов И.М., Кирпичев Ю.С., Логунова Т.А., Нуждина В.А., Омелянская О.В., Раковчен В.Г., Слепушкина А.В. Московский эксперимент по применению компьютерного зрения в лучевой диагностике: вовлеченность врачей-рентгенологов. Врач и информационные технологии. 2020;4:14-23. https://doi.org/10.37690/1811-0193-2020-4-14-23

Закрыть метаданные

Список сокращений

КТ — компьютерная томография

ГМ — головной мозг

ВЧК — внутричерепные кровоизлияния

Введение

Внутричерепные кровоизлияния (ВЧК) как травматические, так и нетравматические (в том числе в результате геморрагического инсульта) являются серьезной проблемой, при которой важную роль играет ранняя постановка диагноза и своевременное начало лечения [1]. Лучевая семиотика ВЧК при компьютерной томографии (КТ) достаточно специфична для каждого подвида кровоизлияния [2]. Современные технологии, такие как компьютерное зрение, формируют решения, направленные на упрощение и ускорение распознавания и классификацию патологии на сериях КТ-изображений [3, 4].

В данном обзоре мы рассматриваем особенности наборов данных (датасетов), которые используются для обучения алгоритмов компьютерного зрения. Поиск литературы проводился в системах E-library и PubMed ввиду открытости и доступности этих баз.

После исключения статей, не подошедших под тематику обзора, дублей в поисковой выдаче, а также статей, не имеющих бесплатного доступа к своему полному тексту, было отобрано 21 оригинальное исследование [5—25].

При анализе работ выявлена тенденция их разделения на 3 больших группы. Первая их часть направлена на математическое описание принципов функционирования какого-либо алгоритма машинного обучения, созданного разработчиками [5—14]. В этой группе работ обучение проводилось на публичных наборах данных, собственные медицинские данные использовались редко. Вторая часть объединяет информацию о технико-математических особенностях алгоритма, метрики по обучению и тестированию и иногда — результаты проведенной клинической апробации [16, 19, 21, 22]. В эту же группу отнесены статьи, где коммерчески доступные алгоритмы проспективно тестировали в клинике с оценкой только метрик точности [15, 17, 18, 20]. В третьей группе работ проводится клиническая апробация алгоритма (чаще — коммерчески доступного), при этом также оценивают такие параметры, как время обработки исследования и время подготовки рентгенологического заключения [23—25]. Последняя группа работ представляла для нас наибольший интерес.

Базовые понятия машинного обучения

Искусственный интеллект (ИИ) в наиболее широком понимании — это любая технология, позволяющая компьютеру имитировать поведение человека.

Технологии машинного обучения (machine learning) относятся к ИИ. Они предоставляют электронным системам возможность автоматически учиться и совершенствоваться без нужды в изменении кода самого программного обеспечения. Данные технологии направлены на решение задач классификации, кластерного и регрессионного анализа, позволяют провести поиск аномалий в имеющемся массиве данных [1].

В качестве основы для разработки собственных алгоритмов машинного обучения зачастую используются различные готовые модели, которые впоследствии модифицируются исследователями. Так, среди работ встречается использование таких моделей, как DenseNet [10], Dense U-Net [9], DeepMedic [5, 6], ResNexT [19], Inception v4 [11] и InceptionResNetV2 [16].

Программное обеспечение на основе подобных алгоритмов, предназначенное для анализа медицинских изображений, последние годы активно входит в практику врачей-рентгенологов в качестве вспомогательных инструментов [26]. Результаты некоторых исследований указывают на производительность алгоритмов машинного обучения в части определенных задач аналогичную или даже лучшую, чем у врачей-рентгенологов [27].

Обучение алгоритмов производится на размеченных врачами-рентгенологами наборах данных — датасетах. Для создания эффективно работающих алгоритмов компьютерного зрения нужны структурированные и размеченные данные [28]. Для более правдоподобной оценки точности алгоритмов принято использовать построение ROC-кривой с определением AUC [29, 30].

Практическое применение алгоритмов машинного обучения

Для разработки эффективных алгоритмов ИИ требуется корректно составленное техническое задание [31]. Наиболее частым применением алгоритмов ИИ в диагностике ургентных состояний является корректный триаж [26]. Вторая актуальная задача, решаемая алгоритмами ИИ — количественная оценка объема ВЧК и типа кровоизлияния [32]. Третьей задачей, решение которой может помочь клинической практике, является улучшение точности диагностики ВЧК за счет повышения качества изображения КТ [33].

По рассматриваемому направлению диагностики ВЧК существуют научные и коммерческие разработки без данных о широком клиническом внедрении [5—16, 19, 21—22]. Тем не менее государственные стандарты оценки работы таких алгоритмов в медицине были разработаны и приняты в России только в 2021—2022 гг. [34]. Краткая информация по широкодоступным коммерческим алгоритмам представлена в таблице.

Коммерчески доступные алгоритмы машинного обучения для обнаружения и/или сегментации внутричерепных кровоизлияний и их классификации

Название сервиса	Функционал	Клиническая задача
Aidoc Briefcase ICH (AiDoc, Израиль)	Триаж, сортировка КТ ГМ	Обнаружение признаков ВЧК, их сегментация на снимках
BioMind AI for Haemorrhage (BioMind Technology, Китай)	Триаж, сортировка КТ ГМ, предсказание риска увеличения гематомы в ближайшие 24 ч	Обнаружение признаков ВЧК, их сегментация на снимках
CINA-ICH (Avicenna.AI, Франция)	Триаж, сортировка КТ ГМ	Обнаружение признаков ВЧК, их сегментация на снимках
CuraRad-ICH (Keya Medical (бывш. CuraCloud Corp.), США)	Триаж, сортировка КТ ГМ	Обнаружение признаков ВЧК, их сегментация на снимках
StrokeViewer (NICO.LAB, Нидерланды)	Триаж, сортировка КТ ГМ	Обнаружение признаков ВЧК, их сегментация на снимках, перфузионный анализ, обнаружение места сосудистой окклюзии, оценка коллатералей
qER (Qure.AI, Индия)	Триаж, сортировка КТ ГМ	Обнаружение признаков ВЧК, их сегментация на снимках, обнаружение очагов ишемического инсульта, переломов костей черепа, масс-эффекта
Viz ICH (Viz.AI, США)	Триаж, сортировка КТ ГМ	Обнаружение признаков ВЧК, их сегментация на снимках
Nanox.AI (Nanox Imagind LTD, Израиль)	Триаж, сортировка КТ ГМ	Обнаружение признаков ВЧК, их сегментация на снимках

Примечание. КТ ГМ — компьютерная томография головного мозга; ВЧК — внутричерепные кровоизлияния.

Наборы данных для обучения и тестирования алгоритмов

Основа эффективности работы алгоритма — это качество тех баз медицинских данных, на которых он будет обучаться. По данным литературы, можно выделить несколько основных параметров, характеризующих собираемые массивы данных, такие как его величина (количество отдельных изображений и количество серий), толщина среза, соотношение норма/патология, соотношение исследований в выборках для обучения и для тестирования.

В большинстве случаев для обучения используется 80—90% исследований от собранного набора данных, когда как для тестирования — оставшиеся 10—20%. [9, 25, 35]. Качественные наборы данных для обучения содержат несколько тысяч КТ-исследований, выборка же для тестирования/валидации может насчитывать несколько сотен работ [36], например, Qure25K и CQ500 [37]. При этом необходимо отметить, что набор данных CQ500 использовался и для создания других алгоритмов [9, 10, 13]. Также одним из крупнейших наборов данных можно назвать базу исследований RSNA [28].

При этом соотношение работ с нормой и патологией варьируется: 11,82% патологии в наборе данных Qure25K, 16,36% для первой части CQ500, 61,37% для второй части CQ500, 40,81% в обучающем и 35,23% в тестировочном наборах данных RSNA. Как было сказано ранее, это соотношение является важным параметром и основной проблемой, косвенно относящейся к соотношению норма/патология, является overfitting — переобучение [36]. Пример переобучения — это решение задачи об определении наличия патологии по маркеру стороны в углу рентгенограммы органов грудной клетки [38].

Другой причиной ошибок, касающейся именно соотношения, является тенденциозность выборки (spectrum bias), возникающая в случае, когда набор данных был составлен без учета эпидемиологического распределения целевой патологии [39]. Также показатели работы алгоритма могут зависеть даже от того, сколько врачей собирали обучающие наборы данных и имели ли они при этом доступ к дополнительной клинической информации или нет [40].

Материалы литературы показывают, что для создания рабочего алгоритма, направленного на детекцию ВЧК, малая толщина среза не является обязательным условием: во всех работах максимальная используемая толщина среза достигает 5 мм, минимальная — 0,5 мм [35].

Клиническая апробация

Существует несколько исследований, в том числе проспективных, предоставляющих сравнение работы врачей-рентгенологов с работой алгоритма [15, 18, 21], а также описывающих опыт внедрения и непосредственное влияние алгоритма на рабочий процесс врачей-рентгенологов [23, 24].

В статье N. Schmitt и соавт. [15] описывается апробация алгоритма ИИ e-ASPECTS от Brainomix на валидационном наборе данных, при которой результаты алгоритма сравнивались с работой двух врачей-ординаторов нейрорадиологов с опытом 2 года. Для валидационного набора данных экспертом-нейрорадиологом было отобрано 160 пациентов, у 79 из которых имелись признаки острого ВЧК. Чувствительность и специфичность алгоритма составили 91 и 89%, при этом соответствующие метрики оценки работы врачей-ординаторов были у первого — 99 и 98%, а у второго — 100 и 98% соответственно. ROC-AUC разработанного алгоритма составил 0,90, при этом у врачей-ординаторов — 0,98 и 0,99. Таким образом, алгоритм ИИ показал хорошие результаты, однако не смог превзойти врачей.

Еще одной работой, где авторы оценивали метрики и функционирование алгоритма и врачей, является исследование W. Kuo и соавт. [21]. Апробация алгоритма проводилась на тестировочном наборе данных из 200 КТ-серий, при этом происходило сравнение с результатами 4 сертифицированных врачей-нейрорадиологов с опытом работы 4, 10, 15 и 16 лет. Созданный авторами алгоритм PatchFCN достиг порогов чувствительности и специфичности в 100 и 90% соответственно, с показателем ROC-AUC — 0,991±0,006, превзойдя двух (с 4 и 16 годами опыта) из четырех сертифицированных нейрорадиологов.

Также хотелось бы отметить работу N. Buls и соавт. [18], где в клинических условиях проводилась оценка согласованности между тремя врачами-рентгенологами и алгоритмом ИИ: коэффициент Каппа Коэна составил 0,78, что указывает на значительную согласованность. Интересной особенностью данной работы можно назвать данные по количеству обработанных и не обработанных алгоритмом ИИ в эксперименте КТ-серий: суммарно алгоритмом было оценено только 77,6% (388/500) представленных исследований, проведенных на 4 различных моделях томографа.

В двух исследованиях был оценен хронометраж написания диагностических заключений. В работе D. Ginat [23] описывается опыт внедрения в практику одного клинического центра коммерческого алгоримта ИИ AIdoc. Ретроспективно было обработано 8723 КТ-исследования, из них 1829 было помечено алгоритмом как потенциально содержащие признаки ВЧК. Было показано, что общее время подготовки заключений для помеченных алгоритмом ИИ КТ-исследований сокращалось на 34,7% (57,9 мин) для стационарных и 89,6% (603,9 мин) для амбулаторных пациентов. В работе T.J. O’Neill и соавт. [24] описывается пошаговый опыт внедрения коммерческого алгоритма AIdoc в клиническую практику, где наблюдалось значимое снижение затраченного времени в среднем на 12 мин для ВЧК-позитивных и 15,45 мин для ВЧК-негативных случаев.

В настоящее время в Москве проходит крупнейшее в мире проспективное и мультинаправленное исследование в сфере искусственного интеллекта в медицине — Эксперимент по использованию инновационных технологий в области компьютерного зрения для анализа медицинских изображений и дальнейшего применения в системе здравоохранения города Москвы [41]. В Эксперимент вошли 153 медицинские организации города Москвы, 1242 единицы диагностического оборудования, и в настоящий момент в нем работают 42 ИИ-сервиса. С мая 2022 г. в Эксперимент включен алгоритм выявления ВЧК. За один год при участии 39 ИИ-сервисов было проанализировано 1 468 872 исследования, в экспертной оценке которых приняли участие 538 врачей (рис. 1) [42].

Рис. 1. Графическое представление данных об Эксперименте по применению компьютерного зрения в лучевой диагностике с официального сайта mosmed.ai. Актуально на 15.11.22.

На рис. 2 представлен пример работы одного из ИИ-сервисов, предназначенного для выявления кровоизлияний на КТ головы, участвующего в Эксперименте.

Рис. 2. Пример работы сервиса искусственного интеллекта.

На компьютерно-томографическом изображении представлен очаг внутримозгового кровоизлияния. Контуры очага отмечаются сервисом с указанием типа кровоизлияния (розовым). Расположение срезов с обнаруженной сервисом патологией выделяются красным на цветовой линии снизу. Пояснения в тексте.

В левом таламусе визуализируется гематома плотностью 66—68 HU, которая была успешно сегментирована сервисом. Помимо сегментации на всех срезах, в функционал ИИ-сервиса входит указание вероятности наличия патологии (в данном случае 0,98 или 98%), определение типа кровоизлияния (внутримозговое), подсчет общего объема (6,39 мл) и указание номеров срезов, на которых определяется патология (137—172). Также детализируются наибольшие размеры каждого найденного патологического объекта (кровоизлияния) в мм (в данном случае 24,9×22,95×22,5). ИИ-сервис в интерфейсе медицинской информационной системы предоставляет ответ в двух формах — текстовом окне DICOM SR и в виде дополнительной серии КТ-изображений с маской, на которой отражается разметка патологических объектов, тип кровоизлияния, цветовая линия с отражением срезов, на которых есть патология (нормальные срезы — зеленые, с патологическим объектом — красные), количество патологических объектов, их продольные размеры и пометка «только в исследовательских целях».

Заключение

Компьютерное зрение является перспективным направлением информационных технологий, способным решать различные клинические задачи, включая автоматизированное обнаружение, классификацию и определение объема внутричерепного кровоизлияния. Сформирован общий подход к созданию наборов данных, обучению алгоритмов и оценки их эффективности, включая работу в реальных клинических условиях. Перед полноценным внедрением алгоритмов диагностики жизнеугрожающих состояний (в частности, внутричерепного кровоизлияния) перспективны поиски возможностей их применения в качестве второго мнения. Актуальны мультицентровые исследования для определения места «интеллектуальных цифровых помощников» в современной практике нейрохирургов и специалистов лучевой диагностики.

Участие авторов:

Концепция и дизайн исследования — Хоружая А.Н., Петряйкин А.В., Кремнева Е.И.

Сбор и обработка материала — Сморчкова А.К., Хоружая А.Н.

Написание текста — Сморчкова А.К., Хоружая А.Н.

Редактирование — Петряйкин А.В., Кремнева Е.И.

Авторы заявляют об отсутствии конфликта интересов.