Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Плотников Д.Ю.

ФГБОУ ВО «Казанский государственный медицинский университет» Минздрава России

Аглиуллина С.Т.

ФГБОУ ВО «Казанский государственный медицинский университет» Минздрава России

Аглиуллин Д.Р.

ФГБОУ ВО «Казанский государственный медицинский университет» Минздрава России

Применение ориентированных ациклических графов при планировании клинических и эпидемиологических исследований

Авторы:

Плотников Д.Ю., Аглиуллина С.Т., Аглиуллин Д.Р.

Подробнее об авторах

Просмотров: 614

Загрузок: 2


Как цитировать:

Плотников Д.Ю., Аглиуллина С.Т., Аглиуллин Д.Р. Применение ориентированных ациклических графов при планировании клинических и эпидемиологических исследований. Медицинские технологии. Оценка и выбор. 2023;(1):27‑31.
Plotnikov DYu, Agliullina ST, Agliullin DR. Directed acyclic graphs in planning clinical and epidemiological trials. Medical Technologies. Assessment and Choice. 2023;(1):27‑31. (In Russ.)
https://doi.org/10.17116/medtech20234501127

Рекомендуем статьи по данной теме:
Эпи­де­ми­оло­ги­чес­кие и кли­ни­чес­кие па­ра­мет­ры T-кле­точ­ных лим­фом ко­жи (по дан­ным ре­гис­тра Рос­сий­ско­го об­щес­тва дер­ма­то­ве­не­ро­ло­гов и кос­ме­то­ло­гов). Ме­ди­цин­ские тех­но­ло­гии. Оцен­ка и вы­бор. 2023;(4):10-18
Ана­лиз при­чин пос­мер­тной ди­аг­нос­ти­ки ге­па­то­цел­лю­ляр­но­го ра­ка. До­ка­за­тель­ная гас­тро­эн­те­ро­ло­гия. 2023;(1):42-48
Су­деб­но-ме­ди­цин­ская ха­рак­те­рис­ти­ка рас­простра­нен­нос­ти и струк­ту­ры вне­зап­ной смер­ти лиц мо­ло­до­го воз­рас­та в Мос­ков­ской об­лас­ти и Санкт-Пе­тер­бур­ге. Су­деб­но-ме­ди­цин­ская эк­спер­ти­за. 2023;(4):14-18
Крас­ный плос­кий ли­шай, ас­со­ци­иро­ван­ный с ви­рус­ным ге­па­ти­том C: но­вые дан­ные, кон­цеп­ции и ги­по­те­зы. Кли­ни­чес­кая дер­ма­то­ло­гия и ве­не­ро­ло­гия. 2023;(4):426-433
Смер­тность на­се­ле­ния Пен­зен­ской об­лас­ти от бо­лез­ней пе­че­ни и жел­че­вы­во­дя­щих пу­тей в 2021—2022 гг.. Ар­хив па­то­ло­гии. 2023;(5):60-64
Кли­ни­ко-эпи­де­ми­оло­ги­чес­кие осо­бен­нос­ти ин­фек­ций, пе­ре­да­ва­емых по­ло­вым пу­тем, ло­ка­ли­зу­ющих­ся в по­лос­ти рта. Кли­ни­чес­кая дер­ма­то­ло­гия и ве­не­ро­ло­гия. 2023;(6):725-732
Вза­имос­вязь меж­ду де­фек­та­ми ме­ди­цин­ской по­мо­щи и дан­ны­ми при­чин­но-следствен­но­го ана­ли­за. Су­деб­но-ме­ди­цин­ская эк­спер­ти­за. 2024;(1):62-66

Введение

Установление причинной значимости того или иного фактора риска для различных клинических исходов — один из важнейших вопросов современной эпидемиологии. Такая информация необходима для создания точных прогностических моделей, проведения оценки эффективности того или иного вмешательства (терапии). Она позволит понять, почему в одной группе пациентов эффективность назначенной терапии выше, чем в другой. Конечно, «золотым стандартом» доказательной медицины является рандомизированное контролируемое исследование (РКИ) [1], обычно считающееся источником наиболее достоверной информации. Однако проведение РКИ сопряжено со значительными финансовыми или временными издержками, затрудняющими повсеместное применение данного метода. Кроме того, не всегда этично проверять научную гипотезу в рамках РКИ, поэтому в ряде случаев исследователи вынуждены полагаться на данные обсервационных (наблюдательных) исследований. Возможности обсервационных исследований в установлении причинно-следственных отношений в паре «фактор риска — исход» значительно уступают возможностям РКИ, и одной из важнейших причин этого является наличие вмешивающихся факторов (конфаундеров), влияющих как на фактор риска, так и на исход [2]. В последние годы эпидемиологами все чаще применяются ориентированные ациклические графы (directed acyclic graphs; DAG) для получения ответа о наличии причинно-следственной связи, возможного взаимодействия между факторами риска [3].

Применение графов обеспечивает геометрический подход — простой способ графического представления и понимания ключевых моментов исследования. История появления термина «граф» уходит в 1936 г., когда венгерский математик Dénes König опубликовал свой научный труд «Theorie der endlichen und unendlichen Graphen» («Теория конечных и бесконечных графов») [4]. С этого времени ориентированные ациклические графы успешно применяются в решении различных задач в социальных, экономических и математических науках.

В эпидемиологии ориентированные ациклические графы также называются «причинно-следственные графы», или «causal graphs». Они позволяют визуализировать основную рабочую гипотезу, выставляемую на проверку, и имеют важное значение в установлении и оценке искажающих факторов и других потенциальных источников систематических ошибок в отношениях «фактор риска — исход». Ориентированные ациклические графы помогают определить, достаточно ли у исследователя данных для оценки влияния фактора риска на исход по имеющимся данным.

Построение ориентированных ациклических графов позволяет исследователю улучшить дизайн планируемого исследования, используется для выбора переменных для статистической корректировки и выявления источников систематических ошибок [5—7]. Однако важно помнить, что причинно-следственные графы основаны на предположениях, поэтому при выдвижении гипотезы необходим тщательный анализ имеющихся источников литературы.

Начало работы с графами

Для начала работы с ориентированными ациклическими графами важно знать несколько правил, которые помогут лучше понять сильные стороны и ограничения планируемого исследования.

Во-первых, ранние события расположены на графе левее, исходы — правее. Начинаем с причины (независимой переменной — терапии, фактора риска), исхода (зависимой переменной — эффекта) и обозначаем вопрос исследования.

Во-вторых, добавляем важные переменные — модификаторы и медиаторы.

В-третьих, добавляем вмешивающиеся переменные — конфаундеры.

Построение графа требует особого внимания, и с практической точки зрения всегда лучше начинать с создания упрощенной модели, включающей базовые переменные, которые позволяют визуализировать возможные источники смещения оценки. Создание дополненной версии графа поможет определить ковариаты, необходимые для включения в статистическую модель. Важно четко понимать вопрос исследования и включать в граф не только переменные из имеющихся данных, но и потенциальные (неизмеренные или неизмеримые) конфаундеры. Один из ключевых аспектов построения причинно-следственного графа заключается в том, что если у двух переменных или более есть общая причина, то ее обязательно включают в граф.

Терминология

Ориентированный ациклический граф представляет множество вершин и множество ребер, соединяющих эти вершины. В эпидемиологии вершинами являются различные переменные, используемые в анализе данных, — модифицируемые и немодифицируемые факторы риска, вероятные исходы, биомаркеры и т.п. Ребра, соединяющие две вершины, отражают наличие ассоциации между ними, ее направление и возможную причинную значимость этой связи. Следует отметить, что само по себе наличие ребра не позволяет дать ответ на вопросы о силе ассоциации, ее направлении (снижается или увеличивается риск исхода), также невозможно определить, является ли связь линейной или нет. Ориентированный — означает, что ребрам графа присвоено направление, т.е. ребро на графе представлено стрелкой от одной вершины к другой. Ациклический — означает, что если мы начнем с какой-то вершины и продолжим путь по ребрам графа, то не придем обратно к этой вершине.

Путь — это совокупность ориентированных ребер (могут идти в разном направлении), соединяющая две переменные (вершины). В эпидемиологии путь может быть причинно-значимым или нет. В первом случае каждая вершина является причиной для последующей (на графе все стрелки идут в одном направлении), во втором — стрелки разнонаправленные.

На рис. 1 показано, что нарушение диеты является причиной повышенного уровня общего холестерина, что в свою очередь повышает риск развития сердечно-сосудистых заболеваний (таким образом, путь Б-З-В причинно-значимый). Путь Б-З-В является прямым, в нем каждый элемент причинно-значим по отношению к следующему, прямые пути также называются цепями. Допустим, мы также предполагаем, что курение М вызывает повышение уровня холестерина З и, таким образом, увеличивает риск развития сердечно-сосудистых заболеваний В. Теперь у нас в графе появилась другая цепь — М-З-В, но она является косвенной, по крайней мере, по отношению к связи неправильного питания с сердечно-сосудистыми заболеваниями. Мы можем предположить, что человек, нарушающий диету, с большей вероятностью ведет нездоровый образ жизни и, например, курит. На графе неправильный образ жизни изображается как латентная (неизмеряемая) вершина Д. Склонность к нездоровому образу жизни на графе ведет как к нарушению диеты, так и к курению. Мы видим, что связь между неправильным питанием и курением идет по разветвленному пути — вилке (курение ← нездоровый образ жизни → неправильное питание), а не по цепи. Очевидно, что поскольку у них есть общий «родитель» (ОБРАЗ ЖИЗНИ), то неправильное питание и курение связаны.

Рис. 1. Компоненты ориентированных ациклических графов на примере определения причинности развития сердечно-сосудистых заболеваний.

На графе мы можем определить общий причинно-значимый эффект фактора риска на исход как совместный эффект, реализуемый через все причинно-значимые пути, ведущие от фактора риска к исходу.

Отношения между переменными (вершинами) можно описать и другими способами: «родители», «дети», «предки», «потомки» и «сосед» (есть и несколько других, но они относятся к менее распространенным отношениям). «Родители» и «дети» относятся к прямым отношениям; «потомки» и «предки» могут быть где угодно на пути к вершине или от нее соответственно. На рис. 1 нарушение диеты и курение являются «родителями» повышенного уровня холестерина и «детьми» нездорового образа жизни. Сердечно-сосудистые заболевания — «потомок» нездорового образа жизни, который в свою очередь является «предком» всех вершин данного графа.

Вершина Д является конфаундером ассоциации Б и В. Конфаундинг в данной схеме возникает из-за того, что Д является общей причиной для Б и В, и для того, чтобы оценить влияние Б на В, мы должны осуществить контроль переменной Д или другой переменной, находящейся на причинно-незначимом пути. На рис. 1 такой путь — это Б-Д-М-В. Следовательно, мы можем осуществить контроль переменной Д или М, и это закроет причинно-незначимый путь и позволит избежать смещения оценки эффекта. В определенных случаях переменная М может быть предпочтительней, допустим, если ее легко измерить и у нас есть доступ к таким данным.

Повышенный уровень холестерина (З) является промежуточной переменной между Б и В и выступает в качестве медиатора эффекта. Контроль промежуточных переменных недопустим в статистических моделях, так как может вызвать смещение оценки. В зависимости от вопроса исследования это может быть именно то, что вам нужно, и в этом случае вам следует использовать анализ медиации, например с помощью структурного моделирования, которое может оценивать прямые, косвенные и общие эффекты. В нашем примере с нарушением диеты нас интересует только то, как оно влияет на риск развития сердечно-сосудистых заболеваний — линия от Б до В, а не то, как это влияние реализуется через уровень холестерина. Более того, поскольку холестерин (З) в нашем графе перехватывает единственный прямой путь от нарушения диеты к сердечно-сосудистым заболеваниям, контроль переменной З блокирует эту взаимосвязь. Следовательно, если мы вводим уровень холестерина как ковариату в модель, то получаем отсутствие связи между диетой и сердечно-сосудистыми заболеваниями. Переменная Н на рис. 1модификатор, так как является причиной В и модифицирует эффект любой другой переменной, влияющей на исход (В), например эффект переменной Б.

Другие компоненты, используемые при построении ориентированных ациклических графов, представлены на рис. 2. На этом рисунке А является инструментальной переменной [8] или инструментом для Б при оценке влияния Б на В. А связана с Б причинно-следственно, т.е. А вызывает Б и не связана с В никаким путем, кроме как через Б. Метод инструментальных переменных для оценки эффекта фактора риска на исход может применяться при наличии конфаундеров и невозможности их контроля. Примером является Менделевская рандомизация [9], эпидемиологический метод, в котором генетическая информация используется в качестве инструментальной переменной. E. Mountjoy и соавт. тестировали гипотезу о наличии причинно-значимой связи между уровнем образования (Б на рис. 2) и развитием близорукости (В на рис. 2) [10]. Используя полиморфизмы генов (А на рис. 2), связанных с уровнем образования, авторы установили, что каждый дополнительный год образования связан с —0,27 диоптрий рефракции. Исследование в обратном направлении подтвердило, что причинно-значимым путем является только путь А—Б—В на рис. 2. Коллайдером на ориентированном ациклическом графе называется вершина (переменная), на которую указывают две стрелки. Коллайдеры, находящиеся на пути, блокируют этот путь. На рис. 2 Л является коллайдером на причинно-незначимом пути между Б и К. Нельзя проводить контроль коллайдера в статистической модели, так как это приводит к смещению оценки (collider bias), что является серьезной проблемой в современной эпидемиологии. В итоге невозможно распространить выводы, сделанные по результатам исследования, на другие выборки, кроме того, сам результат будет неточным.

Рис. 2. Варианты компонентов, используемых при построении ориентированных ациклических графов.

Заключение

Ориентированные графы успешно применяются в экономических и социальных отраслях науки [11, 12], кроме того, растет количество опубликованных исследований в области эпидемиологии и общественного здоровья, использующих графы, что показано в систематическом обзоре, проведенном в 2021 г. [13].

Таким образом, ориентированные ациклические графы являются полезным инструментом для исследователя, позволяющим улучшить качество работы, определить потенциальные ограничения и наглядно представить дизайн своего исследования в научных публикациях и докладах.

Авторы заявляют об отсутствии конфликта интересов.

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail



Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.