Сайт издательства «Медиа Сфера»
содержит материалы, предназначенные исключительно для работников здравоохранения. Закрывая это сообщение, Вы подтверждаете, что являетесь дипломированным медицинским работником или студентом медицинского образовательного учреждения.

Солодовников А.Г.

ООО «Статэндокс»

Сорокина Е.Ю.

ООО «Статэндокс»

Гольдина Т.А.

АО «Санофи Россия»

Данные рутинной практики (real-world data): от планирования к анализу

Авторы:

Солодовников А.Г., Сорокина Е.Ю., Гольдина Т.А.

Подробнее об авторах

Просмотров: 3885

Загрузок: 166

Как цитировать:

Солодовников А.Г., Сорокина Е.Ю., Гольдина Т.А. Данные рутинной практики (real-world data): от планирования к анализу. Медицинские технологии. Оценка и выбор. 2020;(3):9‑16.
Solodovnikov AG, Sorokina EYu, Goldina TA. Real-world data: from planning to analysis. Medical Technologies. Assessment and Choice. 2020;(3):9‑16. (In Russ.)
https://doi.org/10.17116/medtech2020410319

За последние несколько лет англоязычные термины «real-world data» (RWD) и «real-world evidence» (RWE) стали привычной составляющей научно-медицинской коммуникации в России. Направление RWE является неотъемлемой частью стратегии многих фармацевтических компаний, контрактно-исследовательских организаций. Отмечается значительный рост интереса медицинского сообщества и, как следствие, рост числа публикаций (оригинальных и обзорных). Эти тренды и тенденции проявляются как на международном, так и на российском уровнях.

Понимание и единство использования терминологии, определение регламентов и требований, формулирование всех этапов работы с данными, учет особенностей работы с данными от момента сбора до завершения анализа, разработка всех процессов и улучшение каждого процесса в отдельности — все это важные шаги в развитии направления Real World Evidence в России.

Именно поэтому цель настоящей статьи — актуализация роли данных рутинной практики (RWD) в процессе формирования научных доказательств, определение основных аспектов работы с данными на всех этапах — от планирования исследований в целом к анализу данных.

Определение терминов «real-world data» и «real-world evidence»

Хотя термины «real-world data» (RWD) и «real-world evidence» (RWE) в здравоохранении существуют уже более 20 лет (согласно базе MEDLINE, термин RWD появился в 1991 г. [1], а определение RWE впервые дано в статье 1998 г. [2]), устоявшихся русскоязычных терминов для этих понятий до сих пор не существует. Само прилагательное «real-world» не имеет прямого аналога в русском языке: английские толковые словари определяют его как «имеющий отношение к практическому, действительному, повседневному опыту или практической активности», противопоставляя теоретическим ситуациям или специально созданным условиям, в том числе условиям научного/лабораторного опыта.

Соответственно, RWD могут быть определены как данные, полученные в ходе повседневной (рутинной) активности — данные рутинной практики, а RWE — как доказательства, сформированные на основе анализа и интерпретации RWD, или совокупность доказательств рутинной практики [3]. В настоящей статье мы будем использовать англоязычные сокращения для RWD и RWE по двум причинам: 1) ни один из существующих переводов («данные реального мира», «данные рутинной клинической практики» и т.п.) не отражает в полной мере те коннотации, которые заложены в термин «real-world» в английском языке; 2) необходимо избегать некорректного, неточного понимания этих терминов.

Несмотря на кажущуюся очевидность определений RWD и RWE, многие нюансы этих определений до сих пор не согласованы даже между ключевыми заинтересованными сторонами (регуляторами, профессиональными сообществами, индустрией и общественностью) [3].

Регулирование вопросов RWD/RWE впервые достигло уровня нормативно-правовых актов в США в виде Федерального закона от 13 декабря 2016 г., известного как 21st Century Cures Act [4]. На основе данного акта Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (Food and Drug Administration, FDA) создало ряд более специфичных руководств и программ разработки RWE [5—7]. RWD в данных руководствах описаны как «данные, относящиеся к состоянию здоровья пациента и/или оказанию медицинской помощи, рутинно собираемые из различных источников», а RWE — как «клинические доказательства, относящиеся к использованию, а также потенциальным преимуществам и рискам медицинского продукта, полученные при анализе RWD» [5—7].

Схожие по своей сути определения представлены и в отчете по проекту GetReal [8], который выполнен в 2013—2017 гг. группой инициатив Европейского медицинского агентства по инновационным методам изучения лекарственных средств. Международное общество по фармакоэкономике и исследованиям результатов (International Society for Pharmacoeconomics and Outcomes Research, ISPOR) определяет RWD как «данные, используемые для принятия клинических решений, а также решений в отношении оплаты и компенсации, которые не собираются в обычных рандомизированных контролируемых испытаниях» [9].

Необходимо особо отметить, что сами по себе RWD не привязаны к какому-то конкретному дизайну, но могут собираться в рамках различных (как неинтервенционных, так и интервенционных) исследований. В связи с этим необходимо разделять (а) сами данные (источник), (б) планирование и проведение исследования по их получению, (в) анализ и интерпретацию результатов, то есть создание собственно RWE.

Место RWD в здравоохранении и принятии клинических и регуляторных решений

Еще несколько лет назад парадигма того, что только совокупность доказательств, полученных как в клинических исследованиях, так и в исследованиях рутинной практики, представляет собой единую доказательную базу, вызывала резонанс [10]. Сегодня уже в сотнях публикаций признана важная роль RWE в системе принятия решений [11—14]. При этом по-прежнему авторы часто не обращают внимания на критически важный аспект: именно RWD играют важную роль в цепочке управления данными (data governance) — они лежат в основе всех процессов, последовательности шагов, направленных на получение доказательств (RWE) и, как следствие, на принятие решений (рис. 1).

Рис. 1. От данных рутинной практики к принятию решений.

RWD — real-world data; RWE — real-world evidence.

Разработка, улучшение понимания [10] последовательности процессов (см. рис. 1) приводит нас к двум ключевым выводам:

стратегический уровень: создавая систему знаний о препарате и/или терапевтической области, систему процессов/направление RWE в компании или учреждениях, необходимо начинать с определения потребностей в RWE и типах решений, а далее выстраивать все этапы, начиная с RWD;

уровень исследования: работа по получению RWE начинается именно с работы с RWD: необходимо понять и проанализировать, какие данные имеются, в каком виде, в каких источниках и т.д. Оценивая RWD, необходимо проанализировать их особенности, в каких источниках можно их найти в реальной жизни, какие регуляции следует применить к работе с данными (особенно принимая во внимание, что это медицинские данные), как обеспечить качество данных.

Подобный системный подход будет способствовать росту качества, согласованности и полноты получаемых доказательств (RWE). Далее в статье мы постараемся раскрыть основные положения, важные в работе с RWD для достижения результата такого уровня.

Источники RWD

Наиболее распространенным сегодня является разделение RWD на два ключевых типа в зависимости от исходной цели сбора данных [10, 15, 16]: 1) Первичные данные, собираемые специально для решения конкретной исследовательской задачи; 2) Вторичные данные, которые собирались исходно с целью, не связанной с проведением исследования.

Рост информатизации и цифровизации, в том числе в системе здравоохранения, привел к постоянному росту объемов вторичных RWD, увеличению числа источников и их разнородности [17]. Единой общепринятой классификации источников RWD в настоящее время не существует. Мы предлагаем выделить подход к их систематизации в зависимости от того, где формируются RWD, то есть по типу источника (рис. 2). Подобная классификация во многом определяет качество данных и является важной с точки зрения планирования и организации управления данными, проведения исследования и последующего анализа данных.

Рис. 2. Классификация RWD в зависимости от источника информации.

ЛПУ — лечебно-профилактические учреждения; СМИ — средства массовой информации.

Предлагаем выделить следующие типы источников данных:

исследования: формирующиеся в ходе проспективных исследований первичные данные могут быть использованы вторично;

система здравоохранения: данные формируются на разных уровнях системы здравоохранения; существенные различия в исследовательских и административных задачах ограничивают полноту данных, и их структура не всегда удобна для анализа;

пациент/человек: данные создаются непосредственно пациентом или просто здоровым человеком, часто спонтанно, и не имеют определенной структуры (например, сообщения в социальных сетях), а если информация и структурирована (например, приложения в смартфонах для ввода информации о здоровье), то не осуществляется контроль ее правильности;

медицинские и иные носимые устройства: данные формируются на устройствах, имеют четкую структуру и гарантированную точность измерения, однако предназначены для оценки изменений/колебаний у одного конкретного человека.

Среди источников RWD особое значение имеют данные, собранные в лечебно-профилактических учреждениях (ЛПУ). Так, электронные медицинские карты (ЭМК, Electronic Health Records, EHRs) в связи с все более широким внедрением рассматриваются как перспективный источник информации, в том числе регуляторными органами [18]. В частности, в июле 2018 г. опубликовано руководство FDA по использованию данных ЭМК [18]. В Российской Федерации аналогичный нормативно-правовой акт пока отсутствует, что как осложняет получение доступа к данным ЭМК, так и увеличивает риски, связанные с использованием данных. В целом обеспечение прозрачности процессов доступа к RWD из систем ЛПУ, сохранение конфиденциальной природы информации и одновременно ее целостности — одна из острых проблем здравоохранения во всем мире. Регуляторные органы США и ЕС полагают, что использование ЭМК в качестве источника RWD в конечном итоге приведет к повышению качества и информативности систем рутинного сбора данных в первичном звене здравоохранения [13, 17, 18].

При выборе источника RWD для решения конкретного вопроса в первую очередь нужно понимать, все ли необходимые данные действительно собираются в рамках рутинной клинической практики или в системе здравоохранения в целом и если да, то где и как их можно получить. Доступны ли они в виде готовой базы? Если нет, то можно ли получить доступ к записям и создать такую базу? Если ответ утвердительный, можно ограничиться вторичными RWD. Если же какие-то элементы, необходимые для ответа на поставленный вопрос, не собираются в рамках рутинной деятельности, единственным практическим выходом будет проспективный сбор первичных данных. Наконец, достаточно распространен и гибридный подход — сбор основной массы информации на основе вторичных данных в сочетании с получением определенной части первичных проспективных данных.

С увеличением числа источников и объема RWD нарастает и неоднородность качества и полноты данных, что требует четкого понимания особенностей RWD, их влияния на качество, а также внедрения особых подходов к сбору данных и последующей интерпретации.

Особенности и качество RWD

Данные рутинной практики имеют ряд отличительных особенностей по сравнению с данными, получаемыми в клинических исследованиях. Эти особенности являются критически важными в планировании исследований и, как следствие, играют значительную роль в обеспечении качества и достоверности RWE.

1. Отсутствие исходной нацеленности RWD на решение научных задач — практически весь объем RWD направлен на поддержку работы системы здравоохранения. Как следствие, данные зачастую недостаточно упорядочены, частично могут и отсутствовать (например, в ЭМК упускается детальная информация о показаниях к применению препарата, важных для анализа характеристиках пациентов).

2. Особенности структуры [19]. В этом отношении RWD логично разделить на структурированные (то есть доступные для анализа без предварительной обработки) и неструктурированные (требующие выявления структуры и кодирования информации как в ручном режиме, так и с применением систем анализа больших данных и искусственного интеллекта). Возможны варианты, когда одна и та же информация (например, субъективная/объективная оценка) может быть представлена или в структурированном, или в неструктурированном виде.

3. Пропущенные данные (missing data). Сбор данных рутинной практики не предполагает заранее заданной точности измерений, сопровождается большим количеством пропущенных данных и ошибок ввода. Это может приводить к систематическим ошибкам, особенно в случаях, когда ошибка измерения или пропуск данных не являются случайными (например, большой объем данных собирается о наиболее тяжелых или необычных случаях) [19].

4. Наличие несогласованных данных (inconsistent data). Несмотря на то что RWD так или иначе подвергаются внешнему контролю (ЛПУ проверяются страховыми компаниями, те, в свою очередь, регулятором, в лабораториях проводятся плановые проверки и т.п.), этот контроль не заменяет процессов валидации (оценки противоречивости данных, например наличия диагноза, с одной стороны, и отсутствия терапии и изменений в лабораторных показателях — с другой), и проблема несогласованности информации как в разных источниках, так и внутри одного источника (особенно актуально для ЭМК) стоит довольно остро.

5. Соблюдение принципа невмешательства. Интенсивное вмешательство в процесс создания RWD (например, обучение персонала, вовлеченного в создание таких данных) нежелательно, поскольку само по себе вносит определенные искажения в принцип сбора данных. Более перспективным в отношении соблюдения принципа «невмешательства» является внедрение проверок на полноту и качество (например, на диапазон вводимых величин) в исходных системах ввода (где это возможно) или систему валидационных проверок на этапе извлечения данных (при этом любые вносимые изменения в получаемые данные — исключение заведомо некорректных значений, самоочевидные правки — должны четко прослеживаться и быть прописанными в соответствующих документах по управлению данными).

Таким образом, получение надежных (валидных), точных, максимально полных результатов при соблюдении воспроизводимой и прозрачной процедуры их получения представляет значительную сложность при использовании RWD [20].

Представленные особенности RWD и, как следствие, качество данных (data quality) значительно варьируют в зависимости от источника RWD, но также могут быть нестабильными и внутри одного источника (вариабельность в заполнении необязательных полей разными сотрудниками и т.п.) [21]. В самом общем смысле «полнота» данных зависит от того, какие именно RWD являются значимыми для конкретного дизайна и исследовательской задачи. Поэтому, опираясь на существующие RWD, нужно четко очерчивать перспективы и объем получаемых RWE. В противном случае существует риск, что RWD просто не позволят адекватно ответить на вопросы исследования.

Наконец, при выборе RWD нужно полностью представлять себе процесс создания конкретного источника данных — кем, в каких условиях, на основании каких данных и с какой целью вводится информация в определенную базу данных. Например, в ЭМК значительно больше неструктурированных элементов и субъективных оценок, анализ которых невозможен без понимания задач, которые поставлены перед сотрудниками, вводящими данные, в рамках исполнения их должностных обязанностей. Данная проблема имеет настолько большое значение, что существуют отдельные руководства по критериям выбора баз RWD при проведении разных типов исследований [22].

Планирование исследований на основе RWD

Исследования — важная стратегическая составляющая деятельности фармацевтических компаний, контрактно-исследовательских организаций и научных учреждений. Проведение любого исследования — это колоссальная затрата ресурсов (не только финансовых, но и временных). Сфокусированное на стратегии и методологически выверенное планирование исследований — одна из основ успеха. Начинать следует с инструментов стратегического анализа, в частности с анализа разрывов (gap-анализ, gap-analysis, реже gap-assessment). В областях G×P (Good×Practice) наиболее часто его используют при анализе системы менеджмента качества. По своей сути gap-анализ — это метод выявления несоответствия (разрыва) между текущим и желаемым состояниями.

Остановимся более детально на применении метода в области исследований. Выделяют несколько этапов (соответствуют классическому применению метода):

1. Определение текущего состояния: оценить, какие исследования уже проведены, в каких областях знаний получены доказательства (подтверждающие результаты, evidence).

2. Определение желаемого состояния: оценить, какие доказательства (RWE) необходимы для достижения поставленных стратегических целей.

3. Выявление «разрывов» (gaps): определить, каких доказательств (научных результатов) не хватает для достижения поставленных стратегических целей.

Наиболее распространенной ошибкой этапов 2 и 3 является прямой поиск ответа на вопрос, какие исследования нам нужны. Подобный подход сужает область поиска, увеличивает риск не выявить важные составляющие, а также принять решения о некорректном выборе дизайна исследования.

4. Разработка инициатив. Создание списка исследований (включая дизайн), необходимых для получения RWE (то есть для преодоления «разрывов»). Первичная оценка (бюджет, сроки и т.п.) и приоритизация проектов.

Следующим важным шагом в планировании исследований становится оценка данных рутинной практики. В отличие от данных классических клинических исследований, RWD формируются независимо от протокола исследования. При оценке данных важно сфокусироваться на следующих составляющих:

оценка источников данных: в каких источниках могут содержаться необходимые RWD, доступность этих источников (возможность получить данные для анализа);

оценка наличия данных: какие конкретно данные есть в каждом источнике, в какие временные периоды жизни/лечения/диагностики эти данные собираются, оценка глубины данных (т.е. на протяжении какого времени происходит сбор данных);

оценка правомерности использования данных: соблюдение законодательства в области персональных данных, соблюдение этических аспектов при получении данных из этого источника;

оценка методов получения данных из источника: например, применение методов искусственного интеллекта для получения структурированных данных из неструктурированных;

оценка множественности источников: можно и необходимо ли использовать одновременно несколько источников данных; если да, то важно обеспечить целостность данных (прослеживаемой каждой записи и принцип объединения записей из разных источников), в том числе исключить потерю и/или дублирование информации, обеспечить соблюдение конфиденциальности и правил обработки персональных данных.

Таким образом, исследования, содержащие RWD, не должны создавать рутинную практику, подобные исследования только отражают рутинную практику. Именно поэтому одним из ключевых факторов является предварительная всесторонняя оценка данных, на основании которых можно четко сформулировать конечные точки и цели исследования, а также разработать план сбора данных (data collection) и/или план наблюдения (plan of observation). Другими словами, разработка концепции исследований, построенных на RWD, начинается не только с формулирования гипотезы, целей и конечных точек исследования (как это принято в клинических исследованиях), но и с оценки данных: без всесторонней оценки данных невозможно сформулировать качественное исследование, построенное на RWD.

От качества к анализу: интерпретация RWD, ключевые особенности

Анализ RWD, в отличие от анализа данных контролируемых клинических исследований, характеризуется значительно большим вниманием к выявлению, контролю и компенсации возможных смещающих факторов (confounding) и систематических ошибок (bias). Если в клинических исследованиях возможны непосредственный контроль смещений и минимизация систематических ошибок в силу особенностей дизайна, то данные RWD находятся в исходно более «сыром» виде со всеми описанными выше проблемами их полноты и качества.

Далее мы сформулировали основные задачи и проблемы, которые необходимо решить при анализе RWD и получении надежных RWE.

Анализ целостности и уникальности данных. При анализе необходимо оценить: а) принадлежность каждой записи внутри и между источниками конкретному пациенту/участнику (наличие уникального связующего идентификатора, обеспечивающего целостность информации); б) отсутствие дубликатов — в RWD возможны повторения записей внутри одного источника, а также внесение одной и той же информации в разные источники (если дубликаты не выявить, результаты будут существенно искажены).

Возможность и методология восполнения пропущенных данных. Большинство методов восполнения данных разработаны для клинических исследований и предполагают случайность их отсутствия, соответственно, для RWD они чаще всего неприменимы. В качестве перспективного рассматривается метод множественной импутации (multiple imputation) [12, 19], который позволяет одновременно учитывать несколько характеристик субъектов анализа. При этом не должно быть «зацикленности» на восполнении данных — для получения RWE отсутствие данных само по себе информативно и подлежит отдельному анализу.

Определение источников смещений, систематических ошибок и их учет в анализе. Возможности компенсации смещений и систематических ошибок во многом закладываются в дизайне исследований. В целом для анализа RWD характерно широкое применение многофакторных методов, вводящих в анализ поправку на исходные либо изменяющиеся со временем ковариаты [19, 22]. Неоднородность источников зачастую обусловливает применение особых методов для исключения дисбаланса, таких как псевдорандомизация (propensity score matching), маргинальное структурное моделирование и анализ больших данных.

Интерпретируемость результатов относительно поставленных целей и задач. Отсутствие непосредственного контроля над источником данных (за исключением отдельных первичных RWD) приводит к тому, что всегда сохраняется риск отсутствия значительного объема данных или степени неструктурированности (не позволяющей выделить нужные элементы для анализа). Результаты становится невозможно оценить как статистически (низкая точность результата), так и клинически (невозможность интерпретировать находки относительно ожидаемой популяции). Естественно, часть таких рисков снимается грамотным планированием, но их тем не менее всегда нужно учитывать при представлении результатов и формировании выводов для RWE.

Заключение

Таким образом, данные рутинной практики (Real World Data, RWD) играют основополагающую роль, лежат в основе всех процессов и последовательности шагов, направленных на получение доказательств рутинной практики (Real World Evidence, RWE) и, как следствие, на принятие решений.

Планирование исследований необходимо начинать с определения потребностей в RWE и типах решений и далее выстраивать все этапы (см. рис. 1, 3). Разработку концепции (синопсиса) исследования важно начинать только после предварительной оценки RWD: оценка самих данных, источников данных, оценка особенностей RWD и влияние этих факторов на интерпретацию результатов и качество исследования. Только с учетом стратегического и тактического уровней работы следует переходить к операционному уровню — планированию и реализации конкретного исследования. Подобный системный подход будет способствовать повышению качества получаемых RWE.

Рис. 3. Разработка исследования, построенного на RWD.

ИРК — индивидуальная регистрационная карта.

Развитие направления RWE как системы знаний требует от участников — регуляторных органов, учреждений здравоохранения, профессиональных сообществ и медицинского сообщества в целом, фармацевтических компаний и компаний, работающих в смежной сфере исследований или с данными, — единого видения, системного подхода, единой методологии. Именно совместные усилия — партнерство в этой области — будут способствовать значимому и качественному прорыву данного направления. Развитие направления RWE может быть одним из важных шагов на пути к внедрению и развитию пациент-ориентированного подхода, а также внедрению и развитию концепции результат-ориентированного здравоохранения.

Конфликт интересов. Авторы являются сотрудниками компании, являющейся спонсором проведения исследований рутинной клинической практики, и сотрудниками организации, занимающейся проведением исследований.

Финансирование. Статья опубликована без финансовой поддержки.

Авторы заявляют об отсутствии конфликта интересов.

The authors declare no conflict of interest.

Подтверждение e-mail

На test@yandex.ru отправлено письмо со ссылкой для подтверждения e-mail. Перейдите по ссылке из письма, чтобы завершить регистрацию на сайте.

Подтверждение e-mail



Мы используем файлы cооkies для улучшения работы сайта. Оставаясь на нашем сайте, вы соглашаетесь с условиями использования файлов cооkies. Чтобы ознакомиться с нашими Положениями о конфиденциальности и об использовании файлов cookie, нажмите здесь.