Как следует представлять данные рандомизированных контролируемых исследований

С.Е. Бащинский, главный редактор


Рандомизированные контролируемые исследования считаются “золотым стандартом” для оценки эффективности лечебных и профилактических вмешательств. На основании их результатов делаются выводы о пользе того или иного метода лечения или профилактики и оценивается величина эффекта от вмешательства. Специальные работы, проведенные в 90-е годы, показали, что от того, как преподносятся врачам данные научных исследований, во многом зависит решение специалистов применять или не применять их на практике. Сказанное становится особенно актуальным в наше время, когда появилась отчетливая тенденция к преобладанию клинических исследований, финансируемых фармацевтической промышленностью. Озабоченность мировой научной общественности качеством представления данных рандомизированных контролируемых исследований выразилась в принятии рядом ведущих медицинских журналов летом 1996 года единых методических требований для авторов публикаций [1].

Авторы должны представить основные результаты исследования таким образом, чтобы была возможность оценить эффективность вмешательства не только качественно, но и количественно. Это позволяет читателям определить, достаточна ли клиническая значимость эффекта (не путать со статистической значимостью!), как соотносится полезный эффект с возможным риском и побочными действиями вмешательства, целесообразно ли новое вмешательство с экономической точки зрения. Эти соображения и должны в конечном итоге быть основой для принятия решений о внедрении результатов исследования в практику.

Чаще всего в исследованиях идет речь о сравнении результатов двух (или более) разных воздействий или результатов воздействия и отсутствия такового (плацебо). Плацебо-контролируемые исследования оправданы в случаях, когда не существует альтернативного способа лечения, эффективность которого не вызывает сомнений. Так, например, недопустимо оценивать эффект новых антикоагулянтов при остром инфаркте миокарда по сравнению с плацебо, поскольку убедительно доказана польза аспирина.

Существует 3 основных параметра для представления эффекта вмешательства:

— относительное снижение частоты неблагоприятных исходов;

— абсолютное снижение частоты неблагоприятных исходов;

— число больных, которых нужно лечить в течение определенного времени, чтобы предотвратить один неблагоприятный исход.

При любом способе представления данных недостаточно указать на наличие статистически достоверного различия по критерию p; необходимо рассчитать 95% доверительный интервал, в пределах которого может колебаться величина эффекта. Например, перед врачом стоит проблема выбора между препаратами А и В. Он знает, что стоимость этих препаратов и число побочных эффектов одинаковы. Из разных исследований известно, что применение этих препаратов на сходных группах больных сокращало сроки болезни на 25% по сравнению с плацебо, p<0,05. Этой информации явно недостаточно для принятия решения. При более внимательном изучении литературы выясняется, что применение лекарства А привело к сокращению сроков болезни на 25% по сравнению с лечением плацебо, 95% доверительный интервал от 10 до 35%, p=0,003, а препарат В сокращал сроки заболевания на 25% при 95% доверительном интервале от 1 до 40%, р=0,045. Из этих данных ясно, что предпочтение следует отдать препарату А, поскольку даже нижняя граница доверительного интервала соответствует ощутимому клиническому эффекту.

Относительное снижение частоты неблагоприятных исходов

Относительные цифры чаще всего применяются для описания эффективности вмешательств. Например, в исследовании эффективности препарата, снижающего уровень холестерина, сообщается о 50% снижении риска развития инфаркта миокарда. Но может ли одна эта цифра даже при наличии статистической значимости дать полное представление о клинической значимости эффекта? Очевидно нет. Это можно проиллюстрировать двумя гипотетическими исследованиями влияния гипохолестеринемических препаратов на риск развития инфаркта миокарда. В первом исследовании объектом вмешательства были пациенты с высоким риском этого заболевания. В течение 5 лет 1000 пациентов ежедневно принимали исследуемый препарат, сопоставимая группа из 1000 других пациентов получала плацебо. В течение всего 5-летнего периода наблюдения инфаркт миокарда развился у 500 пациентов из группы плацебо и только у 250 — из основной группы. Снижение относительного риска (СОР) развития инфаркта миокарда в течение 5 лет составило 50% (СОР=(0,5—0,25)/0,5 х 100%). Поскольку лечение изучаемым препаратом предотвратило 250 инфарктов миокарда за 5 лет в группе из 1000 пациентов с высоким риском, результат можно считать клинически значимым. В другом исследовании тот же препарат назначали группе из 1000 пациентов с низким риском развития инфаркта миокарда, 1000 таких же пациентов получали плацебо. В течение 5 лет наблюдения в группе плацебо развилось 4 инфаркта миокарда, в группе лечения — 2. Казалось бы, здесь был достигнут такой же впечатляющий результат, как и в первом исследовании: СОР составило 50% ((0,004—0,002)/0,004 х 100%)! Однако, поскольку на самом деле с помощью лечения удалось предотвратить только 2 инфаркта миокарда за 5 лет, результат вряд ли следует считать клинически значимым.

Из этого примера можно сделать два важных вывода. Первый: отдельно взятые относительные цифры сами по себе ничего не говорят о клинической эффективности вмешательства. Второй: при проведении профилактических вмешательств (как первичных, так и вторичных) клинический эффект больше в популяции с высоким исходным риском и меньше в популяции с низким исходным риском неблагоприятного исхода, в отношении которого предпринимается вмешательство. Результаты, представленные в виде относительных величин, имеют одно преимущество: их можно распространять на популяции больных с разным исходным риском неблагоприятного исхода.

Абсолютное снижение частоты неблагоприятных исходов

Абсолютные цифры позволяют получить более объективное представление о реальном эффекте вмешательства. В первом примере лечение позволило предотвратить 250 инфарктов на 1000 леченых больных; снижение абсолютного риска (САР) составило 0,25 или 25%. Во втором примере лечение предотвратило 2 инфаркта на 1000 леченых; САР составило 0,002 или 0,2%.

 

Число больных, которых нужно лечить в течение определенного времени, чтобы предотвратить один неблагоприятный исход

Этот показатель (NNT, number needed to treat), впервые введенный A. Laupacis et al. [2], оказался очень удобным и наглядным для сравнения эффективности вмешательств. NNT — величина, обратная САР, рассчитывается как 1/САР. В первом примере число пациентов, которых нужно лечить в течение 5 лет, чтобы предотвратить один неблагоприятный исход, составляет 4 (1/0,25), во втором примере — 500 (1/0,002). Легко подсчитать, что эффективность применения одного и того же препарата в группе пациентов с высоким риском в 125 раз выше, чем в группе с низким риском.

Все указанные методы представления эффекта вмешательства на самом деле комплементарны, поэтому лучше всего приводить и относительные, и абсолютные цифры в сочетании с числом больных, которых нужно лечить в течение определенного времени, чтобы предотвратить один неблагоприятный исход. Как абсолютные, так и относительные величины эффекта следует представлять вместе с рассчитанным для них доверительным интервалом. Именно такой метод используется для представления данных в рефератах исследований, публикуемых “Международным журналом медицинской практики”. В ряде случаев редакторы журнала самостоятельно рассчитывают необходимые параметры на основании информации, взятой из реферируемой статьи.

Способы представления результатов научных исследований и восприятие врачами этих результатов — не просто академический вопрос, а важнейший момент для принятия клинических решений. Сказанное можно проиллюстрировать примером из остроумного исследования T. Fahey et al. [3]. Авторы разослали 182 анкеты в различные учреждения здравоохранения, занимающиеся вопросами финансирования и внедрения новых медицинских программ. В качестве исходного материала они взяли данные двух реальных научных исследований — по проведению реабилитационных мероприятий после операции аортокоронарного шунтирования и по применению маммографии для массового обследования с целью выявления ранних стадий рака молочной железы. Данные об эффективности этих вмешательств были представлены в виде четырех разных показателей: снижения относительного риска, снижения абсолютного риска, числа больных, которых нужно лечить (или обследовать), чтобы предотвратить один неблагоприятный исход, и процента больных без неблагоприятных исходов. Респондентам эти данные были выданы за результаты четырех различных исследований по каждой из двух проблем. Авторы предложили в анкете оценить целесообразность внедрения двух новых медицинских программ, основываясь на данных четырех “разных” исследований. При анализе результатов анкетирования выяснилось, что 79% респондентов были бы готовы внедрить программу по применению маммографии, основываясь на данных снижения относительного риска, и только 38% — основываясь на данных снижения абсолютного риска. Программу реабилитации одобрили 76% респондентов по данным относительных цифр и 56% — по данным абсолютных. И лишь три респондента (не медики по образованию!) догадались, что на самом деле анкеты содержали результаты только двух исследований, представленные четырьмя разными способами.

Обсуждаемая в этой статье проблема восприятия читателями результатов научных исследований неразрывно связана с качеством организации исследований и способом представления данных. В этом же номере журнала в статье В.В. Двойрина рассказывается о некоторых важных для читателей медицинских журналов особенностях организации контролируемых рандомизированных исследований. Рандомизация вовсе не гарантирует надежности исследования, это только необходимое, но недостаточное условие. Чтобы читатели могли сделать обоснованные выводы о надежности исследования, его авторы должны представить достаточно полную информацию. До сентября 1996 года не было единых требований для авторов по представлению результатов рандомизированных контролируемых исследований, хотя и существовали отдельные рекомендации [4, 5]. После опубликования рекомендаций группы CONSORT (Consolidated Standards of Reporting Trails) [1] ситуация, похоже, изменится. С января 1997 г. журналы JAMA, Lancet и BMJ обязали авторов следовать этим рекомендациям. Ожидается, что все крупные журналы в скором времени присоединятся к ним. Редакция “Международного журнала медицинской практики” публикует полностью текст этих рекомендаций, призывая российских ученых-медиков использовать их в своих научных отчетах. Мы приглашаем российских ученых присылать в редакцию результаты оригинальных исследований, оформленные в соответствии с приведенными ниже требованиями.

Таблица.

Структура отчета рандомизированного контролируемого исследования (воспроизведено по JAMA [1])

1_1.gif (15318 bytes)

 

Литература

1. CONSORT Group. Improving the quality of reporting of randomised controlled trials: the CONSORT statement. JAMA 1996;276:637—39.

2. Laupacis A., Sackett D.L., Roberts R.S. An assessement of clinically useful measures of the consequences of treatment. N Engl J Med 1988;318:1728—33.

3. Fahey T., Griffiths S., Peters T.J. Evidence based purchasing: understanding results of clinical trials and systematic reviews. BMJ 1995;311:1056—59.

4. The Asilomar Working Group. Checklist of information for inclusion in reports of clinical trials. Ann Intern Med 1996; 124: 741—43.

5. Standards of Reporting Trials Group. A proposal for structured reporting of randomized controlled trials. JAMA 1994;272:1926—31.


Возврат к содержанию| Возврат на home page "Международного журнала медицинской практики"| Возврат на home page издательства "МедиаСфера"