С.Ю. Варшавский
Развитие методологии клинических испытаний.
Анализ выполненного в 1948 г. Британским Советом по
медицинским исследованиям испытания
стрептомицина с позиций современных норм
проведения клинических испытаний
Научно-исследовательский институт кардиологии, Ст-Петербург
Введение
В 1948 г. британские ученые провели первое клиническое испытание лекарственного препарата с использованием контрольной группы. Это испытание было посвящено изучению возможности применения стрептомицина для лечения больных туберкулезом легких. Стрептомицин был открыт профессором С.Я. Ваксманом в 1944 г. В результате дальнейшего интенсивного изучения этого антибиотика в испытаниях in vitro было показано, что этот препарат подавляет рост микобактерий туберкулеза. Впоследствии эти данные были подкреплены результатами испытаний на животных. Тем не менее, поскольку до 1948 г. не было проведено ни одного контролируемого испытания на человеке, сделать окончательные выводы об эффективности этого препарата было невозможно. Здесь уместно процитировать слова одного из ученых, проводивших в 1948 г. испытание стрептомицина под руководством Совета по медицинским исследованиям: "Стало очевидным, что в будущем любые заключения, касающиеся лечебных свойств нового химиотерапевтического препарата, могут считаться достоверными только если они основаны на результатах клинических испытаний с использованием необходимого контроля".
Испытание стрептомицина в 1948 г. было первым контролируемым клиническим испытанием. Поэтому анализ британского исследования с позиций современных норм проведения клинических испытаний (International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use — ICH GCP, 1997) представляет особый интерес не только ввиду возможности оценки того, насколько прогрессивным для своего времени было данное исследование. Подобный анализ позволяет также проследить развитие методологии клинических испытаний за последние 50 лет.
Метод проведения испытания
По своей методологии испытание стрептомицина в 1948 г. было очень близким тому, что в современной науке называется "двойной слепой метод". Положительный эффект стрептомицина при лечении туберкулеза оценивался на основе сравнительного анализа данных экспериментальной группы (син.: основная группа, группы вмешательства, т.е. группа больных, которым были назначены стрептомицин и постельный режим) и контрольной группы (т.е. больных, которым был назначен только постельный режим). Ни участники испытания, ни исследователи, осуществлявшие анализ результатов, не знали о том, к какой группе отнесен тот или иной больной.
Набор участников и рандомизация
Набор участников испытания занял 9 мес (с января по сентябрь 1947 г.). Разработке критериев включения их в испытание было уделено особое внимание. Чтобы избежать влияния сопутствующих факторов, обязательно влияющих на конечный результат и вызывающих появление систематической ошибки (так называемые вмешивающиеся факторы), нужно было выбрать такую форму туберкулеза, при которой не применялось бы никакого другого способа лечения, кроме строгого постельного режима. При этом для достижения статистически значимых результатов требовалось, чтобы прогноз лечения стрептомицином для включенных в испытание больных был хотя бы до некоторой степени благоприятным. По этой причине больные с хронической формой туберкулеза, а также больные с толстостенными кавернами не были включены в испытание. Вероятность возникновения случайной ошибки можно было снизить благодаря сведению к минимуму различий исходных характеристик (таких как возраст и тип каверн) предполагаемых участников испытания. С учетом всех перечисленных соображений критерии включения в испытание были определены следующим образом: недавно возникший прогрессирующий двусторонний туберкулез легких с бактериологически установленным диагнозом, не требующий наложения искусственного пневмоторакса, в группе больных в возрасте от 15 до 25 лет (верхнее ограничение было впоследствии расширено до 30 лет).
К сентябрю 1947 г. в испытание были включены 109 больных, и набор участников был закончен. Чтобы подтвердить критерии включения в испытание и дать оценку общему состоянию участников на этот момент, было проведено предварительное обследование каждого больного, длившееся неделю. Двое больных, умерших в течение 1-й недели с начала наблюдения, были исключены из статистического анализа. Остальные участники испытания были рандомизированно распределены либо в экспериментальную (55 человек), либо в контрольную (52 человека) группу. Рандомизация участников испытания была осуществлена методом, разработанным профессором А.Б. Хиллом, с помощью статистических серий случайных чисел. Поскольку испытание должно было проводиться двойным слепым методом, ни больные, ни исследователи, в том числе координатор, не имели никакой информации о включении того или иного больного в экспериментальную либо контрольную группу. Документы со сведениями о лечении, назначенном конкретному участнику испытания, содержались в запечатанных конвертах. Сразу после включения больного в испытание, но до направления его в исследовательский центр работники координирующего центра вскрывали конверты и в зависимости от присвоенного номера будущему участнику испытания назначали стрептомицин и постельный режим или только постельный режим. Информация о назначенном лечении передавалась ответственному медицинскому работнику в соответствующий исследовательский центр. Процедуры рандомизации и обеспечения слепого метода, разработанные британскими учеными, по своей сущности соответствуют нормам ICH GCP и отличаются от последних только своим техническим исполнением (ICH GCP, пункт 4.7; например, в современной науке для генерирования серий случайных чисел используются компьютерные программы). Более серьезная проблема состоит в том, чтобы участвующие в испытании исследователи не имели никакой информации о распределении больных по группам. С помощью использования плацебо и кодирования препаратов в современных испытаниях удается достичь того, чтобы ни один человек, участвующий в испытании, не знал о фактическом отнесении больного к той или иной группе. Однако в британском исследовании работники координационного центра, вскрывавшие конверты с именами больных, а также ответственные медицинские работники в исследовательских центрах неизбежно располагали этой информацией. Такая осведомленность лиц, имеющих отношение к испытанию, не является приемлемой с современной точки зрения. Однако по личному свидетельству авторов статьи, все лица, занятые в рандомизации, строго соблюдали требование неразглашения информации о том, к какой группе отнесен тот или иной пациент, и таким образом условия конфиденциальности были выполнены.
Адрес для корреспонденции: Варшавский С.Ю., заведующий лабораторией клинических испытаний, Научно-исследовательский институт кардиологии, 194156 Ст-Петербург, пр. Пархоменко, 15. Тел.: (812) 552-87-85; факс: (812) 327-43-83.
Права и безопасность участников испытания
Наиболее серьезные расхождения между методами британских ученых и современными международными стандартами проведения клинических испытаний касаются вопроса прав и безопасности участников испытания. Положения ICH GCP требуют, чтобы до включения в испытание участника от него было получено добровольное согласие, данное на основе полной информированности — так называемое информированное согласие (ICH GCP, пункты 2.9 и 4.8). Между тем в британском исследовании предполагаемые участники не были поставлены в известность о том, что на них будет проведено испытание нового препарата. Все они были занесены в листы ожидания на прием в медицинские учреждения и были включены в испытание с согласия участвующих в нем исследовательских центров. Поскольку больным, попавшим в экспериментальную группу, были назначены инъекции стрептомицина 4 раза в день, эти участники испытания не могли не заметить, что им назначено некое особое, до тех пор не применявшееся лечение, хотя они и не располагали никакой информацией о вводимом им препарате. Что касается больных контрольной группы, то их лечение ничем не отличалось от обычного, и они не знали об испытании до самого его окончания. Единственное, что могло показаться им подозрительным, было то, что в ходе набора участников испытания они были приняты на лечение с листа ожидания вне очереди, т.е. существенно быстрее, чем обычно. Необходимо отметить, что без использования плацебо единообразие в лечении больных в экспериментальной и контрольной группах неизбежно нарушается, хотя оценить, каким образом это влияло на качество собранных данных, практически невозможно. В современных испытаниях при полной осведомленности пациентов об участии в испытании использование плацебо (или иного препарата, используемого для сравнения) необходимо. Далее, хотя вся информация медицинского характера об участниках испытания считалась конфиденциальной, во всех документах были использованы имена участников испытания, а не идентификационные коды, как того требует ICH GCP (см. ICH GCP, пункт 5.5.5). Кроме того, информация о токсичности препарата была недостаточной для проведения испытания на человеке и, как признают сами ученые, серьезным упущением данного исследования было отсутствие стандартных тестов и анализов, которые бы позволили составить представление о нежелательных побочных эффектах стрептомицина. Нужно также отметить, что больным не было предоставлено никакой компенсации на случай отрицательного воздействия препарата на их здоровье (ICH GCP, пункт 5.8).
Тем не менее было бы несправедливым полагать, что британские ученые не уделили должного внимания этическим вопросам, связанным с проведением испытания на людях. Во-первых, при определении критериев включения в испытание исходили из того, что при выбранной форме туберкулеза не требуется никакого другого лечения, кроме постельного режима. Во-вторых, из-за отсутствия информации о нежелательных побочных эффектах предполагалось, что лечение стрептомицином может оказаться в худшем случае неэффективным, но не окажет отрицательного воздействия на течение болезни. В-третьих, предполагалось, что сам факт участия в испытании не может нанести ущерб здоровью участников. В то время как в современной медицине при исследовании нового препарата использование контрольной группы представляется необходимым условием проведения испытания, отнесение больных к контрольной группе представляло для британских ученых серьезную этическую проблему. Чтобы избежать вопроса о неназначении предположительно эффективного препарата какой-то группе больных, британские ученые использовали весь стрептомицин, доступный на тот момент Совету по медицинским исследованиям в Великобритании. Таким образом, можно заключить, что основное требование ICH GCP — а именно положение о том, что интересы участников испытания преобладают над интересами науки и общества (ICH GCP; пункт 2.3) — не было нарушено.
Сбор данных
Оценка состояния больных и лабораторные анализы проводились не реже чем раз в месяц. Оценивались следующие показатели: изменения общего состояния, температуры и массы тела, скорости оседания эритроцитов и рентгенологической картины. После завершения испытания окончательная оценка изменений рентгенологической картины производилась консилиумом из трех квалифицированных специалистов (участвующий в испытании исследователь и два независимых эксперта). Кроме того, в большинстве исследовательских центров были собраны данные о токсичности препарата и результаты бактериологического исследования.
Организация наблюдения за больными и сбора данных во многом отвечала современным требованиям. Так, в дополнение к историям болезни были разработаны специальные стандартные формы, соответствовавшие по содержанию индивидуальным регистрационным картам и позволявшие учитывать все необходимые данные о каждом участнике испытания во всех исследовательских центрах, участвующих в нем. Эти стандартные формы содержали сведения из истории болезни участника испытания, результаты предварительного осмотра, обоснование включения в испытание, результаты ежемесячных осмотров с отчетом об изменениях в течении заболевания, сведения о побочных реакциях, температуре тела и проводимом лечении (ICH GCP; пункты 1.11 и 4.9). Исследователи были подробно проинструктированы о порядке наблюдения за больными; процедуры и частота проведения осмотров и лабораторных исследований были оговорены, что отвечает требованиям к стандартным процедурам (ICH GCP; пункты 1.55 и 5.5.3, б). Поскольку испытание являлось многоцентровым, была обеспечена координация исследователей. Координатор испытания постоянно поддерживал контакт с исследовательскими центрами и был обязан посещать места проведения испытания через установленные промежутки времени. Помимо этого, были организованы регулярные встречи лечащих врачей и патологоанатомов для обсуждения хода испытания. Разумеется, ни постоянный контроль, ни аудиторская проверка испытания в 1948 г. не проводились, и соблюдение условий его проведения в значительной степени зависело от добросовестности исследователей. Невзирая на отсутствие контролирующих структур, данные о воздействии стрептомицина на течение заболевания представляются достаточно полными и достоверными, насколько это можно оценить спустя более 50 лет. Тем не менее авторы статьи признают, что оценка нежелательных побочных эффектов стрептомицина (в особенности, воздействие на вестибулярный аппарат) было нерегулярным, и данные о них оказались недостаточными. Очевидно, что причиной тому было отсутствие официальных контролирующих и координирующих структур, необходимых с точки зрения требований ICH GCP.
Анализ результатов испытания
После завершения испытания в 1948 г. был проведен подробный анализ его результатов по всем показателям. Авторы статьи не приводят детального описания статистических методов. В любом случае сравнение технических аспектов проведения статистического анализа в 1948 г. с современными методами не имеет смысла, поскольку в настоящее время вся статистическая обработка проводится с использованием компьютеров и пакетов прикладных статистических программ. Вместо этого необходимо отметить несколько существенных недостатков, касающихся методологии проведенного анализа и достоверности полученных результатов. Во-первых, улучшение состояния больных наблюдалось как в экспериментальной, так и в контрольной группах. Вероятно, строгий постельный режим сам по себе оказал положительное влияние на течение заболевания и, таким образом, являлся "вмешивающимся" фактором. Тем не менее, поскольку воздействие этого фактора могло привести только к уменьшению разницы результатов между контрольной и экспериментальной группами, а никак не к ее увеличению, статистическая значимость результатов скорее подтверждается, нежели опровергается влиянием этого фактора. Более того, нельзя не признать, что хотя статистическая мощность испытания уменьшается при наличии любого "вмешивающегося" фактора, избежать назначения больным в контрольной группе строгого постельного режима было не только невозможно, но и привело бы к возникновению других "вмешивающихся" факторов, которые подорвали бы научную ценность испытания. Гораздо более серьезной проблемой для статистического анализа представляется вопрос о сроках применения стрептомицина. Согласно первоначальному плану испытания лечение стрептомицином должно было продолжаться в течение 6 мес. Однако в ходе испытания от американских ученых поступили сведения о том, что у микобактерий туберкулеза может развиваться устойчивость к стрептомицину и наибольшая эффективность лечения достигается при использовании препарата в течение 3—4 мес. На основании этих данных было решено прекратить применение стрептомицина у большинства (41 человек) больных в экспериментальной группе по истечении 4-го месяца от начала испытания. Действительно, у 21 участника испытания было отмечено ухудшение состояния в течение последних 2 мес (т.е. в течение 5-го и 6-го месяца от начала испытания). Имеются некоторые основания предполагать, что ухудшение состояния больных было вызвано не прекращением лечения стрептомицином, а именно развитием устойчивости к этому препарату, поскольку ухудшение состояния также наблюдалось и у больных, получавших стрептомицин в течение 6 мес. Более того, определение чувствительности возбудителя к стрептомицину показало, что при использованных в испытании дозах устойчивость к этому препарату развивается в течение первых 2—3 мес с момента начала лечения. Тем не менее статистический анализ данных был представлен таким образом, как если бы лечение всех больных продолжалось полные 6 мес, поэтому установить причинно-следственную связь между ухудшением состояния больных и продолжительностью лечения стрептомицином невозможно.
Далее, на основании результатов ежемесячных определений чувствительности возбудителя к стрептомицину можно заключить, что повышенная устойчивость к нему находится в прямой зависимости от исходной тяжести заболевания (а именно от размера и числа очагов затемнения в легочной ткани на рентгенограмме. Хотя критерии включения в испытание были определены таким образом, чтобы свести к минимуму различия в исходных характеристиках участников испытания, разница в исходном состоянии больных, вероятно, могла в значительной мере повлиять на эффективность лечения и тем самым снизить статистическую значимость результатов испытания.
Не менее серьезную проблему для статистической значимости результатов испытания представляет собой порядок анализа качественных данных (а именно рентгеновских снимков, на основании которых определяют улучшение или ухудшение состояния больного). Порядковая шкала результатов рентгенологического исследования была упрощена до трех категорий: ухудшение состояния, отсутствие изменений и улучшение состояния. В ходе предварительного анализа мнения членов экспертного совета относительно определения этих категорий существен но разошлись. Так, на рентгенограммах у одного и того же участника испытания могли выявляться одновременно увеличение каверн и исчезновение инфильтративных изменений. В результате возникли серьезные разногласия по вопросу о том, что следует считать улучшением, а что — ухудшением состояния больного. Из-за этого воспроизводимость результатов рентгенологического исследования была низкой. В ходе последующего их обсуждения было решено определить категории состояния больного на основании дальнейшего прогноза заболевания. Это привело к значительному увеличению воспроизводимости, однако в современной науке определение категорий до начала проведения статистического анализа считается необходимым условием.
Несмотря на все перечисленные недостатки, результаты анализа данных по важнейшим критериям испытания представляются статистически значимыми. Так, улучшение состояния по истечении 6 мес было замечено у 51% участников испытания в экспериментальной группе и только у 8% в контрольной группе. Кроме того, 7% больных (4 из 55) в экспериментальной группе и 27% (14 из 52) в контрольной группе умерли до завершения испытания (p<0,01). Поскольку обобщаемость этих результатов является достаточно высокой, испытание стрептомицина в 1948 г. можно считать первым статистически значимым клиническим испытанием в истории медицины.
Заключение
Британское исследование было большим достижением в методологии проведения клинических испытаний. Хотя по сравнению с современными стандартами методы британских ученых могут показаться весьма далекими от совершенства, нужно отметить, что многие очевидные недостатки этого испытания объясняются не методологическими ошибками, а скорее отсутствием регулирующих структур, позволяющих адекватно контролировать ход испытания. Кроме того, необходимо учитывать, что это испытание было одним из первых клинических испытаний стрептомицина и, как любое предварительное исследование, неизбежно осложнялось отсутствием достаточной информации об оптимальных дозах и сроках применения данного препарата. Наибольшая заслуга исследователей состоит в том, что они первыми определили необходимые условия для сбора достоверных и надежных клинических данных, а именно: использование контрольной группы, определение критериев включения больных в испытание, рандомизация больных, применение слепого метода, определение стандартных рабочих процедур и введение индивидуальных регистрационных карт, координация многоцентрового испытания и использование статистического анализа.
Многие проблемы, с которыми столкнулись британские ученые, нашли свое разрешение в дальнейшем развитии методов проведения клинических испытаний. Так, были установлены официальные процедуры, контролирующие проведение испытаний (например, ведение единого протокола, постоянный контроль и аудиторская проверка соблюдения условий испытания), были введены системы защиты информации и прав участников испытания (Экспертный совет учреждения /Независимый комитет по этике), а также определен порядок сбора предварительной информации. В целом результаты сравнительного анализа методов проведения испытания в 1948 г. и положений ICH GCP могут служить яркой иллюстрацией развития методологии проведения клинических испытаний, а также того, какие конкретные задачи стояли перед создателями современных стандартов проведения клинических испытаний.
Возврат к содержанию| Возврат на home page "Международного журнала медицинской практики"| Возврат на home page издательства "МедиаСфера"