http://www.rusmg.ru/php/content.php?id=2064
опубликовано 22.02.2005 (Московское время 16:49) -->
С.В. Царенко, Г.К. Болякина НИИ скорой помощи им. Н.В. Склифосовского, Всероссийский институт научной и технической информации (ВИНИТИ) РАН), Москва
В 2000 г. мы уже обращались к вопросам методологии доказательной медицины в клинической практике анестезиологов и реаниматологов [4]. К сожалению, за прошедшее время почти ничего не изменилось ни в отечественных исследованиях, ни на практике. В связи с этим в предлагаемом сообщении будут затронуты наиболее важные, на наш взгляд, положения доказательной медицины, без знания и понимания которых невозможно читать и оценивать зарубежные статьи, а также планировать и осуществлять исследования, отвечающие современным требованиям медицинской науки и клинической практики [2].
Как известно, на рубеже 80-90-х годов ХХ века родилась новая наука – клиническая эпидемиология, которая отбирает и систематизирует достоверные результаты различных методов диагностики и лечения [9]. Целью клинической эпидемиологии являются разработка и применение таких методов клинического наблюдения, которые дают возможность делать справедливые заключения, избегая влияния систематических и случайных ошибок. Для исключения систематических ошибок учитывают особенности отбора пациентов (сравниваемые группы пациентов различаются только по изучаемому признаку, но не по другим факторам, влияющим на исход). Кроме того, проводят оценку вмешивающихся факторов (не должно быть связи одного фактора с другим и искажения эффекта одного фактора эффектом другого). Обязательным является внимание к методам измерения (в сравниваемых группах больных используются разные методы измерения). Случайных ошибок избежать нельзя, но степень их влияния можно оценить количественно с помощью статистических методов.
Главный постулат клинической эпидемиологии – каждое клиническое решение должно базироваться на строго доказанных научных фактах. Этот постулат получил название "evidence-base medicine" – медицина, основанная на доказательствах, или доказательная медицина. Согласно принципам доказательной медицины в диагностике, лечении и профилактике заболеваний должны использоваться только те методы, эффективность которых доказана рационально организованными объективными сравнительными исследованиями. Верно и обратное. Методы, неэффективность которых доказана, не должны использоваться. Сложнее обстоит дело с использованием в широкой повседневной практике методов, эффективность которых не подтверждена еще в рамках доказательной медицины. Скорее всего, на широкое внедрение этих методов должен быть наложен временный мораторий.
Каким же требованиям должны соответствовать исследования, результаты которых можно рассматривать в качестве руководства к действию? Пожалуй, наиболее важные следующие:
Правильная организация (дизайн) исследования и математически обоснованный способ рандомизации.
Четко обозначенные и соблюденные критерии включения и исключения из исследования.
Правильный выбор критериев исхода болезни под влиянием лечения и без него.
Корректное использование статистических методов обработки данных.
С точки зрения организации различают следующие типы клинических исследований: экспериментальные (или контролированные, с преднамеренным вмешательством) и обсервационные. В экспериментальных исследованиях (в смысле организации исследований, а не использования животных) исследователь может контролировать или манипулировать тем фактором, влияние которого на исход болезни подлежит изучению и анализу. При отсутствии этой возможности исследования относятся к обсервационным. Несмотря на очевидное преимущество экспериментальных исследований, к обсервационным не следует относиться свысока. Более того, хорошо организованное обсервационное исследование гораздо информативнее плохо выполненного экспериментального.
Обсервационные исследования могут быть проспективными и ретроспективными. Безусловно, проспективные исследования предпочтительнее ретроспективных ввиду большей точности способа и временных интервалов сбора информации. По дизайну (организации) обсервационные исследования делятся на одномоментные (иногда также называются поперечными) и продольные, или лонгитудинальные исследования (т.е. проводимые на протяжении определенного временного интервала). К поперечным обсервационным исследованиям относят описание случая, исследование серии случаев, к продольным – исследование “случай-контроль”, когортное исследование. Исследование “случай-контроль” представляют собой ретроспективную оценку различий группы пациентов с той или иной болезнью (“случай”) и без этой болезни (“контроль”). Когортное исследование позволяет производить проспективное наблюдение за выделенной группой населения (когортой).
Экспериментальные исследования обязательно используют одну группу пациентов, которая подвергается тому или иному способу лечения (основная), и контрольную. В качестве контроля может служить и сам больной до лечения. Кроме того, основная (экспериментальная) и контрольная группа могут меняться местами по ходу исследования. Такой перекрестный дизайн позволяет уменьшить различия между группами больных, однако увеличивает вероятность ошибок из-за изменений патологического процесса во времени.
Обязательным условием хорошо спланированного экспериментального исследования является проведение рандомизации. Дословный перевод английского "random" означает "сделанный или выбранный наугад, случайный, беспорядочный". По некоторым данным, на сегодняшний день около 20% статей, публикуемых в ведущих медицинских журналах мира, содержат результаты рандомизированных исследований. Под рандомизацией понимают процедуру, обеспечивающую случайное распределение больных в экспериментальную и контрольную группы. Следует особо подчеркнуть, что рандомизацию проводят уже после того, как больной включен в испытание в соответствии с протоколом клинического исследования. Специалисты, занимающиеся этой проблемой, подчеркивают, что случайное, или рандомизированное, разделение не является синонимом беспорядочного, при котором процесс разделения не поддается математическому описанию. Рандомизация считается плохо организованной при разделении больных на группы по номеру истории болезни, страхового полиса или дате рождения. Лучше всего пользоваться таблицей случайных чисел, методом конвертов или путем централизованного компьютерного распределения вариантов лечения [2, 6, 7, 8, 9]. К сожалению, упоминание о процессе рандомизации не означает правильного ее проведения. Очень часто в статьях не указывается способ рандомизации, что ставит под сомнение хорошую организацию исследования.
Некоторые исследователи предпочитают перед началом испытания распределить пациентов по подгруппам с одинаковым прогнозом и только потом рандомизировать их отдельно в каждой подгруппе (стратификационная рандомизация). Корректность стратификационной рандомизации признается далеко не всеми [9].
Исследования могут быть одноцентровыми или многоцентровыми. В одном лечебном учреждении за короткий срок очень трудно сформировать выборку, однородную по всем прогностическим признакам, поэтому в испытания часто включаются несколько учреждений (многоцентровые исследования). Рандомизированные исследования могут быть открытыми и “слепыми” (маскированными). Открытым рандомизированное испытание считается в том случае, если и пациент, и врач сразу после проведения рандомизации узнают о том, какой вид лечения будет применен у данного больного. При слепом исследовании больному не сообщается о виде применяемого лечения, и этот момент обговаривается с пациентом заранее при получении информированного согласия на исследование. Врач узнает, какой вариант лечения получит больной, после процедуры рандомизации. При выполнении двойного слепого исследования ни врач, ни пациент не знают, какое из вмешательств применяется у конкретного пациента. В тройном слепом исследовании о типе вмешательства не знают больной, врач и исследователь (статистик), обрабатывающий результаты исследования.
Специалисты, имеющие дело с рандомизированными исследованиями, отмечают их трудности. Одна из серьезных проблем – сложность отбора пациентов (обычно в исследования, какими бы крупными они не были, можно включить только 4-8% больных из всей популяции с данным заболеванием). Это приводит к снижению обобщаемости результатов на популяцию, т.е. доказанные в исследовании результаты можно распространять только на больных, идентичных по своим характеристикам тем, которые включены в рандомизированные исследования. Следовательно, результаты одной клинической практики не всегда можно рекомендовать для использования в других условиях без проверки новым экспериментальным исследованием. Необходимо отметить, что сам принцип рандомизированных исследований не исключает получения ошибочных результатов при анализе и возможности статистических манипуляций.
Результаты нескольких рандомизированных исследований по какой-то проблеме могут объединяться. Количественный анализ объединенных результатов нескольких клинических испытаний одного и того же вмешательства называют метаанализом . За счет увеличения размера выборки при метаанализе обеспечивается большая статистическая мощность, чем в каждом отдельном испытании. Важно, однако, помнить, что некорректно проведенный метаанализ может вводить в заблуждение из-за недостаточной сопоставимости групп больных и условий проведения лечения в различных исследованиях [10].
Резюмируя сказанное, нужно отметить, что в настоящее время в мировой практике “золотым стандартом” считаются рандомизированные контролируемые (проспективные) испытания с двойным или тройным “слепым” контролем. Эти исследования относятся к так называемому I классу исследований. Материалы этих испытаний и проведенный на их основе метаанализ должны использоваться в медицинской практике в качестве источника наиболее достоверной информации.
Хорошо спланированные открытые экспериментальные исследования, обсервационные проспективные и ретроспективные, относятся ко II классу. При известной доле критичности результаты этих испытаний могут применяться в практике.
Исследования, в организации которых допущены значительные ошибки, описание случаев и серии случаев относятся к III классу. Они, как и индивидуальный врачебный опыт, мнение экспертов или “авторитетов” рассматриваются как не имеющие достаточной научной основы. Как говорят, некоторые врачи всю жизнь делают одни и те же ошибки и называют это клиническим опытом.
Проведенный нами краткий анализ клинических рандомизированных исследований по материалам публикаций в "Critical Care Medicine" за 2000-2001 гг. показал, что с помощью рандомизации изучают разные режимы ИВЛ и вспомогательной вентиляции легких, влияния многих лекарственных средств, видов нутритивной поддержки, эфферентной терапии, оценивают различные вмешательства при проведении искусственного кровообращения. Работы одноцентровые или многоцентровые проводятся в разных странах: Великобритании, Австрии, Франции, Греции, США, Испании, Японии, Италии, Нидерландах, Бельгии, Канаде, Германии. В зависимости от исследования количество больных, включенных в испытания, колеблется от 8 до нескольких сотен. К сожалению, только в двух работах из 18 указан способ рандомизации: в одном исследовании – таблица случайных чисел, в другом – метод запечатанных конвертов [1]. Важно подчеркнуть, что организация рандомизированных клинических испытаний у больных в критических состояниях имеет свои особенности и трудности [14].
Как не печально, приходится констатировать факт, что многие методы лечения продолжают использоваться в клинической практике, несмотря на доказанную испытаниями I класса неэффективность. В качестве примеров можно привести исследования, доказавшие неэффективность инфузии альбумина при гипоальбуминемии, низких доз дофамина для профилактики острой почечной недостаточности, ГБО при многих показаниях, в том числе при отравлениях окисью углерода и др. [3].
В качестве положительного примера влияния доказательных исследований на клиническую практику хотелось бы остановиться на рандомизированных контролируемых испытаниях при сепсисе. Как известно, проводимые в последние годы исследования, посвященные данной проблеме, не могли выявить улучшения исходов при различных терапевтических вмешательствах. В связи с этим была предпринята работа, поставившая целью на основе систематизированной оценки методологического качества рандомизированных испытаний выявить, улучшается ли со временем их качество и отличаются ли по методологическому качеству исследования, оценивающие результаты по летальности от исследований, использующих суррогатные оценки исходов [12]. Авторы разработали шкалу оценки качества методологии (MQAS, Methodological Quality Assessment Score), которая позволяет подвергать качество методологии рандомизированных контролированных испытаний по сепсису формализованной балльной оценке. В 2001 г. опубликованы результаты клинического исследования PROWESS (PROtein C Worldwide Evaluation in Severe Sepsis), доказавшего положительное влияние дротрекогина альфа (Ксигрис) при лечении тяжелого сепсиса – достоверное снижение летальности к 28-му дню[15]. Такого благоприятного результата применения нового лекарственного средства, как в PROWESS, не появлялось в литературе более десяти лет [5].
Для того, чтобы результаты доказательных исследований могли быть внедрены в практику, следует четко описывать те категории пациентов, лечение которых изучалось. Читатели должны сравнить их с теми больными, которых им приходится лечить. Для решения этой задачи обязательным является детальное описание и строгое соблюдение критериев включения больных в исследование и исключения из него. Желательно, чтобы эти критерии оценивались теми средствами, которые доступны в повседневной практике.
Следует особо остановиться на статистике, при применении которой наиболее часто встречаются серьезные ошибки. Очень часто исследователи нечетко представляют, какие статистические критерии должны быть использованы при разном дизайне исследований. Характерным примером является использование критерия Стьюдента при сравнении нескольких групп друг с другом без поправки на так называемый “эффект множественных сравнений”. Корректным в этой ситуации является использование дисперсионного анализа (ANOVA).
В то же время, непростительной ошибкой является статистический анализ различий между группами, выделенными из всей популяции обследованных, уже после получения результатов. Тенденциозность данного подхода приводит к ошибочным заключениям. Это не значит, что так нельзя поступать вовсе, просто после подобного анализа необходимо новое отдельное исследование для проверки полученных различий, в которых группы больных будут выделены до проведения лечения. Более того, современные возможности дисперсионного анализа и его программное обеспечение делает возможным корректное планирование исследований по сравнению нескольких групп больных с разными методами лечения между собой со значительной экономией сил и средств.
Достаточно характерной неточностью является непонимание существования ошибок первого и второго рода. Чаще всего используется ошибка первого рода (Альфа-ошибка). При величине этой ошибки в медицинских исследованиях меньше 5% (обычное обозначение – р<0,05) можно утверждать о наличии и достоверности различий между экспериментальной и контрольной группами. К сожалению, многие исследователи уверены, что при величине Альфа-ошибки, равной или большей 5%, группы больных ничем не отличаются и методы их лечения не имеют преимущества друг перед другом. Это не так. Для суждения об отсутствии достоверных различий между группами необходим расчет ошибки второго рода (Бетта-ошибки) Вероятность этой ошибки в медицинских исследованиях должна быть меньше 20%. Достичь такой величины Бетта-ошибки удается только при значительном числе обследованных больных, поэтому не найденные в большинстве исследований различия, как правило, объясняются просто недостаточным количеством наблюдений.
В качестве примера можно привести следующие расчеты. В контрольной группе пострадавших с тяжелой черепно-мозговой травмой (ЧМТ) летальность составляет 30-40%. Если в результате лечения летальность в экспериментальной группе снизится на 10%, то эффект лечения можно считать существенным. Если подобного рода снижение летальности не наблюдается, то для того, чтобы быть уверенным в отсутствии достоверных различий между группами при величине Бетта-ошибки менее 20%, понадобится обследование более 350 пострадавших. Если мы хотим доказать отсутствие меньших различий, например снижения летальности на 5%, пациентов понадобится в три раза больше.
Следующий принципиально важный вопрос в исследованиях на основе доказательной медицины – это оценка эффективности изучаемого метода лечения. Критерии эффективности делят на косвенные (суррогатные) и прямые. К косвенным относят положительные изменения какого-либо исследуемого показателя (например, повышение сниженного артериального давления, увеличение уменьшенного сердечного выброса, нормализация уровня каких-то биологических субстанций в крови, восстановление активности ферментов и т.п.). К прямым критериям эффективности относят выздоровление, снижение летальности и осложнений, сокращение срока госпитализации, улучшение качества жизни.
К сожалению, большинство исследований посвящено оценке суррогатных исходов. В качестве примера можно привести изучение уровня внутричерепного давления при ЧМТ. Высоко оценивая значение этого показателя для исхода повреждения мозга, нужно подчеркнуть тот важный факт, что и врача, и пострадавшего больше волнует не уровень внутричерепной гипертензии, а функциональный исход ЧМТ.
Об опасности ориентирования на суррогатные исходы свидетельствует немало фактов. Достаточно вспомнить испытания действия флекаинида для вторичной профилактики внезапной смерти после перенесенного инфаркта миокарда. Предпосылки для испытаний были вполне логичными: аритмии являются причиной внезапной смерти после инфаркта миокарда, флекаинид эффективно их купирует. Однако многоцентровое исследование с использованием флекаинида пришлось прервать из-за того, что больные в экспериментальной группе умирали чаще, чем в контрольной. При детальном рассмотрении свойств препарата оказалось, что он, кроме антиаритмического эффекта, оказывал аритмогенное действие [11].
Приведенные факты не означают, что на суррогатные исходы не надо опираться совсем. При отсутствии данных о влиянии метода лечения на прямые исходы можно осторожно ориентироваться на результаты изучения суррогатных.
Итак, организация, проведение и оценка результатов клинических исследований, выполненных на основе достижений доказательной медицины – сложный и дорогостоящий процесс, поэтому крайне важно использовать в широкой практике уже полученные данные.
Литература
Болякина Г.К., Закс И.О. Примеры рандомизированных исследований в интенсивной терапии (по материалам журнала "Critical Care Medicine" // Новости науки и техн. Сер. Медицина. Вып. Реаниматология. Интенсивная терапия. Анестезиология.– 2002.– № 2.– С. 22-28.
Власов В.В. Введение в доказательную медицину.– М.: Медиа Сфера, 2001.– 392 с.
Зильбер А.П. Научно-доказательная медицина: реальная польза или исследовательская мода? //Акт. пробл. мед. крит. сост.– Петрозаводск: Изд-во ПетрГУ, 2001.– Вып. 8.– С. 12-23.
Каменская В.Н., Каменская М.А., Болякина Г.К., Борисова Л.Ф. Методология доказательной медицины (evidence-based medicine) в клинической практике специалистов по медицине критических состояний (обзор литературы) // Вестн. интенс. терап.– 2000.– № 2.– С. 3-11.
Николаенко Э.М. Новое средство против киллера: протеин С в лечении больных с тяжелым сепсисом // Новости науки и техн. Сер. Медицина. Вып. Реаниматология. Интенсивная терапия. Анестезиология.– 2002.– № 4.– С. 21-22.
Планирование и проведение клинических исследований лекарственных средств / Под ред. Ю.Б. Белоусова.– М.: ООО "Изд-во Общества клинических исследователей", 2000.– 579 с.
Самородская И.В. Клинические исследования: контролируемые и рандомизированные // Новости науки и техн. Сер. Медицина. Вып. Реаниматология. Интенсивная терапия. Анестезиология.– 2002.– № 2.– С. 19-22.
Ступаков И.Н., Самородская И.В. Рандомизированные исследования – проблемы и перспективы // Бюлл. НЦССХ им. А.Н. Бакулева РАМН.– 2001.– Том 2, № 5.– С. 12-15.
Флетчер Р., Флетчер С., Вагнер Э. Клиническая эпидемиология. Основы доказательной медицины / Пер. с англ.– М.:Изд-во Медиа Сфера, 1998.– 352 с.
Brazzi L., Bertolini G., Minelli C. Meta-analysis versus randomised controlled trials in intensive care medicine// Intens. Care Med. – 2000 – Vol. 26 – P. 239-241.
Epstein A.E., Bigger J.T., Wyse B.J. et al. Preliminary report: Effect of encainid and flecainid on mortality in a randomized suppression after myocardial infarction // N. Engl. J. Med.– 1989.– Vol. 321.– P. 406-412.
Graf J., Doig G.S., Cook D.J., Vincent J.-L., Sibbald W.J. Randomizes, controlled clinical trials in sepsis: Has methodological quality improved over time? // Crit. Care Med.– 2002.–Vol. 30, No 2.– P. 461-472.
Healy D.P. New and emerging therapies for sepsis // Ann. Pharmacother.– 2002.– Vol. 36, No 4.– S. 648-654.
Hйbert P.C., Cook D.J., Wells G., Marshall J. The design of randomized clinical trials in critically ill patients // Chest.– 2002.– Vol. 121.– P. 1290-1300.
Kanji S., Devlin J.W., Piekos K.A., Racine E. Recombinant human activated protein C, drotrecogin alfa (activated): A novel therapy for severe sepsis // Pharmacotherapy.–2001.– Vol. 21, No 11.– P. 1389-1402.
Подписаться на:
Комментарии к сообщению (Atom)
Комментариев нет:
Отправить комментарий