Уважаемые посетители Портала Знаний, если Вы найдете ошибку в тексте, выделите, пожалуйста, ее мышью и нажмите Сtrl+Enter. Мы обязательно исправим текст!


Планирование медицинских исследований

Часть 1: Вводный обзор

Грамотное планирование медицинских исследований является неотъемлемой частью доказательной медицины.

Планирование медицинских исследований является достаточно сложным вопросом в математическом плане особенно в случаях, когда при статистической обработке проведенных исследований необходимо проверять несколько статистических гипотез или при невозможности использования для сравнения эффекта показателей равночисленных групп.

Поэтому мы познакомим вас лишь с общими подходами и приведем несколько наиболее простых приближенных формул для оценки численности сравниваемых групп.

Особенностью планирования клинических исследований является то, что исследователь никогда не имеет в своем распоряжении всей популяции (генеральной совокупности) для проведения исследования и обычно имеет дело только с выборкой из этой совокупности.

При этом особую важность приобретают задачи планирования, например, определение объема выборки, которого оказалось бы достаточно для формирования статистически значимого заключения о различиях (или отсутствии таких различий) в эффекте по результатам проведенного исследования.

На практике часто на этапе планирования исследования эта задача не решается строго, а планируемый объем назначается на основе прошлого опыта проведения аналогичных исследований.

При этом в процессе статистического анализа может оказаться, что полученных данных или недостаточно для статистически достоверного ответа на вопросы, ради которых проводилось исследование, или их структура не соответствует цели исследования. Исследователям надо иметь ввиду, что неэтичными являются исследования, имеющие чрезмерно большую численность включенных пациентов, так и исследования слишком малого объема.

Чтобы ответить на вопросы, поставленные перед клиническим исследованием, с помощью различных критериев приходится проверять нулевую гипотезу об отсутствии эффекта, сравнивая при этом выборочные средние, доли, кривые выживаемости и т.д. Вывод об отсутствии таких различий тесно связан с понятием чувствительность критерия.

Чувствительностью критерия называют его способность обнаружить различия. Чтобы оценить чувствительность критерия, нужно задать величину различий, которые он должен выявлять.

Если в результате проверки гипотезы о существовании различий был сделан вывод об их отсутствии, необходимо проверить, была ли чувствительность критерия достаточной для обнаружения таких различий. Чувствительность зависит не только от величины различий, но и от разброса данных и объема выборки.Если посмотреть на объем выборки, чем он больше, тем меньшие различия окажутся статистически значимыми.

Таким образом, появляется возможность заранее оценивать численность выборок, необходимых для выявления эффекта.

С понятием чувствительности критерия связаны понятия ошибок 1 и 2 рода. Так ошибка 1 рода - возможность ошибочно отклонить нулевую гипотезу, т.е. найти различия там, где их нет. Приемлемая для данного исследования вероятность ошибки 1 рода называется уровнем значимости альфа.

Ошибка 2го рода (ее вероятность обозначается бета) возникает, если мы принимаем нулевую гипотезу, когда она не верна, другими словами, не находим существующее различие.

Вероятность обнаружить различие, т.е. чувствительность или мощность критерия, равна 1 - бета. При прочих равных условиях, тот критерий имеет преимущество, который имеет меньшую вероятность ошибки 2го рода. Таким образом, на чувствительность критерия различные факторы влияют следующим образом:

  • уровень значимости альфа - чем меньше альфа, тем ниже чувствительность.

  • отношение величины различий к стандартному отклонению: чем оно больше, тем больше чувствительность (для количественного признака); частота события: чем больше число (или доля) событий, тем выше чувствительность (для учета реакции в альтернативной форме)

  • объем выборки: чем больше, тем больше чувствительность

Надо заметить, что в большинстве случаев параметрические критерии являются более мощными, чем их непараметрические аналоги, и если соблюдаются все предпосылки использования параметрического критерия, замена его непараметрическим может привести к увеличению ошибки 2го рода.

Необходимо также обратить внимание на то, что для различных статистических критериев и методов анализа чувствительность вычисляется по разным формулам.

Эти же формулы можно использовать для решения обратной задачи: при выбранных значениях вероятность ошибок 1 и 2 рода (заданной чувствительности) и желаемой величине различий между эффектами оценить требуемый объем выборок для получения статистически достоверных результатов сравнения.

Существуют графики, номограммы и таблицы, связывающие чувствительность с величиной различий для наиболее встречающихся значений альфа и различных объемов выборок.  Известны формулы расчета и соответствующие таблицы требуемых объемов выборок для различных планов клинических исследований. Мы приведем лишь некоторые для наиболее часто используемых критериев.

Нужно иметь в виду, что формулы для расчета необходимого объема выборок являются приближенными и применимы для объема выборок больше 20. Можно сказать, что они дают только приближенную оценку объема (из-за приближенных априорных величин, приближенные оценки различий, приближенных математических моделей и т.д.).

Кроме того оцененное таким образом необходимое количество пациентов должно быть увеличено (обычно на 20%) с учетом возможного выбывания в процессе исследования.

Таким образом, прежде чем оценивать требуемый объем групп для данного исследования, необходимо:

  • понять, переменные какого типа (количественные, качественные, и т.д.) будут измерять эффект в данном исследовании

  • выбрать, исходя из специфики исследования, подходящий план

  • оценить величину различий между эффектами, приемлемую для данного исследования с клинической точки зрения

  • выбрать подходящий статистический критерий для последующего анализа интересующих событий, это определит выбор конкретных формул для расчета

  • определить, односторонний или двусторонний критерий будет использоваться

  • оценить по данным литературы, пилотному исследованию или результатам сходных исследований величины показателей, входящих в выбранные для расчета формулы

  • увеличить рассчитанные по формулами значения объема с учетом возможного исключения в процессе исследования

Приведенные в следующем разделе формулы предназначены для оценки числа пациентов, необходимого для установления различий в эффекте.

Часть 2: Расчет объема выборок

Приведенные в формулы предназначены для оценки числа пациентов, необходимого для установления различий в эффекте. Если критерии эффекта в контролируемых клинических исследованиях служат количественные признаки, выражаемые статистическими средними величинами, то формула расчета минимального объема групп для сравнения показателя в двух независимых группах:

где Sxo и Sxk - стандартные отклонения сравниваемых опытной и контрольной групп, дельта - требуемая величина различий между средними значениями сравниваемых групп, Za и Zв - критические значения нормального распределения, соответствующие заданным уровням ошибок 1 и 2 рода, которые определяются по таблицам.

Из формулы видно, что для оценки необходимого объема выборки важно, скорее, соотношение дисперсии и требуемой величины различий, чем их численные значения. Это обстоятельство имеет важное практическое значение при планировании исследования, когда точные значения дисперсий могут быть неизвестны.

При альтернативной форме описания эффекта с помощью частот (или долей) po и pk необходимое число наблюдений при равных по численности опытной и контрольной групп определяются по формуле:

где ex12_300.gif - величина разности между частотами (po - pk). Такой метода дает достаточно точные результаты при 25% < p < 75%. При других значениях частот для корректировки возникающих искажений вводится поправка . Объем выборки вычисляется при этом как:

Финансовые, этические или другие соображения могут требовать формирования различных по численности опытной и контрольных групп. Если известна фиксированная численность одной (например, контрольной групп nk), можно оценить требуемую численность другой группы (no) для формирования статистически значимого заключения о различиях в эффекте между ними.

Для количественного признака:

Для альтернативного представления признаков:

Данные формулы предполагают использование одностороннего теста (показатель одной группы лучше показателя другой, исключая возможность превосходства последнего). В случае необходимости "улавливания" различий в эффекте в ту или иную сторону применяется двусторонний тест.

Допустим, необходимо определить количество пациентов для исследования, в котором в качестве переменной эффекта будет использоваться изменение значения интересующего параметра до и после начала терапии.

Математически эта задача похожа на предыдущую задачу сравнения двух независимых групп. Только в данном случае для статистически достоверного заключения понадобится меньше пациентов, поскольку вариация разности между наблюдениями значительно меньше, чем вариация одиночных наблюдений. Это объясняется наличием корреляции между последовательными измерениями.

Известны специальные формулы определения необходимой численности групп и в случае, когда в качестве переменной для оценки эффекта используется скорость изменения какого-либо интересующего показателя.

Представим, что выбранная для сравнения непрерывная количественная переменная эффекта измеряется в начале, на промежуточных этапах и в конце исследования. Рассмотрим случай только двух таких измерений, до и после исследования.

Тогда одним из возможных подходов к решению задачи является предположение о линейном характере изучаемых изменений во времени. При таком предположении скорость изменения является постоянной и может быть описана одним параметром - коэффициентом наклона прямой, аппроксимирующей изменение показателя во времени.

Математическая модель таких изменений будет описываться в виде: x = a + bt + error, где b - наклон прямой, оценивающий скорость изменений, t - время, error - представляет отклонение измеренных значений от модельной линии регрессии.

Обычно эта ошибка равномерно распределена вокруг нуля, предполагается также, что дисперсия этой ошибки приблизительно одинакова для всех пациентов. До начала исследования оценка величины дисперсии ошибки делается на основе данных литературы или предыдущих аналогичных работ.

Чтобы оценить эффективность, исследователь должен сравнить средний наклон прямой в одной группе со средним наклоном в другой группе. Если D - общее время наблюдения и K - число равномерно распределенных во времени измерений изучаемого показателя, дисперсия может быть выражена так:

где  -межиндивидуальная вариабельность наклонов,  - компонента вариации наклона прямой, не зависящая от ошибок измерений и наличия нелинейности в данных. Тогда требуемый объем групп для установления различий в средних скоростях изменений может быть оценен по формуле:

Расчет необходимого числа пациентов для исследований, результаты которых обрабатываются с помощью методов анализа выживаемости. Мы дадим только один самый простой вариант используемых для этого формул.

Допустим, нам необходимо сравнить кривые выживаемости, построенные по результатам клинического исследования в двух группах. Наиболее общим подходом является аппроксимация кривых выживаемости экспоненциальной функцией. Каждая такая кривая может быть однозначно охарактеризована параметром лямбда - коэффициентом смертности.

Этот коэффициент может рассматриваться как величина, характеризующая скорость процесса и обратная среднему времени выживания. Нулевая гипотеза формулируется так: . Тогда требуемый размер каждой группы для проверки гипотезы:

Однако недостатком такого подхода является предположение о том, что до конца временного интервала исследования у всех пациентов, включенных в исследование, обязательно наступает изучаемый исход.

Формулы расчета объема выборки могут быть преобразованы для оценки мощности соответствующего теста 1 - d. Для этого нужно просто преобразовать формулу, сделав неизвестной величиной - Zв.

Оценить требуемый объем выборок или чувствительность метода можно и в случае применения дисперсионного анализа. Для этого вычисляется параметр нецентральности, равный

где m - число групп, n - численность каждой из них. По соответствующим графикам находят чувствительность дисперсионного анализа как функцию параметра нецентральности при выбранном уровне значимости, определенном межгрупповом числе степеней свободы (m-1) и определенном внутригрупповом числе степеней свободы (m(n-1)).

Однако на практике при использовании этих достаточно простых расчетных формул могут возникнуть проблемы. Дело в том, что для некоторых исследований заранее может быть неизвестна величина дисперсии признака.

Обычно эта проблема решается с помощью использования аналога этой величины, известного из проведенных ранее похожих исследований.

Как такие задачи решаются с помощью пакета STATISTICA? Очень просто, с помощью модуля Анализ мощности решается задача нахождения объема выборки. Необходимые примеры по расчету объемов выборок можно найти в примерах. Если же вы хотите рассчитать их вручную, то неоценимую помощь вам окажет Вероятностный калькулятор.

В заключение можно сказать, что хотя на практике вычисление требуемого объема выборок является скорее оправданием уже выбранной численности групп, результаты исследований не могут считаться достоверными без вычисления оценки чувствительности или мощности критериев, применявшихся для проверки статистически значимых различий.


Связанные определения:
Бета-уровень
Доказательная медицина
Исход
Когорта
Когортное исследование
Кокрановское сотрудничество
Мощность
Мощность исследования
Мощность статистического критерия
Научно-обоснованная система здравоохранения
Экспериментальная частота исходов

В начало

Содержание портала