Уважаемые посетители Портала Знаний, если Вы найдете ошибку в тексте, выделите, пожалуйста, ее мышью и нажмите Сtrl+Enter. Мы обязательно исправим текст!


Точные критерии и доверительные интервалы для коэффициента корреляции

Модуль STATISTICA Анализ мощности содержит ряд функций для проверки критериев о коэффициенте корреляции Пирсона. STATISTICA содержит несколько различных алгоритмов для вычисления вероятностей, включая специальные процедуры для вычисления точного распределения коэффициента корреляции в предположении двумерной нормальности.

Требования к мощности и размеру выборки для t-критерия с нулевой корреляцией. Самым известным критерием является критерий с нулевой корреляцией. Модуль STATISTICA Анализ мощности предлагает различные функции анализа мощности критерия и объема выборки при проверке этой гипотезы.

Например, предположим, что вы проверяете двустороннюю гипотезу о том, что r = 0 против альтернативной гипотезы r ≠ 0, используя стандартный t-критерий.

Какая мощность будет у критерия при N = 45 и действительной корреляцией .30? В случае неадекватной мощности критерия, какой объем выборки необходим для достижения мощности .90?

Выберите команду Анализ мощности в меню Анализ для вызова стартовой панели диалога Анализ мощности\Интервальное оценивание. На Стартовой панели выберите Оценка мощности и t-критерий для нулевой корреляции.

Нажмите кнопку OK для вызова диалога t-критерий для нулевой корреляции: Параметры оценки мощности.

Введите значение .30 в поле Rho, 45 в поле N, в поле Alpha введите значение .05, а в группе Гипотеза выберите опцию Двусторонняя (Rho=0).

Нажмите кнопку OK для вызова диалога t-критерий для нулевой корреляции: Результаты оценки мощности.

Нажмите кнопку Вычислить P для вычисления мощности критерия.

Стандартным методом вычисления является точный алгоритм Z Фишера. Он использует преобразование Фишера для аппроксимации точного распределения коэффициента корреляции.

Таким образом, используются формула аппроксимации рядов для точной оценки моментов преобразования Фишера. Это позволяет повысить точность по сравнению с традиционными формулами, в которых предполагается, что дисперсия преобразования Фишера равна 1/(N - 3).

Для совместимости с другими программами модуль STATISTICA Анализ мощности может использовать грубое преобразование Фишера, которое также позволяет вычислить точное распределение коэффициента корреляции.

Точный алгоритм Фишера хорошо сочетает как высокую скорость вычислений, так и достаточную точность, в то время как, точный метод должен использоваться с маленькими выборками для достижения высокой точности.

В данном случае мы обнаружили, что мощность критерия (равная .5275) не достаточно адекватна. Вопрос заключается в том, "какой объем выборки необходим для достижения адекватной мощности критерия."

Вернитесь на Стартовую панель, нажав дважды клавишу ESC, и выберите Оценка объема выборки и Одна корреляция, t-критерий.

Нажмите кнопку OK для вызова диалога t-критерий для нулевой корреляции: Параметры оценки объема выборки. Отметим, что значение Rho сохраняется на протяжении всего анализа.

Нажмите кнопку OK для вызова диалога t-критерий для нулевой корреляции: Результаты оценки объема выборки.

Нажмите кнопку Вычислить N для вычисления требуемого объема выборки.

Оказывается, что требуемый объем выборки равен 112, более чем в два раза больше, чем исходный размер 45.

Точные доверительные интервалы. Большинство стандартных книг приводит процедуру построения доверительного интервала для одной пропорции, основанной на преобразовании Фишера.

Модуль STATISTICA Анализ мощности может проводить процедуру точного интервального оценивания. Вернитесь на Стартовую панель, нажав два раза клавишу ESC, и выберите Интервальное оценивание и Одна корреляции, t-критерий.

Нажмите кнопку OK для вызова диалога t-критерий для нулевой корреляции: Интервальное оценивание. (В данном случае диалог имеет необычное названия, так как сама процедура интервального оценивания не использует t-распределение. Однако, процедура интервального оценивания часто является альтернативой критерию проверки гипотезы с нулевой корреляцией.)

Для построения доверительного интервала введите значения в поля Наблюдаемая корреляция, Объем выборки и Доверительный уровень и выберите подходящий Алгоритм вычисления, а после этого нажмите кнопку Вычислить.

Предположим, что наблюдаемое значение корреляции равно .4431, объем выборки равен 20, а доверительный уровень - 95%. В этом случае можно вычислить доверительный интервал, используя стандартный метод, а потом сравнить результаты с более точными методами.

Введите соответствующие значения в этот диалог и выберите опцию Z Фишера грубый в группе Алгоритм вычисления. Диалог будет иметь вид, как показано на рисунке:

Нажмите кнопку Вычислить и получите следующие результаты:

Итоговая таблица данных содержит двусторонний доверительный интервал, вычисленный с помощью алгоритма "Z Фишера грубый". Отметим, что этот доверительный интервал не содержит нуля.

Вернитесь в диалог t-критерий для нулевой корреляции: Интервальное оценивание и измените установки в группе Алгоритм вычисления на Точный, а потом нажмите кнопку Вычислить.

Точный доверительный интервал содержит нулевое значение, как это и должно быть. Точный доверительный интервал (в отличие от интервала, вычисленного с помощью преобразования Фишера) не будет содержать нулевое значение тогда и только тогда, когда двусторонний t-критерий с нулевой корреляцией отвергает нулевую гипотезу.

Точные критерии проверки гипотезы для заданной корреляции. Когда корреляция совокупности r равная нулю, выборочное распределение r имеет простое распределение, что позволяет использовать стандартный t-критерий для нулевой корреляции. Если r не равно нулю, вид распределения r имеет более сложную форму.

Поэтому большинство статистических пактов не содержат точных критериев для гипотез такого вида

H0: r = a

для значений a отличных от нуля.

Модуль STATISTICA Анализ мощности содержит функции точного вычисления распределения коэффициента корреляции Пирсона в собственном вероятностном калькуляторе.

В данном примере, мы покажем, как можно использовать этот калькулятор для проведения точного критерия и вычисления вероятностного уровня для гипотезы вида

H0: r = 0.20

против альтернативной гипотезы

H1: r ≠ 0.20

Выберите Функции распределения и Корреляция Пирсона на Стартовой панели. Нажмите кнопку OK для вызова диалога Корреляция Пирсона: Параметры оценки мощности.

В данном примере мы хотим:

  1. Вычислить критические значения r при проведении двустороннего критерия с выборкой размера 100;
  2. Вычислить вероятностных уровень для наблюдаемого значения r;
  3. Вычислить мощность нашего критерия в случае, где истинное значение r равно .40.

Для того, чтобы вычислить критические значения для критерия с уровнем значимости a = 0.05, мы должны вычислить значения r, которые имеет кумулятивные вероятностные значения .025 и .975. Введите значение 0.20 в поле rho, 100 в поле N и .025 в поле Кум. p .

Выберите опцию Точный в группе Алгоритм вычисления и r в группе Найти. Диалог должен иметь следующий вид:

Нажмите кнопку Вычислить и соответствующие значение будет отображено в поле Наблюдаемое r. Вы должны получить значение .0046334.

Измените значение поля Кум. p на .975 и снова нажмите кнопку Вычислить. Вы получите значение .3824093 в поле Наблюдаемое r .

Таким образом, вы вычислили точные критические значения для критерия проверки двусторонней гипотезы с r = 0.20.

Представьте, что наблюдаемое значение корреляции равно .3945. Какой будет двусторонний вероятностный уровень для этого значения r? Эти вычисления можно легко провести в Вероятностном калькуляторе.

Введите значение .3945 в поле Наблюдаемое r, выберите опцию (1 - Кумулятивное p), выберите опцию 1 - p в группе Найти, а затем нажмите кнопку Вычислить. В итоге вы получите следующий результат:

Вероятность получить результат больше чем 0.3945 равна .0179033. Умножив это значение на 2, получаем двусторонний p-уровень, который равен .0358066.

Вычисление мощности двустороннего критерия не многим сложнее. Всю процедуру мы выполним в три шага. Необходимо:

  1. Вычислить нижнюю точку отвержения в предположении, что r = 0.20, а затем вычислить вероятность получить простую корреляцию r меньше чем этот нижний уровень отвержения против альтернативы, что r = 0.40;
  2. Вычислить верхнюю точку отвержения в предположении, что r = 0.20, а затем вычислить вероятность получения выборочной корреляции r больше чем этот верхний уровень отвержения против альтернативы, что r = 0.40;
  3. Объединить результаты, полученные на первых двух шагах, для вычисления мощности критерия.

Вернитесь в диалог Корреляция Пирсона: Параметры оценки мощности и выполните описанные выше шаги для вычисления нижней точки отвержения. Нажмите кнопку и сделайте так, чтобы значения были такими, как показано выше:

Затем измените значение rho на 0.40, выберите опцию p в группе Найти, а затем нажмите кнопку Вычислить.

Как можно было ожидать, вероятность, которая представляет шанс получения ошибочного отвержения, очень маленькая - только .00002. Повторите шаги для вычисления верхней точки отвержения.

Далее мы вычислим вероятность получения значения большего чем эта точка отвержения. Выберите опцию 1 - Кумулятивное p и введите значение 0.40 в поле rho. Выберите опцию 1 - p в группе Найти.

Нажмите кнопку Вычислить и наблюдаемое значение будет отображено в поле 1 - Кум. p.Объединив вероятности, полученные на первых двух шагах, вы получите значение .5891761. Общая мощность критерия равна .589.


Связанные определения:
Бета-уровень
Мощность
Мощность исследования
Мощность статистического критерия

В начало

Содержание портала