Уважаемые посетители Портала Знаний, если Вы найдете ошибку в тексте, выделите, пожалуйста, ее мышью и нажмите Сtrl+Enter. Мы обязательно исправим текст!


Критерий Краскела-Уоллиса

Определение

Пример

Пример: Дисперсионный анализ Краскела-Уоллиса и медианный тест

Определение

Критерий Краскела-Уоллиса - это непараметрическая альтернатива одномерному (межгрупповому) дисперсионному анализу. Он используется для сравнения трех или более выборок, и проверяет нулевые гипотезы, согласно которым различные выборки были взяты из одного и того же распределения, или из распределений с одинаковыми медианами.

Таким образом, интерпретация критерия Краскела-Уоллиса в основном сходна с параметрическим одномерным дисперсионным анализом, за исключением того, что этот критерий основан скорее на рангах, чем на средних. Для дополнительных деталей, см. Siegel & Castellan, 1988.

Этот непараметрический критерий — расширение двухвыборочного критерия Вилкоксона ранговых сумм. При нулевой гипотезе отсутствия различий в распределениях между группами суммы рангов в каждой из групп должны быть сравнимы после учета любых различий в размере выборки.

  1. Определить нулевую и альтернативную гипотезы.  

    : каждая группа имеет одинаковое распределение величин в популяции. 

    : каждая группа не имеет одинакового распределения величин в популяции.

  2. Отобрать необходимые данные из двух взаимосвязанных выборок. 

  3. Вычислить величину статистики критерия, отвечающую 

    Проранжируйте все n значений и рассчитайте сумму рангов в каждой из групп: эти суммы — . Статистика критерия (которая должна быть модифицирована, если имеется много связанных значений) выражается формулой:

  4. Сравнить значение статистики F-критерия со значением из известного распределения вероятности. 

  5. Интерпретировать величину р и результаты. 

    Интерпретируйте величину р, и если результат статистически значим, используйте двухвыборочные непараметрические критерии, корректируя их для множественного тестирования. Рассчитайте ДИ для медианы в каждой группе. Однофакторный ANOVA применяют тогда, когда группы соотносятся с одним фактором и независимы. Можно использовать другие виды ANOVA, если план исследования более сложен.

Пример

Так, допустим, в ходе исследований изучали влияние препарата X на пациентов, разделенных по какому-то признаку Y на 3 группы равного объема (A, B, C). Результаты такого выдуманного исследования приведены в таблице:

Рис. 1. Пример исходных данных.

Выбираем команду Непараметрическая статистика из меню Анализ для отображения стартовой панели модуля Непараметрическая статистика. Далее выбираем Сравнение нескольких независимых групп и нажимаем кнопку OK для отображения диалогового окна ДА Краскела-Уоллиса. Нажимаем кнопку Переменные для отображения диалогового окна Выбор переменных. Выбираем переменную Влияние как зависимую и переменную Группа как группирующую. Нажимаем кнопку Коды, отобразится диалоговое окно Выбираем коды для группирующей переменной; в этом диалоге выберите все коды (нажав кнопку Все и затем кнопку OK). Диалоговое окно ДА Краскела-Уоллиса появится на экране:

Рис. 2. Диалоговое окно.

В диалоговом окне нажимаем ОК и начинаем анализ.

Рис. 3. Анализ.

Мы видим, что критерий Краскела-Уоллиса высоко значим (p = .001).Таким образом, характеристики различных экспериментальных групп значимо отличаются друг от друга. Напомним, что процедура Краскела-Уоллиса, по существу, является дисперсионным анализом, основанным на рангах. Суммы рангов (для каждой группы) показаны в правом столбце таблицы результатов. Наибольшая ранговая сумма (самое эффективное влияние препарата) относится к группе C. Наименьшая ранговая сумма (самое худшее влияние препарата) относится к группе A.

Пример: Дисперсионный анализ Краскела-Уоллиса и медианный тест

Эти тесты - альтернативны однофакторной межгрупповой ANOVA. Пример основан на (искусственных) данных, представленных в Hays (1981, стр. 592).

Рис. 4. Пример исходных данных.

Эти данные получены в исследовании маленьких детей, которые случайным образом приписывались к одной из трех экспериментальных групп. Каждому ребенку предлагалась серия парных тестов. Задача ребенка состояла в том, чтобы сделать правильный выбор и получить вознаграждение. В первой группе тестом была форма (группа 1 - Форма - 1 - Form), во второй - цвет (группа 2 - Цвет - 2 Color), в третьей - размер 3 - Размер - 3 - Size) предмета. Зависимая переменная - число испытаний, которые требовались каждому ребенку, чтобы получить вознаграждение.

Результаты критерия Краскела-Уоллиса.

Результаты ранговой ДА Краскела-Уоллиса будут показаны в первой таблице результатов, результаты медианного теста - во второй.

Рис. 5. Результаты критерия Краскела-Уоллиса.

Вы видите, что критерий Краскела-Уоллиса высоко значим.Таким образом, характеристики различных экспериментальных групп значимо отличаются друг от друга. Напомним, что процедура Краскела-Уоллиса, по существу, является дисперсионным анализом, основанным на рангах. Суммы рангов (для каждой группы) показаны в правом столбце таблицы результатов. Наибольшая ранговая сумма (самое худшее выполнение теста) относится к Размеру - Size (это тот параметр, который надо различить, чтобы получить вознаграждение). Наименьшая ранговая сумма (лучшее выполнение) относится к Форме - Form.

Результаты медианного теста.

Медианный критерий также значим, однако, в меньшей степени.

Рис. 6. Результаты медианного теста.

Напомним, что медианный критерий более "грубый" и менее чувствительный, чем критерий Краскела-Уоллиса. В таблице результатов показано число наблюдений (детей) в каждой экспериментальной группе, которые лежат ниже (или равны) общей медианы и число наблюдений, лежащих выше общей медианы. Снова, наибольшее число испытуемых с числом попыток (до получения вознаграждения) выше общей медианы относятся к группе Размер - Size. Больше всего испытуемых с числом попыток ниже медианы относятся к группе Форма - Form. Таким образом, медианный тест подтверждает, что форма предмета наиболее легко различается детьми, тогда как размер различается хуже всего.

Графическое представление результатов.

Рис. 7. График результатов медианного теста в виде диаграммы.

Снова ясно видно, выполнение теста Форма - Form было лучше любого другого; медиана числа испытаний при этом условии ниже, чем при любом другом.

Рис. 8. Категоризованная гистограмма.

Этот график снова подтверждает, что в группе Форма - Form выполнение "лучше" (распределение слегка скошено влево), чем при других условиях. Самое худшее выполнение, как отчетливо видно из графиков, для группы Размер - Size. Отсюда также можно заключить, что наиболее легко дети различают Форму - Form.


Связанные определения:
Дисперсионный анализ
Непараметрические статистические методы
Свободный от распределения критерий
Фиксированные эффекты

В начало

Содержание портала