Пример: Дисперсионный анализ Краскела-Уоллиса и медианный тест
Критерий Краскела-Уоллиса - это непараметрическая альтернатива одномерному (межгрупповому) дисперсионному анализу. Он используется для сравнения трех или более выборок, и проверяет нулевые гипотезы, согласно которым различные выборки были взяты из одного и того же распределения, или из распределений с одинаковыми медианами.
Таким образом, интерпретация критерия Краскела-Уоллиса в основном сходна с параметрическим одномерным дисперсионным анализом, за исключением того, что этот критерий основан скорее на рангах, чем на средних. Для дополнительных деталей, см. Siegel & Castellan, 1988.
Этот непараметрический критерий — расширение двухвыборочного критерия Вилкоксона ранговых сумм. При нулевой гипотезе отсутствия различий в распределениях между группами суммы рангов в каждой из k групп должны быть сравнимы после учета любых различий в размере выборки.
Определить нулевую и альтернативную гипотезы.
: каждая группа имеет одинаковое распределение величин в популяции.
: каждая группа не имеет одинакового распределения величин в популяции.
Отобрать необходимые данные из двух взаимосвязанных выборок.
Вычислить величину статистики критерия, отвечающую ,
Проранжируйте все n значений и рассчитайте сумму рангов в каждой из групп: эти суммы — . Статистика критерия (которая должна быть модифицирована, если имеется много связанных значений) выражается формулой:
Сравнить значение статистики F-критерия со значением из известного распределения вероятности.
Интерпретировать величину р и результаты.
Интерпретируйте величину р, и если результат статистически значим, используйте двухвыборочные непараметрические критерии, корректируя их для множественного тестирования. Рассчитайте ДИ для медианы в каждой группе. Однофакторный ANOVA применяют тогда, когда группы соотносятся с одним фактором и независимы. Можно использовать другие виды ANOVA, если план исследования более сложен.
Так, допустим, в ходе исследований изучали влияние препарата X на пациентов, разделенных по какому-то признаку Y на 3 группы равного объема (A, B, C). Результаты такого выдуманного исследования приведены в таблице:
Рис. 1. Пример исходных данных.
Выбираем команду Непараметрическая статистика из меню Анализ для отображения стартовой панели модуля Непараметрическая статистика. Далее выбираем Сравнение нескольких независимых групп и нажимаем кнопку OK для отображения диалогового окна ДА Краскела-Уоллиса. Нажимаем кнопку Переменные для отображения диалогового окна Выбор переменных. Выбираем переменную Влияние как зависимую и переменную Группа как группирующую. Нажимаем кнопку Коды, отобразится диалоговое окно Выбираем коды для группирующей переменной; в этом диалоге выберите все коды (нажав кнопку Все и затем кнопку OK). Диалоговое окно ДА Краскела-Уоллиса появится на экране:
Рис. 2. Диалоговое окно.
В диалоговом окне нажимаем ОК и начинаем анализ.
Рис. 3. Анализ.
Мы видим, что критерий Краскела-Уоллиса высоко значим (p = .001).Таким образом, характеристики различных экспериментальных групп значимо отличаются друг от друга. Напомним, что процедура Краскела-Уоллиса, по существу, является дисперсионным анализом, основанным на рангах. Суммы рангов (для каждой группы) показаны в правом столбце таблицы результатов. Наибольшая ранговая сумма (самое эффективное влияние препарата) относится к группе C. Наименьшая ранговая сумма (самое худшее влияние препарата) относится к группе A.
Эти тесты - альтернативны однофакторной межгрупповой ANOVA. Пример основан на (искусственных) данных, представленных в Hays (1981, стр. 592).
Рис. 4. Пример исходных данных.
Эти данные получены в исследовании маленьких детей, которые случайным образом приписывались к одной из трех экспериментальных групп. Каждому ребенку предлагалась серия парных тестов. Задача ребенка состояла в том, чтобы сделать правильный выбор и получить вознаграждение. В первой группе тестом была форма (группа 1 - Форма - 1 - Form), во второй - цвет (группа 2 - Цвет - 2 Color), в третьей - размер 3 - Размер - 3 - Size) предмета. Зависимая переменная - число испытаний, которые требовались каждому ребенку, чтобы получить вознаграждение.
Результаты ранговой ДА Краскела-Уоллиса будут показаны в первой таблице результатов, результаты медианного теста - во второй.
Рис. 5. Результаты критерия Краскела-Уоллиса.
Вы видите, что критерий Краскела-Уоллиса высоко значим.Таким образом, характеристики различных экспериментальных групп значимо отличаются друг от друга. Напомним, что процедура Краскела-Уоллиса, по существу, является дисперсионным анализом, основанным на рангах. Суммы рангов (для каждой группы) показаны в правом столбце таблицы результатов. Наибольшая ранговая сумма (самое худшее выполнение теста) относится к Размеру - Size (это тот параметр, который надо различить, чтобы получить вознаграждение). Наименьшая ранговая сумма (лучшее выполнение) относится к Форме - Form.
Медианный критерий также значим, однако, в меньшей степени.
Рис. 6. Результаты медианного теста.
Напомним, что медианный критерий более "грубый" и менее чувствительный, чем критерий Краскела-Уоллиса. В таблице результатов показано число наблюдений (детей) в каждой экспериментальной группе, которые лежат ниже (или равны) общей медианы и число наблюдений, лежащих выше общей медианы. Снова, наибольшее число испытуемых с числом попыток (до получения вознаграждения) выше общей медианы относятся к группе Размер - Size. Больше всего испытуемых с числом попыток ниже медианы относятся к группе Форма - Form. Таким образом, медианный тест подтверждает, что форма предмета наиболее легко различается детьми, тогда как размер различается хуже всего.
Рис. 7. График результатов медианного теста в виде диаграммы.
Снова ясно видно, выполнение теста Форма - Form было лучше любого другого; медиана числа испытаний при этом условии ниже, чем при любом другом.
Рис. 8. Категоризованная гистограмма.
Этот график снова подтверждает, что в группе Форма - Form выполнение "лучше" (распределение слегка скошено влево), чем при других условиях. Самое худшее выполнение, как отчетливо видно из графиков, для группы Размер - Size. Отсюда также можно заключить, что наиболее легко дети различают Форму - Form.
Связанные определения:
Дисперсионный анализ
Непараметрические статистические методы
Свободный от распределения критерий
Фиксированные эффекты
Скачать