Пример: ранговый дисперсионный анализ Фридмана и конкордация
Критерий Фридмана - это непараметрический аналог дисперсионного анализа повторных измерений, применяется для анализа повторных измерений, связанных с одним и тем же индивидуумом. Логика критерия очень проста. Каждый больной ровно один раз подвергается каждому методу лечения (или наблюдается в фиксированные моменты времени). Результаты наблюдения у каждого больного упорядочиваются.
Причем мы отдельно упорядочиваем значения у каждого больного независимо от всех остальных. Таким образом получается столько упорядоченных рядов, сколько больных участвует в исследовании. Далее, для каждого метода лечения вычисляется сумма рангов. Если разброс сумм велик - различия статистически значимы.
Для применения этого критерия столбцы таблицы данных отражают различные значения переменной эффекта, а строки соответствуют повторным измерениям одного и того же субъекта. С помощью критерия Фридмана мы проверяем нулевую гипотезу о том, что различные методы лечения дают практически одинаковые результаты.
Процедура состоит в упорядочивании (ранжировании) значений в каждой строке (при этом ранги в каждой строке принимают значения от 1 до m - число сравниваемых методов лечения), суммировании полученных рангов по каждому столбцу и вычислении статистики Хи-квадрат.
Рассчитанная статистика Хи-квадрат имеет такое же распределение, что и Хи-квадрат при (m-1) степенях свободы. Если соответствующее значение превзойдет критическое значение (для выбранного уровня значимости и соответствующего числа степеней свобод), то нулевая гипотеза отклоняется.
Этот критерий может применяться и в случае, когда вместо отдельных пациентов сравниваются однородные группы (рандомизированный блочный план исследования).
Фридмана ранговая ANOVA альтернативна дисперсионному анализу с одним внутригрупповым фактором с повторными измерениями. Этот критерий сравнивает переменные в зависимых выборках. Коэффициент конкордации Кендалла, по существу, представляет усредненную ранговую корреляцию.
Следующий пример основан на данных, представленных Siegel (1956, стр. 233). 20 матерей и их глухих детей присутствовали на семинаре, обучающему уходу за детьми с данным видом дефекта. В конце семинара 13 экспертов ранжировали 20 матерей в соответствии с тем, насколько, по их мнению, они будут способствовать развитию своих детей.
Рис. 1. Пример исходных данных.
Анализ преследовал следующие цели:
(1) Определить, можно ли на основании оценок экспертов сделать вывод о значимых различиях между матерями относительно их способностей воспитывать детей с данным дефектом. Этот вопрос может быть решен с помощью рангового дисперсионного анализа (ANOVA) Фридмана.
(2) Можно ли доверять экспертам? Иными словами, согласованы ли их рейтинги, выставленные матерям (зависимы ли они)? Если нет, то вы, очевидно, не можете доверять их оценкам относительно способностей матерей. Эту гипотезу (эксперты согласованы в большей степени, чем можно бы ожидать из-за чисто случайных совпадений их мнений) можно проверить с помощью коэффициента конкордации Кендалла.
Между матерями имеются высоко значимые различия. Дополнительно также видно, что эксперты, выставившие оценки, согласованы друг с другом - конкордация Кендалла равна 0,57 (среднее ранговых корреляций равно .53).
Рис. 2. Результаты рангового анализа и конкордации в виде таблицы.
Для визуализации результатов можно построить диаграмму размаха.
Рис. 3. Результаты рангового анализа и конкордации в виде диаграммы.
Если бы вы знали имена матерей, принявших участие в семинаре, то, используя график, могли бы сказать, кто, по мнению экспертов, наиболее успешно будет воспитывать своего глухого ребенка.
Связанные определения:
Непараметрические статистические методы
Свободный от распределения критерий
Скачать