Вид графического отображения данных, когда диапазоны или характеристики распределения значений переменной изображаются отдельно для групп наблюдений, заданных значениями другой, категориальной (группирующей), переменной.
Для каждой группы вычисляется статистика центра (медиана или среднее) и статистики диапазона (например, квартили или стандартные отклонения), и выбранные значения изображаются на диаграмме размаха.
Также могут быть изображены точки выбросов (outliers).
Визуально анализируя диаграмму размаха, можно получить представление об изменчивости переменной. На данной диаграмме размаха отмечены три выброса – два «слишком больших» значения и одно «слишком маленькое».
Например, значение Тромбоциты = 73 оказывается выбросом для группы мужчин, но при рассмотрении группы женщин это наблюдение оказывается «нормальным».
Сравнение групп, изображенных на диаграмме размаха, производится с помощью критериев парных сравнений (t-критерий, критерий Манна-Уитни и др.) в случае двух групп, и с помощью дисперсионного анализа (ANOVA) или введения поправки Бонферрони в случае нескольких (более двух) групп.
Синоним: график "ящики-усы"
Связанные определения:
Верхняя квартиль
Выброс
Гистограмма
Диаграмма рассеяния
Интерквартильный размах
Квантиль
Нижняя квартиль
Связанные статьи:
Краткое описание данных и визуализация