Таблицы сопряженности часто возникают на практике в маркетинге, массовых обследованиях, медицине, контроле качества и т.д.
Предположим, вы хотите исследовать связь двух признаков, например, проведите массовое обследование качества обслуживания в региональных отделениях банка и хотите знать, связано качество обслуживание с регионом или нет.
Случайным образом выбираются два отделения. Вы задаете вопрос респондентам: обслуживание удовлетворительно или нет.
Если рассматриваются два региональных отделения, то получается таблица 2 на 2, в которой по строкам записаны банки, по столбцам - ответы: удовлетворенность и неудовлетворенность качеством обслуживания.
Если рассматривается n отделений банка, то возникают таблицы n на 2.
Если возможно 3 ответа на вопрос, например, допускается вариант: затрудняюсь ответить, то приходим к таблицам сопряженности n на 3 и т.д.
Очевидно, в таких таблицах можно провести всестороннее исследование о связи (зависимости) признаков.
Предположим, проводится маркетинговое исследование, включающее в себя вопрос: купили бы Вы данную модель телевизора, то варианты ответов: «ДА», «НЕТ» мы бы записали в «шапки» столбцов.
Теперь хотелось бы понять, есть ли связь между желанием купить данную модель телевизора и возрастом.
Воспользуемся интерактивным калькулятором таблиц сопряженности 2х2.
Пусть опрос включал в себя и данные по возрасту («до 30 лет» и «после 30 лет»). Запишем их в качестве названий групп:
Ячейки таблицы заполняем количеством опрошенных соответствующих данной комбинации значений параметров.
Например, в опросе участвовало 100 человек. Из них 21 были младше 30 лет и ответили на вопрос о покупке телевизора положительно.
Данный калькулятор позволяет проверить гипотезу о независимости признаков, против альтернативы признаки связаны, т.е. проверить есть ли связь между желанием купить товар и возрастной категорией возможного покупателя.
Поправка Йетса используется, если встречающиеся в таблице сопряженности значения меньше 10 (для этого нужно установить соответствующую «галочку»).
Результаты (р-уровень и отношение шансов) отображаются после нажатия кнопки «Вычислить».
P-уровень – уровень значимости. Кратко, если его значение меньше 0.05, то гипотезу об отсутствии связи между параметрами следует отклонить. В нашем случае зависимость есть, модель телевизора нравится больше людям «до 30 лет».
Отношение Шансов – это шанс события в одной группе к шансам события в другой группе.
Интерпретация значения величины «Отношение шансов» следующая:
В нашем случае, шанс не продать телевизор людям до 30 лет меньше, чем людям старше 30.
Скачать
Актуальные курсы