Уважаемые посетители Портала Знаний, если Вы найдете ошибку в тексте, выделите, пожалуйста, ее мышью и нажмите Сtrl+Enter. Мы обязательно исправим текст!


Использование таблиц сопряженности 2x2

Таблицы сопряженности часто возникают на практике в маркетинге, массовых обследованиях, медицине, контроле качества и т.д.

Предположим, вы хотите исследовать связь двух признаков, например, проведите массовое обследование качества обслуживания в региональных отделениях банка и хотите знать, связано качество обслуживание с регионом или нет.

Случайным образом выбираются два отделения. Вы задаете вопрос респондентам: обслуживание удовлетворительно или нет.

Если рассматриваются два региональных отделения, то получается таблица 2 на 2, в которой по строкам записаны банки, по столбцам - ответы: удовлетворенность и неудовлетворенность качеством обслуживания.

Если рассматривается n отделений банка, то возникают таблицы n на 2.

Если возможно 3 ответа на вопрос, например, допускается вариант: затрудняюсь ответить, то приходим к таблицам сопряженности n на 3 и т.д.

Очевидно, в таких таблицах можно провести всестороннее исследование о связи (зависимости) признаков.

Предположим, проводится маркетинговое исследование, включающее в себя вопрос: купили бы Вы данную модель телевизора, то варианты ответов: «ДА», «НЕТ» мы бы записали в «шапки» столбцов.

Теперь хотелось бы понять, есть ли связь между желанием купить данную модель телевизора и возрастом.

Воспользуемся интерактивным калькулятором таблиц сопряженности 2х2.

Пусть опрос включал в себя и данные по возрасту («до 30 лет» и «после 30 лет»). Запишем их в качестве названий групп:


Ячейки таблицы заполняем количеством опрошенных соответствующих данной комбинации значений параметров.

Например, в опросе участвовало 100 человек. Из них 21 были младше 30 лет и ответили на вопрос о покупке телевизора положительно.

Данный калькулятор позволяет проверить гипотезу о независимости признаков, против альтернативы признаки связаны, т.е. проверить есть ли связь между желанием купить товар и возрастной категорией возможного покупателя.

Поправка Йетса используется, если встречающиеся в таблице сопряженности значения меньше 10 (для этого нужно установить соответствующую «галочку»).

Результаты (р-уровень и отношение шансов) отображаются после нажатия кнопки «Вычислить».

P-уровень – уровень значимости. Кратко, если его значение меньше 0.05, то гипотезу об отсутствии связи между параметрами следует отклонить. В нашем случае зависимость есть, модель телевизора нравится больше людям «до 30 лет».

Отношение Шансов – это шанс события в одной группе к шансам события в другой группе.

Интерпретация значения величины «Отношение шансов» следующая:

  • Если отношение шансов =1, то шанс для первой группы равен шансу для второй группы
  • Если отношение шансов >1, то шанс для первой группы больше шанса для второй группы
  • Если отношение шансов <1, то шанс для первой группы меньше шанса для второй группы

В нашем случае, шанс не продать телевизор людям до 30 лет меньше, чем людям старше 30.


В начало

Содержание портала