В ходе рассмотрения примера мы будем использовать вымышленные сведения, чтобы читатель мог провести необходимые преобразования самостоятельно.
Так, допустим, в ходе исследований изучали влияние препарата А на содержание вещества В (в ммоль/г) в ткани С и концентрацию вещества D в крови (в ммоль/л) у пациентов, разделенных по какому-то признаку Е на 3 группы равного объема (n = 10). Результаты такого выдуманного исследования приведены в таблице:
Содержание вещества B, ммоль/г |
Вещество D, ммоль/л | ||||||
---|---|---|---|---|---|---|---|
исходное содержание в крови |
прирост концентрации | ||||||
группа 1 |
группа 2 |
группа 3 |
группа 1 |
группа 2 |
группа 3 |
группа 2 |
группа 3 |
12 |
8 |
8 |
0,7 |
0,8 |
0,8 |
4 |
4 |
13 |
8 |
9 |
1,4 |
0,9 |
0,9 |
5 |
3 |
14 |
9 |
9 |
1,8 |
2,5 |
2,3 |
4 |
3,5 |
15 |
10 |
11 |
1,1 |
1,2 |
2,0 |
3,5 |
2 |
14 |
7 |
12 |
1,6 |
1,3 |
1,4 |
5 |
1 |
13 |
7 |
12 |
1,7 |
1,5 |
1,6 |
5 |
1,5 |
13 |
9 |
13 |
1,3 |
1,6 |
1,3 |
3,5 |
1 |
10 |
9 |
13 |
1,4 |
2,1 |
1,7 |
4 |
1,5 |
11 |
11 |
12 |
1,5 |
2,0 |
1,5 |
2 |
2 |
16 |
6 |
11 |
2,2 |
1,0 |
1,6 |
5 |
2 |
Хотим вас предупредить, что выборки объема 10 рассматриваются нами для простоты представления данных и вычислений, на практике такого объема выборок обычно оказывается недостаточно для формирования статистического заключения.
В качестве примера рассмотрим данные 1-го столбца таблицы.
Среднее арифметическое, которое очень часто называют просто «среднее», получают путем сложения всех значений и деления этой суммы на число значений в наборе. Это можно показать с помощью алгебраической формулы. Набор n наблюдений переменной x можно изобразить как x1, x2, х3, ..., xn
Формула для определения среднего арифметического наблюдений (произносится «икс с чертой»):
= (Х1 + Х2 + ... + Xn) / n
= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;
Один из способов измерения рассеяния данных заключается в том, чтобы определить степень отклонения каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений. Однако мы не можем использовать среднее этих отклоненийкак меру рассеяния, потому что положительные отклонения компенсируют отрицательные отклонения (их сумма равна нулю). Чтобы решить эту проблему, мы возводим в квадрат каждое отклонение и находим среднее возведенных в квадрат отклонений; эта величина называется вариацией, или дисперсией. Возьмем n наблюдений x1, x2, х3, ..., xn, средняя которых равняется . Вычисляем дисперсию, обычно обозначаемую как s2, этих наблюдений:
Выборочная дисперсия данного показателя равна s2 = 3,2.
Стандартное (среднеквадратичное) отклонение — это положительный квадратный корень из дисперсии. На примере n наблюдений это выглядит следующим образом:
Мы можем представить себе стандартное отклонение как своего рода среднее отклонение наблюдений от среднего. Оно вычисляется в тех же единицах (размерностях), что и исходные данные.
s = sqrt (s2) = sqrt (3,2) = 1,79 [sqrt (x) - функция извлечения квадратного корня из х].
Если разделить стандартное отклонение на среднее арифметическое и выразить результат в процентах, то получится коэффициент вариации.
CV = (1,79 / 13,1) * 100% = 13,7
1,79 / sqrt (10) = 0,57 [sqrt (x)- функция извлечения квадратного корня из х];
Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения m
Количество степеней свободы рассчитывается как f=n-1.
В данном случае доверительный интервал для среднего заключен между границами 11,87 и 14,39.
Для уровня доверительной вероятности 95% m=11,87 или m=14,39, то есть= |13,1-11,82| = |13,1-14,38| = 1,28
Соответственно, в данном случае для числа степеней свободы f = 10 - 1 = 9 и уровня доверительной вероятности 95% t=2,26.
В модуле Основные статистики и таблицы выберем Описательные статистики.
Откроется диалоговое окно Описательные статистики.
В поле Перменные выберем Группу 1.
Нажав на Ок, получим таблицы результатов с описательными статистиками выбранных переменных.
Чтобы посчитать t-критерий Стьюдента, в модуле Основные статистики и таблицы выберем Одновыборочный t-критерий.
Откроется диалоговое окно Одновыборочный t-критерий.
Предположим, нам известно, что среднее содержание вещества B в ткани С равно 11.
Таблица результатов с описательными статистиками и t-критерием Стьюдента выглядит следующим образом:
Нам пришлось отвергнуть гипотезу о том, что среднее содержание вещества В в ткани С равно 11.
Так как вычисленное значение критерия больше табличного (2,26), нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборкой и известной величиной признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью критерия Cтьюдента, подтверждается с помощью данного метода.
Статистики и процедуры, включенные в одноименный модуль, условно называются основными статистиками и рассматриваются в одной группе, т.к. обычно они используются совместно, особенно на начальной, разведочной стадии анализа данных. Эти статистики являются базовыми и полезны для самых разнообразных исследований. Вычисление описательных статистик является неотъемлемой частью любого статистического анализа.
Связанные определения:
Выборочное среднее, среднее значение выборки
Выброс
Дисперсия (рассеяние, разброс)
Дисперсия выборки (выборочная дисперсия)
Коэффициент вариации
Максимум
Математическое ожидание дискретной случайной величины
Математическое ожидание непрерывной случайной величины
Медиана
Меры дисперсии, меры разброса
Минимум
Мода
Описательные статистики
Описательный анализ
Параметрические методы статистики
Параметры рассеяния
Параметры центральной тенденции
Среднее значение
Среднеквадратичное отклонение популяции
Стандартная ошибка среднего
Стандартное отклонение
Скачать