Уважаемые посетители Портала Знаний, если Вы найдете ошибку в тексте, выделите, пожалуйста, ее мышью и нажмите Сtrl+Enter. Мы обязательно исправим текст!


Основные статистики и t-критерий Стьюдента

Описательные статистики

Диалог Основные статистики и таблицы

Выводы

В ходе рассмотрения примера мы будем использовать вымышленные сведения, чтобы читатель мог провести необходимые преобразования самостоятельно.

Так, допустим, в ходе исследований изучали влияние препарата А на содержание вещества В (в ммоль/г) в ткани С и концентрацию вещества D в крови (в ммоль/л) у пациентов, разделенных по какому-то признаку Е на 3 группы равного объема (n = 10). Результаты такого выдуманного исследования приведены в таблице:

Содержание вещества B, ммоль/г

Вещество D, ммоль/л

исходное содержание в крови

прирост концентрации

группа 1

группа 2

группа 3

группа 1

группа 2

группа 3

группа 2

группа 3

12

8

8

0,7

0,8

0,8

4

4

13

8

9

1,4

0,9

0,9

5

3

14

9

9

1,8

2,5

2,3

4

3,5

15

10

11

1,1

1,2

2,0

3,5

2

14

7

12

1,6

1,3

1,4

5

1

13

7

12

1,7

1,5

1,6

5

1,5

13

9

13

1,3

1,6

1,3

3,5

1

10

9

13

1,4

2,1

1,7

4

1,5

11

11

12

1,5

2,0

1,5

2

2

16

6

11

2,2

1,0

1,6

5

2


Хотим вас предупредить, что выборки объема 10 рассматриваются нами для простоты представления данных и вычислений, на практике такого объема выборок обычно оказывается недостаточно для формирования статистического заключения.

В качестве примера рассмотрим данные 1-го столбца таблицы.

Описательные статистики

Выборочное среднее

Среднее арифметическое, которое очень часто называют просто «среднее», получают путем сложения всех значений и деления этой суммы на число значений в наборе. Это можно показать с помощью алгебраической формулы. Набор n наблюдений переменной x можно изобразить как x1, x2, х3, ..., xn

Формула для определения среднего арифметического наблюдений (произносится «икс с чертой»):

= (Х1 + Х2 + ... + Xn) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Выборочная дисперсия

Один из способов измерения рассеяния данных за­ключается в том, чтобы определить степень отклоне­ния каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений. Однако мы не можем использовать среднее этих отклоненийкак меру рассеяния, потому что положительные от­клонения компенсируют отрицательные отклонения (их сумма равна нулю). Чтобы решить эту проблему, мы возводим в квадрат каждое отклонение и находим среднее возведенных в квадрат отклонений; эта величина называется вариацией, или дисперсией. Возьмем n наблюдений x1, x2, х3, ..., xn, средняя которых равняется . Вычисляем дисперсию, обычно обозначаемую как s2, этих наблюдений:

Выборочная дисперсия данного показателя равна s2 = 3,2.

Среднеквадратичное отклонение

Стандартное (среднеквадратичное) отклоне­ние — это положительный квадратный корень из дисперсии. На примере n наблюдений это выглядит следующим образом:

Мы можем представить себе стандартное отклоне­ние как своего рода среднее отклонение наблюдений от среднего. Оно вычисляется в тех же единицах (размерностях), что и исходные данные.

s = sqrt (s2) = sqrt (3,2) = 1,79 [sqrt (x) - функция извлечения квадратного корня из х].

Коэффициент вариации

Если разделить стандартное отклонение на сред­нее арифметическое и выразить результат в процен­тах, то получится коэффициент вариации.

CV = (1,79 / 13,1) * 100% = 13,7

Ошибка выборочного среднего

1,79 / sqrt (10) = 0,57 [sqrt (x)- функция извлечения квадратного корня из х];

Коэффициент Стьюдента t (одновыборочный t-критерий)

Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения m

Количество степеней свободы рассчитывается как f=n-1.

В данном случае доверительный интервал для среднего заключен между границами 11,87 и 14,39.

Для уровня доверительной вероятности 95% m=11,87 или m=14,39, то есть= |13,1-11,82| = |13,1-14,38| = 1,28

Соответственно, в данном случае для числа степеней свободы f = 10 - 1 = 9 и уровня доверительной вероятности 95% t=2,26.

Диалог Основные статистики и таблицы

В модуле Основные статистики и таблицы выберем Описательные статистики.


Откроется диалоговое окно Описательные статистики.

В поле Перменные выберем Группу 1.


Нажав на Ок, получим таблицы результатов с описательными статистиками выбранных переменных.


Чтобы посчитать t-критерий Стьюдента, в модуле Основные статистики и таблицы выберем Одновыборочный t-критерий.


Откроется диалоговое окно Одновыборочный t-критерий.


Предположим, нам известно, что среднее содержание вещества B в ткани С равно 11.

Таблица результатов с описательными статистиками и t-критерием Стьюдента выглядит следующим образом:

Нам пришлось отвергнуть гипотезу о том, что среднее содержание вещества В в ткани С равно 11.

Так как вычисленное значение критерия больше табличного (2,26), нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборкой и известной величиной признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью критерия Cтьюдента, подтверждается с помощью данного метода.

Выводы

Статистики и процедуры, включенные в одноименный модуль, условно называются основными статистиками и рассматриваются в одной группе, т.к. обычно они используются совместно, особенно на начальной, разведочной стадии анализа данных. Эти статистики являются базовыми и полезны для самых разнообразных исследований. Вычисление описательных статистик является неотъемлемой частью любого статистического анализа.


Связанные определения:
Выборочное среднее, среднее значение выборки
Выброс
Дисперсия (рассеяние, разброс)
Дисперсия выборки (выборочная дисперсия)
Коэффициент вариации
Максимум
Математическое ожидание дискретной случайной величины
Математическое ожидание непрерывной случайной величины
Медиана
Меры дисперсии, меры разброса
Минимум
Мода
Описательные статистики
Описательный анализ
Параметрические методы статистики
Параметры рассеяния
Параметры центральной тенденции
Среднее значение
Среднеквадратичное отклонение популяции
Стандартная ошибка среднего
Стандартное отклонение

В начало

Содержание портала