Такие взаимосвязанные величины часто возникают на практике, например, доход и потребление в экономике, нагрузка сети и доход компании сотовой связи и т.д.
Поставим следующую задачу: найти наилучшее линейное приближение одной величины с помощью другой.
Итак, мы наблюдаем одну случайную величину и хотим спрогнозировать другую.
Пусть, для определенности, мы хотим приблизить значения величины значениями величины
Иными словами, мы хотим найти линейную комбинацию вида
(где и
- неизвестные постоянные), дающие наилучшее приближение для случайной величины
в том смысле, что
(*)
Минимум в правой части (*) берется по всем постоянным c1 и c2.
Такое приближение называется наилучшим среднеквадратическим приближением.
Оказывается, такое оптимальное приближение или прогноз одной величины по другой, действительно, можно найти.
Обратите внимание, что мы работаем только в классе линейных приближений и ищем наилучшее или оптимальное приближение в смысле (*).
Заметим также, мы не делаем никакого предположения о виде распределения случайных величин, а рассматриваем общий случай (важно, чтобы у величин существовало среднее и дисперсия).
Начнем проводить рассуждения.
1. Рассмотрим вначале простой случай, который позволяет прояснить суть дела.
Пусть случайная величина есть константа.
Наилучшим среднеквадратическим приближением для является, очевидно, среднее.
Иными словами,
Это основано на том факте, что
2. Рассмотрим общий случай.
Положим
(**)
Где
Перейдем для удобства к нормированным случайным величинам
и
Для любых постоянных c1 и c2 имеем
Видно, что минимум выражения достигается, когда c1 = 0 и c2 = r:
Выражая разность через исходные величины
и
И, очевидно, искомая линейная комбинация есть
Здесь a1 и a2 – математические ожидания случайных величин и
и
- их дисперсии, а определенная равенством (**) постоянная r – так называемый коэффициент корреляции этих случайных величин.
Видно, что коэффициент корреляции r всегда лежит в пределах есть просто линейная комбинация вида
Действительно, если r=-1 или r=1, то
И, следовательно, с вероятностью 1.
Случайные величины и
называют некоррелированными, если их коэффициент корреляции равен 0.
Отметим, что независимые величины являются некоррелированными, так как
Обратное, вообще говоря, неверно:
Из некоррелированности случайных величин не следует их независимость.
В частном случае гауссовских (нормальных) случайных величин, понятия некоррелированности и независимости совпадают.
Связанные определения:
Линейная регрессия
Матрица плана
Общая линейная модель
Регрессия
Скачать
Актуальные курсы