КОРРЕЛЯ́ЦИЯ
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
Книжная версия:
Электронная версия:
КОРРЕЛЯ́ЦИЯ в математике, зависимость между случайными величинами, не имеющая, вообще говоря, строго функционального характера. В отличие от функциональной зависимости К., как правило, рассматривается тогда, когда одна из величин зависит не только от данной др. величины, но и от ряда иных случайных факторов. Зависимость между двумя случайными событиями проявляется в том, что условная вероятность одного из них при условии, что другое произошло, отличается от безусловной вероятности. Аналогично, влияние одной случайной величины на другую характеризуется условными распределениями одной из них при фиксированных значениях другой.
Пусть X и Y – случайные величины с заданным совместным распределением вероятностей, aX и aY – математические ожидания, σ2X и σ2Y – дисперсии и ρ – корреляции коэффициент случайных величин X и Y. Если для каждого возможного значения x случайной величины X определено условное математич. ожидание y(x)=E(Y|X=x), то функция y(x) называется регрессией величины Y по X. Для оценки того, насколько точно регрессия передаёт изменение Y при изменении X, используется условная дисперсия Y при данном значении X=x или её ср. величина (мера рассеяния Y около линии регрессии), равная σ2Y|X=E(Y−E(Y|X))2.
Если X и Y независимы, то условные математич. ожидания Y не зависят от x и совпадают с безусловным, т. е. y(x)=aY, при этом σ2Y|X=σ2Y. При функциональной связи между Y и X величина Y при каждом данном X=x принимает одно значение и σ2Y|X=0. Аналогично определяется x(y)=E(X|Y=y) – регрессия X по Y. Показателем концентрации распределения вблизи линии регрессии y(x) служит корреляционное отношение η2Y|X=(σ2Y−σ2Y|X)/σ2Y=1−σ2Y|X/σ2Y.Величина η2Y|X равна нулю тогда и только тогда, когда регрессия имеет вид y(x)=aY, в этом случае коэф. К. ρ равен нулю и величина Y не коррелирована с X. Если регрессия Y по X линейна, т. е. линия регрессии – прямая, имеющая вид y(x)=aY+ρσYσX(x−aX), то σ2Y|X=σ2Y(1−ρ2) и η2Y|X=ρ2. Если, кроме того, |ρ|=1, то Y связана с X точной линейной зависимостью, если же η2Y|X=ρ2<1, то между Y и X нет точной функциональной зависимости. Точная функциональная зависимость Y от X, отличная от линейной, имеет место тогда и только тогда, когда ρ2<η2Y|X=1. Практич. использование коэф. К. в качестве меры отсутствия зависимости оправданно (за редким исключением) лишь тогда, когда совместное распределение X и Y нормально (или близко к нормальному распределению), т. к. в этом случае из равенства ρ=0 следует независимость X и Y. Для произвольных случайных величин X и Y использование ρ как меры зависимости часто приводит к ошибочным выводам, т. к. ρ может равняться нулю даже при функциональной связи между величинами. Если совместное распределение X и Y нормально, то обе линии регрессии y(x) и x(y) суть прямые, при |ρ|=1 прямые регрессии сливаются в одну, что соответствует линейной зависимости между X и Y, при ρ=0 величины X и Y независимы.
При изучении связи между несколькими случайными величинами X1,...,Xn с заданным совместным распределением используется корреляционная матрица, элементами которой являются обычные коэффициенты К. ρij между Xi и Xj,i,j=1,...,n. Мерой линейной К. между X1 и совокупностью остальных величин X2,...,Xn служит множественный коэф. К., который определяется как обычный коэф. К. между X1 и наилучшим линейным приближением X1 по X2,...,Xn, т. е. между X1 и β1+β2X2+...+βnXn, где числа β1,...,βn определяются так, чтобы дисперсия величины X1−(β1+β2X2+...+βnXn) была минимальной. Множественный коэф. К. выражается через элементы корреляционной матрицы, напр. при n=3 он равен ρ1⋅(23)=√ρ212+ρ213−2ρ12ρ13ρ231−ρ223.
Если предполагается, что изменение величин X1 и X2 определяется в какой-то мере изменением остальных величин X3,…,Xn, то показателем линейной связи между X1 и X2 при исключении влияния X3,...,Xn является частный коэф. К. между X1 и X2 относительно X3,...,Xn, который определяется как обычный коэф. К. между X1−X∗1 и X2−X∗2, где X∗1, X∗2 – соответственно наилучшие линейные приближения X1 и X2 по X3,...,Xn. Напр., в случае n=3 этот коэф. равен ρ12⋅3=ρ12−ρ12ρ23√(1−ρ213)(1−ρ223). В математич. статистике разработаны методы оценки К. между случайными величинами и методы проверки гипотез о значениях К., использующие их выборочные аналоги. См. Корреляционный анализ.