Подпишитесь на наши новости
Вернуться к началу с статьи up
 

КОРРЕЛЯЦИО́ННЫЙ АНА́ЛИЗ

  • рубрика

    Рубрика: Математика

  • родственные статьи
  • image description

    В книжной версии

    Том 15. Москва, 2010, стр. 370

  • image description

    Скопировать библиографическую ссылку:




Авторы: А. В. Прохоров

КОРРЕЛЯЦИО́ННЫЙ АНА́ЛИЗ, раз­дел ма­те­ма­ти­че­ской ста­ти­сти­ки, пред­на­зна­чен­ный для оцен­ки кор­ре­ля­ции ме­ж­ду слу­чай­ны­ми ве­ли­чи­на­ми и про­вер­ки ги­по­тез о зна­чи­мо­сти свя­зи ме­ж­ду ни­ми. К. а. ста­ти­стич. дан­ных ис­поль­зу­ет сле­дую­щие осн. прак­тич. приё­мы: по­строе­ние кор­ре­ля­ци­он­но­го по­ля и со­став­ле­ние кор­ре­ля­ци­он­ной таб­ли­цы; вы­чис­ле­ние вы­бо­роч­ных ко­эф­фи­ци­ен­тов кор­ре­ля­ции; про­вер­ку ста­ти­стич. ги­по­тез зна­чи­мо­сти свя­зи. Даль­ней­шее ис­сле­до­ва­ние мо­жет за­клю­чать­ся в ус­та­нов­ле­нии кон­крет­но­го ви­да за­ви­си­мо­сти ме­ж­ду ве­ли­чи­на­ми (см. Рег­рес­си­он­ный ана­лиз).

Вспо­мо­гат. сред­ст­ва­ми при ана­ли­зе вы­бо­роч­ных дву­мер­ных дан­ных яв­ля­ют­ся кор­ре­ля­ци­он­ное по­ле и кор­ре­ля­ци­он­ная таб­ли­ца. Кор­ре­ля­ци­он­ное по­ле по­лу­ча­ют, на­но­ся вы­бо­роч­ные точ­ки на ко­ор­ди­нат­ную плос­кость. По ха­рак­те­ру рас­по­ло­же­ния то­чек по­ля мож­но со­ста­вить пред­ва­рит. пред­став­ле­ние о фор­ме за­ви­си­мо­сти слу­чай­ных ве­ли­чин (напр., о том, что од­на ве­ли­чи­на в ср. воз­рас­тает или убы­ва­ет при воз­рас­та­нии дру­гой). Для чис­лен­ной об­ра­бот­ки ре­зуль­та­ты обыч­но груп­пи­ру­ют и пред­став­ля­ют в фор­ме кор­ре­ля­ци­он­ной таб­ли­цы. В ка­ж­дой клет­ке этой таб­ли­цы при­во­дят­ся чис­лен­но­сти $n_{ij}$ тех пар $(x,y)$, ком­по­нен­ты ко­то­рых по­па­да­ют в со­от­вет­ст­вую­щие ин­тер­ва­лы груп­пи­ров­ки по ка­ж­дой пе­ре­мен­ной. Обыч­но дли­ны ин­тер­ва­лов груп­пи­ров­ки (по ка­ж­дой из пе­ре­мен­ных) вы­би­ра­ют рав­ны­ми ме­ж­ду со­бой, и цен­тры $x_i$ (со­от­вет­ст­вен­но $y_j$) этих ин­тер­ва­лов, и чис­ла $n_{ij}$ ис­поль­зу­ют в ка­че­ст­ве ос­но­вы для рас­чё­тов.

Кор­ре­ля­ци­он­ная таб­ли­ца по­зво­ля­ет, в ча­ст­но­сти, вы­чис­лить вы­бо­роч­ный ко­эф. кор­ре­ля­ции и вы­бо­роч­ное кор­ре­ля­ци­он­ное от­но­ше­ние. Вы­бо­роч­ный ко­эф. кор­ре­ля­ции оп­ре­де­ля­ет­ся по фор­му­ле $$\hat\rho=\frac{\sum_i\sum_j(x_i-\bar x)(y_j-\bar y)n_{ij}}{\sqrt{\sum_i n_{i\cdot}(x_i-\bar x)^2}\sqrt{\sum_jn_{\cdot j}}(y_j-\bar y)^2},$$где $n_{i \cdot}=\sum_jn_{ij}$, $n_{\cdot j}=\sum_in_{ij}$ и $\bar x=\sum_in_{i \cdot}x_i/n$, $\bar y=\sum_j n_{\cdot j}y_j/n$. При боль­шом чис­ле не­зави­си­мых на­блю­де­ний, под­чи­нён­ных од­но­му и то­му же рас­пре­де­ле­нию, близ­ко­му к нор­маль­но­му, $\hat ρ$ бли­зок к ис­тин­но­му кор­ре­ля­ции ко­эф­фи­ци­ен­ту $ρ$ . В др. слу­ча­ях в ка­че­ст­ве ха­рак­те­ри­сти­ки свя­зи ме­ж­ду $X$ и $Y$ ре­ко­мен­ду­ет­ся ис­поль­зо­вать кор­ре­ля­ци­он­ное от­но­ше­ние $η_{Y|X}^2$, ин­тер­пре­та­ция ко­то­ро­го не за­ви­сит от ви­да ис­сле­дуе­мой за­ви­си­мо­сти. Вы­бо­роч­ное зна­че­ние $\hat η^2_{Y|X}$ вы­чис­ля­ет­ся по дан­ным кор­ре­ля­ци­он­ной таб­ли­цы: $$\hat η^2_{Y|X}=\frac{\sum_i n_{i \cdot}(\bar y_i- \bar y)^2/n}{\sum_j n_{\cdot j}(y_j- \bar y)^2/n},$$где чис­ли­тель ха­рак­те­ри­зу­ет рас­сея­ние ус­лов­ных сред­них зна­че­ний $\bar y_i$ око­ло без­ус­лов­но­го сред­не­го $\bar y$ (ана­ло­гич­но оп­ре­де­ля­ет­ся вы­бо­роч­ное зна­че­ние $\hat η^2_{X|Y}$). Ве­ли­чи­на $\hat η^2_{Y|X}-\hat\rho^2$ ис­поль­зу­ет­ся в ка­че­ст­ве ин­ди­ка­то­ра от­кло­не­ния рег­рес­сии от ли­ней­ной.

Один из ме­то­дов про­вер­ки ги­по­те­зы о зна­чи­мо­сти свя­зи ме­ж­ду $X$ и $Y$ ос­но­вы­ва­ет­ся на рас­пре­де­ле­нии вы­бо­роч­но­го ко­эф. кор­ре­ля­ции. В слу­чае нор­маль­но­го рас­пре­де­ле­ния ве­ли­чи­на вы­бо­роч­но­го ко­эф. кор­ре­ля­ции $\hat\rho$ счи­та­ет­ся зна­чи­мо от­лич­ной от ну­ля, ес­ли вы­пол­ня­ет­ся не­ра­вен­ст­во $$\hat\rho^2>(1+(n-2)/t^2_α)-1,$$где $t_α$ есть кван­тиль по­ряд­ка $α$ Стью­ден­та рас­пре­де­ле­ния с $n-2$ сте­пе­ня­ми сво­бо­ды, со­от­вет­ст­вую­щая вы­бран­но­му зна­чи­мо­сти уров­ню $α$. В слу­чае $ρ≠0$ час­то ис­поль­зу­ют т. н. $z$-пре­об­ра­зо­ва­ние Фи­ше­ра, за­ме­няя ве­ли­чи­ну $\hat\rho$ на $$z={1\over2}\ln\frac{1+\hat\rho}{1-\hat\rho}.$$Уже при срав­ни­тель­но не­боль­ших $n$ рас­пре­де­ле­ние ве­ли­чи­ны $z$ хо­ро­шо при­бли­жа­ет­ся нор­маль­ным рас­пре­де­ле­ни­ем с ма­те­ма­тич. ожи­да­ни­ем, рав­ным $${1\over2}\ln\frac{1+\rho}{1-\rho}+\frac{\rho}{2(n-1)},$$ и дис­пер­си­ей, рав­ной $1/(n-3)$. Из это­го мож­но оп­ре­де­лить ин­тер­ва­лы (до­ве­ри­тель­ные гра­ни­цы) для ис­тин­но­го ко­эф. кор­ре­ля­ции $ρ$.

Лит.: Ван дер Вар­ден Б. Л. Ма­те­ма­ти­че­ская ста­ти­сти­ка. М., 1960; Ай­ва­зян С. А. Ста­ти­сти­че­ское ис­сле­до­ва­ние за­ви­си­мо­стей. М., 1968; Кен­далл М., Стьюарт А. Ста­ти­сти­че­ские вы­во­ды и свя­зи. М., 1973; Кра­мер Г. Ма­те­ма­ти­че­ские ме­то­ды ста­ти­сти­ки. 3-е изд. М.; Ижевск, 2003.

Вернуться к началу