МНОГОМЕ́РНЫЙ СТАТИСТИ́ЧЕСКИЙ АНА́ЛИЗ

  • рубрика

    Рубрика: Математика

  • родственные статьи
  • image description

    В книжной версии

    Том 20. Москва, 2012, стр. 544-545

  • image description

    Скопировать библиографическую ссылку:




Авторы: С. А. Айвазян

МНОГОМЕ́РНЫЙ СТАТИСТИ́ЧЕСКИЙ АНА́ЛИЗ, раз­дел ма­те­ма­ти­че­ской ста­ти­сти­ки, по­свя­щён­ный ма­те­ма­тич. ме­то­дам по­строе­ния оп­ти­маль­ных пла­нов сбо­ра, сис­те­ма­ти­за­ции, об­ра­бот­ки и ин­тер­пре­та­ции мно­го­мер­ных ста­ти­стич. дан­ных. Эти ме­то­ды пред­на­зна­че­ны пре­ж­де все­го для вы­яв­ле­ния ха­рак­те­ра и струк­ту­ры взаи­мо­свя­зей ме­ж­ду ком­по­нен­та­ми ис­сле­дуе­мо­го мно­го­мер­но­го при­зна­ка и ис­поль­зу­ют­ся для по­лу­че­ния тео­ре­тич. и прак­тич. вы­во­дов. Под мно­го­мер­ным при­зна­ком по­ни­ма­ет­ся $p$-мер­ный век­тор $x=(x_1,x_2,...,x_p)$ по­ка­за­те­лей (пе­ре­мен­ных) $x_1,x_2,...,x_p$, сре­ди ко­то­рых мо­гут быть ко­ли­че­ст­вен­ные, т. е. из­ме­ряю­щие в оп­ре­де­лён­ной шка­ле сте­пень про­яв­ле­ния изу­чае­мо­го свой­ст­ва объ­ек­та; по­ряд­ко­вые (или ор­ди­наль­ные), т. е. по­зво­ляю­щие упо­ря­до­чи­вать ана­ли­зи­руе­мые объ­ек­ты по сте­пе­ни про­яв­ле­ния в них изу­чае­мо­го свой­ст­ва; клас­си­фи­ка­ци­он­ные (или но­ми­наль­ные), т. е. по­зво­ляю­щие раз­би­вать ис­сле­дуе­мую со­во­куп­ность объ­ек­тов на од­но­род­ные (по ана­ли­зи­руе­мо­му свой­ст­ву) клас­сы. Ре­зуль­та­ты из­ме­ре­ния этих по­ка­за­те­лей на ка­ж­дом из ана­ли­зи­руе­мых объ­ек­тов ис­сле­дуе­мой со­во­куп­но­сти об­ра­зу­ют по­сле­до­ва­тель­ность мно­го­мер­ных на­блю­де­ний, или ис­ход­ный мас­сив мно­го­мер­ных дан­ных, ко­то­рый ис­поль­зу­ет­ся для про­ве­де­ния М. с. а. В зна­чит. час­ти М. с. а. рас­смат­ри­ва­ют­ся си­туа­ции, в ко­то­рых ис­сле­ду­е­мый мно­го­мер­ный при­знак ин­тер­пре­ти­ру­ет­ся как мно­го­мер­ная слу­чай­ная ве­ли­чи­на и ана­ли­зи­руе­мая по­сле­до­ва­тель­ность мно­го­мер­ных на­блю­де­ний – как вы­бор­ка из со­во­куп­но­сти ге­не­раль­ной. В этом слу­чае вы­бор ме­то­дов об­ра­бот­ки ис­ход­ных ста­ти­стич. дан­ных и ана­лиз их свойств про­из­во­дят­ся на ос­но­ве тех или иных до­пу­ще­ний от­но­си­тель­но при­ро­ды мно­го­мер­но­го (со­вме­ст­но­го) за­ко­на рас­пре­де­ле­ния ве­ро­ят­но­стей.

По со­дер­жа­нию в М. с. а. вы­де­ля­ют 3 осн. раз­де­ла: М. с. а. мно­го­мер­ных рас­пре­де­ле­ний, М. с. а. струк­ту­ры и ха­рак­те­ра взаи­мо­свя­зей ме­ж­ду ком­по­нен­та­ми ис­сле­дуе­мо­го мно­го­мер­но­го при­зна­ка, М. с. а. гео­мет­рич. струк­ту­ры ис­сле­дуе­мой со­во­куп­но­сти мно­го­мер­ных на­блю­де­ний.

Многомерный статистический анализ многомерных распределений

ох­ва­ты­ва­ет лишь си­туа­ции, в ко­то­рых об­ра­ба­ты­ва­е­мые на­блю­де­ния име­ют ве­ро­ят­но­ст­ную при­ро­ду, т. е. ин­тер­пре­ти­ру­ют­ся как вы­бор­ка из не­ко­то­рой ге­не­раль­ной со­во­куп­но­сти. К осн. за­да­чам это­го раз­де­ла от­но­сят­ся: ста­ти­стич. оце­ни­ва­ние ис­сле­дуе­мых мно­го­мер­ных рас­пре­де­ле­ний и их чи­сло­вых ха­рак­те­ри­стик; ис­сле­до­ва­ние свойств ис­поль­зуе­мых ста­ти­сти­че­ских оце­нок; ис­сле­до­ва­ние рас­пре­де­ле­ний ве­ро­ят­но­стей для ста­ти­стик, с по­мо­щью ко­то­рых стро­ят­ся ста­ти­стич. кри­те­рии про­вер­ки ги­по­тез о ве­ро­ят­но­ст­ной при­ро­де ана­ли­зи­руе­мых мно­го­мер­ных дан­ных.

Многомерный статистический анализ структуры и характера взаимосвязей компонент исследуемого многомерного признака

вклю­ча­ет в се­бя по­ня­тия и резуль­та­ты та­ких ме­то­дов и мо­де­лей М. с. а., как рег­рес­си­он­ный ана­лиз, дис­пер­си­он­ный ана­лиз, фак­тор­ный ана­лиз, ана­лиз мно­го­мер­ных вре­мен­ны́х ря­дов [под мно­го­мер­ным вре­мен­ны́м ря­дом по­ни­ма­ет­ся по­сле­до­ва­тель­ность на­блю­де­ний мно­го­мер­ных при­зна­ков ($x_1,x_2,...,x_p$), про­из­ве­дён­ных во вре­ме­ни].

Многомерный статистический анализ геометрической структуры исследуемой совокупности многомерных наблюдений

объ­е­ди­ня­ет в се­бе по­ня­тия и ре­зуль­та­ты та­ких мо­де­лей и схем, как дис­кри­ми­нант­ный ана­лиз, ана­лиз сме­сей ве­ро­ят­но­ст­ных рас­пре­де­ле­ний, кла­стер­ный ана­лиз, мно­го­мер­ное шка­ли­ро­ва­ние. Осн. по­ня­ти­ем во всех этих мо­де­лях и схе­мах яв­ля­ет­ся по­ня­тие рас­стоя­ния (ме­ры бли­зо­сти, ме­ры сход­ст­ва) ме­ж­ду ана­ли­зи­руе­мы­ми эле­мен­та­ми.

Ме­то­ды и ре­зуль­та­ты дис­кри­ми­нант­но­го ана­ли­за на­прав­ле­ны на ре­ше­ние сле­дую­щей за­да­чи. Из­вест­но о су­ще­ст­во­ва­нии оп­ре­де­лён­но­го чис­ла $k⩾2$ ге­не­раль­ных со­во­куп­но­стей и име­ет­ся по од­ной вы­бор­ке из ка­ж­дой со­во­куп­но­сти (обу­ча­ю­щие вы­бор­ки). Тре­бу­ет­ся по­стро­ить ос­но­ван­ное на имею­щих­ся обу­чаю­щих вы­бор­ках наи­луч­шее (в оп­ре­де­лён­ном смыс­ле) клас­си­фи­ци­рую­щее пра­ви­ло, по­зво­ляю­щее при­пи­сать но­вый элемент (на­блю­де­ние) к сво­ей ге­не­раль­ной со­во­куп­но­сти, ко­гда за­ра­нее не­из­вест­но, к ка­кой из со­во­куп­но­стей этот эле­мент при­над­ле­жит.

За­да­ча ана­ли­за сме­сей ве­ро­ят­но­ст­ных рас­пре­де­ле­ний ча­ще все­го воз­ни­ка­ет в свя­зи с ис­сле­до­ва­ни­ем «гео­мет­ри­че­ской струк­ту­ры» рас­смат­ри­вае­мой со­во­куп­но­сти. При этом пред­по­ла­га­ет­ся, что рас­пре­де­ле­ние об­щей ге­не­раль­ной со­во­куп­но­сти, из ко­то­рой из­вле­че­на ана­ли­зи­руе­мая вы­бор­ка, опи­сы­ва­ет­ся сме­сью рас­пре­де­ле­ний ви­да $$P(x)=\sum_{r=1}^kπ_rP_r(x|θ_r),$$ где $r$ – но­мер не­ко­то­рой од­но­род­ной со­во­куп­но­сти, ха­рак­те­ри­зую­щей­ся ве­ро­ят­но­ст­ным рас­пре­де­ле­ни­ем $P_r(x|θ_r)$, за­ви­ся­щим от па­ра­мет­ра $θ_r, π_r$ – ап­ри­ор­ная ве­ро­ят­ность (удель­ный вес эле­мен­тов) $r$-го клас­са в об­щей ге­не­раль­ной со­во­куп­но­сти. За­да­ча со­сто­ит в ста­ти­стич. оце­ни­ва­нии не­из­вест­ных па­ра­мет­ров $θ_r, π_r, r=1,...,k$. Это, в ча­ст­но­сти, по­зво­ля­ет све­сти за­да­чу клас­си­фи­ка­ции эле­мен­тов к схе­ме дис­кри­ми­нант­но­го ана­ли­за, хо­тя в дан­ном слу­чае от­сут­ст­ву­ют обу­чаю­щие вы­бор­ки.

Ме­то­ды и ре­зуль­та­ты кла­стер­но­го ана­ли­за (клас­си­фи­ка­ция, рас­по­зна­ва­ние об­ра­зов «без учи­те­ля») на­прав­ле­ны на ре­ше­ние сле­дую­щей за­да­чи. Гео­мет­рич. струк­ту­ра ана­ли­зи­руе­мой со­во­куп­но­сти эле­мен­тов за­да­на ли­бо ко­ор­ди­на­та­ми со­от­вет­ст­вую­щих то­чек, ли­бо на­бо­ром гео­мет­рич. ха­рак­те­ри­стик их вза­им­но­го рас­по­ло­же­ния, напр. мат­ри­цей по­пар­ных рас­стоя­ний. Тре­бу­ет­ся раз­бить ис­сле­ду­е­мую со­во­куп­ность эле­мен­тов на срав­ни­тель­но не­боль­шое (за­ра­нее из­вест­ное или нет) чис­ло клас­сов так, что­бы эле­мен­ты од­но­го клас­са на­хо­ди­лись на не­боль­шом рас­стоя­нии друг от дру­га, в то вре­мя как раз­ные клас­сы бы­ли бы по воз­мож­но­сти дос­та­точ­но уда­ле­ны один от дру­го­го.

За­да­ча мно­го­мер­но­го шка­ли­ро­ва­ния от­но­сит­ся к си­туа­ции, ко­гда ис­сле­дуе­мая со­во­куп­ность эле­мен­тов за­да­на с по­мо­щью мат­ри­цы по­пар­ных рас­стоя­ний, и за­клю­ча­ет­ся в при­пи­сы­ва­нии ка­ж­до­му из эле­мен­тов за­дан­но­го чис­ла ко­ор­ди­нат та­ким об­ра­зом, что­бы струк­ту­ра по­пар­ных рас­стоя­ний ме­ж­ду эле­мен­та­ми, из­ме­рен­ных с по­мо­щью этих вспо­мо­га­тель­ных ко­ор­ди­нат, в сред­нем наи­ме­нее от­ли­ча­лась бы от за­дан­ной.

При­клад­ное на­зна­че­ние М. с. а. со­сто­ит в осн. в изу­че­нии сле­дую­щих про­блем.

Проблема статистического исследования зависимостей

ме­ж­ду ана­ли­зи­руе­мы­ми по­ка­за­те­ля­ми. Пред­по­ла­га­ет­ся, что ис­сле­дуе­мый на­бор ста­ти­сти­че­ски ре­ги­ст­ри­руе­мых по­ка­за­те­лей $x$ раз­бит, ис­хо­дя из со­дер­жа­тель­но­го смыс­ла этих по­ка­за­те­лей и окон­ча­тель­ных це­лей ис­сле­до­ва­ния, на $q$-мер­ный под­век­тор $x^{(1)}$ пред­ска­зы­вае­мых (за­ви­си­мых) пе­ре­мен­ных и $(p–q)$-мер­ный под­век­тор $x^{(2)}$ пред­ска­зы­ваю­щих (не­за­ви­си­мых) пе­ре­мен­ных. Про­бле­ма со­сто­ит в оп­ре­де­ле­нии на ос­но­ва­нии имею­щих­ся на­блю­де­ний та­кой $q$-мер­ной век­тор­ной функ­ции $f(x^{(2)})$ из клас­са до­пус­ти­мых ре­ше­ний $F$, ко­то­рая да­ва­ла бы наи­луч­шую (в оп­ре­де­лён­ном смыс­ле) ап­прок­си­ма­цию по­ве­де­ния под­век­то­ра по­ка­за­те­лей $x^{(1)}$.

Проблема классификации элементов 

(объ­ек­тов или по­ка­за­те­лей) в об­щей по­ста­нов­ке за­клю­ча­ет­ся в том, что­бы всю ана­ли­зи­руе­мую со­во­куп­ность эле­мен­тов раз­бить на срав­ни­тель­но не­боль­шое чис­ло од­но­род­ных (в оп­ре­де­лён­ном смыс­ле) групп. В за­ви­си­мо­сти от при­ро­ды ап­ри­ор­ной ин­фор­ма­ции и кон­крет­но­го ви­да функ­цио­на­ла, за­даю­ще­го кри­те­рий ка­че­ст­ва клас­си­фи­ка­ции, при­хо­дят к тем или иным схе­мам дис­кри­ми­нант­но­го ана­ли­за, кла­стер­но­го ана­ли­за, ана­ли­за сме­сей рас­пре­де­ле­ний.

Проблема снижения размерности

ис­сле­дуе­мо­го фак­тор­но­го про­стран­ст­ва и от­бо­ра наи­бо­лее ин­фор­ма­тив­ных по­ка­за­те­лей за­клю­ча­ет­ся в оп­ре­де­ле­нии та­ко­го на­бо­ра по­ка­за­те­лей $Z=(z_1,z_2,...,z_m)$ из клас­са до­пус­ти­мых пре­об­ра­зо­ва­ний $Z(x)$ ис­ход­ных по­ка­за­те­лей $x=(x_1,x_2,...,x_p)$, где $m$ зна­чи­тель­но мень­ше $p$, на ко­то­ром дос­ти­га­ет­ся мак­си­мум не­ко­то­рой за­дан­ной ме­ры ин­фор­ма­тив­но­сти $m$-мер­ной сис­те­мы при­зна­ков. Кон­кре­ти­за­ция функ­цио­на­ла, за­даю­ще­го эту ме­ру ин­фор­ма­тив­но­сти, при­во­дит, в ча­ст­но­сти, к разл. схе­мам фак­тор­но­го ана­ли­за или ме­то­дам от­бо­ра наи­бо­лее ин­фор­ма­тив­ных по­ка­за­те­лей в схе­мах ста­ти­стич. ис­сле­до­ва­ния за­ви­си­мо­стей и дис­кри­ми­нант­но­го ана­ли­за.

Осн. ма­те­ма­тич. ме­то­ды М. с. а. вклю­ча­ют ме­то­ды тео­рии ве­ро­ят­но­стей, тео­рии сис­тем ли­ней­ных урав­не­ний и тео­рии мат­риц, а так­же не­ко­то­рые оп­ти­ми­за­ци­он­ные ал­го­рит­мы. М. с. а. при­ме­ня­ет­ся в разл. ста­ти­стич. и эко­но­мет­рич. ис­сле­до­ва­ни­ях.

Лит.: Ан­дер­сон Т. В. Вве­де­ние в мно­го­мер­ный ста­ти­сти­че­ский ана­лиз. М., 1963; Кен­далл М. Дж., Стьюарт Ф. Мно­го­мер­ный ста­ти­сти­че­ский ана­лиз и вре­мен­ные ря­ды. М., 1976; При­клад­ная ста­ти­сти­ка: клас­си­фи­ка­ция и сни­же­ние раз­мер­но­сти. М., 1989; Ай­ва­зян С. А. Ме­то­ды эко­но­мет­ри­ки. М., 2010.

Вернуться к началу