Подпишитесь на наши новости
Вернуться к началу с статьи up
 

ГЛА́ВНЫЕ КОМПОНЕ́НТЫ

  • рубрика

    Рубрика: Экономика

  • родственные статьи
  • image description

    В книжной версии

    Том 7. Москва, 2007, стр. 203

  • image description

    Скопировать библиографическую ссылку:




Авторы: И. А. Корнилов

ГЛА́ВНЫЕ КОМПОНЕ́НТЫ в ста­ти­сти­ке, обоб­щён­ные по­ка­за­те­ли, по­стро­ен­ные на ос­но­ве ис­ход­ных при­зна­ков. Обыч­но ис­ход­ные при­зна­ки весь­ма су­ще­ст­вен­но кор­ре­ли­ру­ют ме­ж­ду со­бой (см. Кор­ре­ли­ро­ван­ные ве­ли­чи­ны). Это за­труд­ня­ет про­ве­де­ние ис­сле­до­ва­ний, т. к. боль­шин­ст­во мно­го­мер­ных ста­ти­стических ме­то­дов пред­по­ла­га­ет (по край­ней ме­ре, не­яв­но) не­кор­ре­ли­ро­ван­ность при­зна­ков. По­это­му на­до раз­ра­ба­ты­вать ме­то­ды, учи­ты­ваю­щие кор­ре­ли­ро­ван­ность при­зна­ков, или пре­об­ра­зо­вать ис­ход­ное ко­со­уголь­ное про­стран­ст­во в ор­то­го­наль­ное. Ме­тод Г. к. реа­ли­зу­ет вто­рую идею.

Сна­ча­ла на ос­но­ве мат­ри­цы ис­ход­ных при­зна­ков $X$ стро­ят со­от­вет­ст­вую­щую мат­ри­цу стан­дар­ти­зо­ван­ных при­зна­ков $Z$. За­тем по $Z$ стро­ят кор­ре­ля­ци­он­ную мат­ри­цу: $R=(Z′·Z)/n$, ко­то­рая и слу­жит ос­но­вой ме­то­да Г. к. Для од­но­знач­но­сти по­лу­чен­но­го ре­ше­ния на­ла­га­ет­ся до­пол­нит. ус­ло­вие: упо­ря­до­че­ние по убы­ва­нию дис­пер­сий гл. ком­по­нент.

Ме­тод мно­жи­те­лей Ла­гран­жа пре­об­ра­зу­ет за­да­чу по­ис­ка ус­лов­но­го экс­тре­му­ма в за­да­чу по­ис­ка без­ус­лов­но­го экс­тре­му­ма. А она, в свою оче­редь, сво­дит­ся к за­да­че ор­то­го­на­ли­за­ции про­стран­ст­ва пе­ре­хо­дом к сис­те­ме соб­ст­вен­ных век­то­ров мат­ри­цы $R$.

В ре­зуль­та­те ре­ше­ния про­бле­мы соб­ст­вен­ных чи­сел и соб­ст­вен­ных век­то­ров стро­ят­ся две мат­ри­цы: диа­го­наль­ная мат­ри­ца соб­ст­вен­ных чи­сел ($Λ$) и ор­то­го­наль­ная мат­ри­ца соб­ст­вен­ных век­то­ров ($U$).

Да­лее оп­ре­де­ля­ет­ся мат­ри­ца на­гру­зок: $А=U·Λ^{1/2}$ , эле­мен­ты ко­то­рой $[A=\{a_{jn}\}; j, ν=1, …, k]$ яв­ля­ют­ся ко­эф­фи­ци­ен­та­ми пар­ной кор­ре­ля­ции ме­ж­ду ис­ход­ны­ми при­зна­ка­ми (рас­по­ло­жен­ны­ми по стро­кам) и по­стро­ен­ны­ми Г. к. (рас­поло­жен­ны­ми по столб­цам) $a_{jν}=r_{X_j}F_v$. Это по­зво­ля­ет со­дер­жа­тель­но ин­тер­пре­ти­ро­вать пер­вые наи­бо­лее ве­со­мые Г. к. Кро­ме то­го, мож­но объ­яс­нить связь меж­ду ис­ход­ны­ми при­зна­ка­ми как след­ст­вие их свя­зи с гл. ком­по­нен­та­ми.

Да­лее стро­ит­ся мат­ри­ца ин­ди­ви­ду­аль­ных зна­че­ний Г. к. на объ­ек­тах: $F=Z·U$. Обоб­щён­ные по­ка­за­те­ли (Г. к.) рас­по­ла­га­ют­ся по столб­цам этой мат­ри­цы. Они яв­ля­ют­ся ор­то­го­наль­ны­ми (не­кор­ре­ли­ро­ван­ны­ми) цен­три­ро­ван­ны­ми ве­ли­чи­на­ми с дис­пер­сия­ми, рав­ны­ми со­от­вет­ст­вую­щим соб­ст­вен­ным чис­лам. Это по­зво­ля­ет ус­пеш­но ис­поль­зо­вать Г. к. при клас­си­фи­ка­ции объ­ек­тов или при по­строе­нии урав­не­ния рег­рес­сии (с даль­ней­шим пе­ре­счё­том в ис­ход­ные при­зна­ки). На прак­ти­ке ис­поль­зу­ют­ся неск. пер­вых наи­бо­лее ве­со­мых гл. ком­по­нент.

Боль­шин­ст­во совр. ре­аль­ных ста­ти­стич. ис­сле­до­ва­ний мат­ри­цы дан­ных – «объ­ект–при­знак» – вы­пол­ня­ет­ся с ис­поль­зо­ва­ни­ем ме­то­да Г. к., че­му спо­соб­ст­ву­ет на­ли­чие про­грамм во всех ста­ти­стич. па­ке­тах при­клад­ных прог­рамм (ППП). На­до учи­ты­вать, что при со­став­ле­нии про­грамм раз­ра­бот­чи­ки мог­ли вне­сти мо­ди­фи­ка­ции; напр., опи­рать­ся не на кор­ре­ля­ци­он­ную, а на ко­ва­риа­ци­он­ную мат­ри­цу или вклю­чить ат­ри­бут фак­тор­ный ана­лиз: воз­мож­ность вра­ще­ния мат­ри­цы на­гру­зок для улуч­ше­ния ин­тер­пре­та­ции или при по­строе­нии мат­ри­цы $F$ ис­поль­зо­вать фор­му­лу $F=Z·А$ вме­сто ука­зан­ной и т. д.

Лит.: При­клад­ная ста­тис­ти­ка. Клас­си­фи­ка­ция и сни­же­ние раз­мер­но­стей / Под ред. С. А. Ай­ва­зя­на. М., 1989, с. 334.

Вернуться к началу