Подпишитесь на наши новости
Вернуться к началу с статьи up
 

ДИСПЕРСИО́ННЫЙ АНА́ЛИЗ

  • рубрика

    Рубрика: Математика

  • родственные статьи
  • image description

    В книжной версии

    Том 9. Москва, 2007, стр. 64-65

  • image description

    Скопировать библиографическую ссылку:




Авторы: Л. Н. Большев

ДИСПЕРСИО́ННЫЙ АНА́ЛИЗ в ма­те­ма­тике, ста­ти­стич. ме­тод, пред­на­зна­чен­ный для вы­яв­ле­ния влия­ния от­дель­ных фак­то­ров на ре­зуль­тат экс­пе­ри­мен­та, а так­же для по­сле­дую­ще­го пла­ни­ро­ва­ния экс­пе­ри­мен­тов.

Ес­ли зна­че­ния не­из­вест­ных по­сто­ян­ных $a_1,…,a_I$ мо­гут быть из­ме­ре­ны с по­мо­щью разл. ме­то­дов или из­ме­ри­тель­ных средств $M_1,…,M_J$ и в ка­ж­дом слу­чае т. н. сис­те­ма­тич. ошиб­ка $b_{ij}$ мо­жет, во­об­ще го­во­ря, за­ви­сеть как от вы­бран­но­го ме­то­да $M_j$, так и от не­из­вест­но­го из­ме­ряе­мо­го зна­че­ния $a_i$, то ре­зуль­та­ты та­ких из­ме­ре­ний пред­став­ля­ют со­бой сум­мы вида$$x_{ijk}=a_i+b_{ij}+y_{ijk}, i=1,...,I, j=1,...,J, k=1,...,K,$$ где $K$ – чис­ло не­за­ви­си­мых из­ме­ре­ний не­из­вест­ной ве­ли­чи­ны $a_i$ ме­то­дом $M_j$, а $y_{ijk}$ – слу­чай­ная ошиб­ка $k$-го из­ме­ре­ния ве­ли­чи­ны $a_i$ ме­то­дом $M_j$. При этом пред­по­ла­га­ет­ся, что все $y_{ijk}$ – не­за­ви­си­мые оди­на­ко­во рас­пре­де­лён­ные слу­чай­ные ве­ли­чи­ны, имею­щие ну­ле­вое ма­те­ма­тич. ожи­да­ние. Та­кая ли­ней­ная мо­дель на­зы­ва­ет­ся двух­фак­тор­ной схе­мой Д. а.; пер­вый фак­тор – ис­тин­ное зна­че­ние из­ме­ряе­мой ве­ли­чи­ны, вто­рой – ме­тод из­ме­ре­ния, при­чём в дан­ном слу­чае для ка­ж­дой воз­мож­ной ком­би­на­ции зна­че­ний пер­во­го и вто­ро­го фак­то­ров осу­ще­ст­в­ля­ет­ся оди­на­ко­вое чис­ло $K$ не­за­ви­си­мых из­ме­ре­ний (в бо­лее слож­ных мо­де­лях Д. а. от по­след­не­го пред­по­ло­же­ния ино­гда от­ка­зы­ва­ют­ся).

Напр., пусть в со­рев­но­ва­ни­ях уча­ст­ву­ют $I$ спорт­сме­нов, мас­тер­ст­во ко­то­рых оце­ни­ва­ет­ся $J$ судь­я­ми, при­чём каж­дый уча­ст­ник со­рев­но­ва­ний вы­сту­па­ет $K$ раз (име­ет $K$ по­пы­ток). В этом слу­чае $a_i$ – ис­тин­ное зна­че­ние по­ка­за­те­ля мас­тер­ст­ва спорт­сме­на с но­ме­ром $i$, $b_{ij}$ – сис­те­ма­тич. ошиб­ка, вно­си­мая в оцен­ку мас­тер­ст­ва i-го спорт­сме­на судь­ёй с но­ме­ром $j$, $x_{ijk}$ – оцен­ка, вы­став­лен­ная $j$-м судь­ёй $i$-му спорт­сме­ну за $k$-ю по­пыт­ку, а $y_{ijk}$ – слу­чай­ная по­греш­ность. По­доб­ная схе­ма ти­пич­на для т. н. субъ­ек­тив­ной экс­пер­ти­зы ка­че­ст­ва не­сколь­ких объ­ек­тов, осу­ще­ст­в­ляе­мой груп­пой экс­пер­тов. Др. при­мер – ста­ти­стич. ис­сле­до­ва­ние уро­жай­но­сти с.-х. куль­ту­ры в за­ви­си­мо­сти от од­но­го из $I$ сор­тов поч­вы и $J$ ме­то­дов её об­ра­бот­ки, при­чём для ка­ж­до­го сор­та поч­вы $i$ и ка­ж­до­го ме­то­да об­ра­бот­ки с но­ме­ром $j$ осу­ще­ст­в­ля­ет­ся $K$ не­за­ви­си­мых экс­пе­ри­мен­тов. В этом при­ме­ре мож­но счи­тать, что ве­ли­чи­ны $a_i$ рав­ны ну­лю, $b_{ij}$ – ис­тин­ное зна­че­ние уро­жай­но­сти для $i$-го сор­та поч­вы при $j$-м ме­то­де об­ра­бот­ки, $x_{ijk}$ – со­от­вет­ст­вую­щая экс­пе­ри­мен­таль­но на­блю­дае­мая уро­жай­ность в $k$-м опы­те, а $y_{ijk}$ – её слу­чай­ная ошиб­ка, воз­ни­каю­щая из-за тех или иных слу­чай­ных при­чин.

Пусть $$c_{ij}=a_i+b_{ij}$$ и $$c_{i*}=\frac{1}{J} \sum\nolimits_jc_{ij},c_{*j}=\frac{1}{I} \sum\nolimits_ic_{ij},\\ c_{**}=\frac{1}{IJ} \sum\nolimits_{ij}c_{ij}=\frac{1}{I} \sum\nolimits_ic_{i*}=\frac{1}{J} \sum\nolimits_jc_{*j}.$$

Пусть, кро­ме то­го, $α=c_{**}, β_i=c_{i*}-c_{**}, γ_j=c_{*j}-c_{**}$ и $δ_{ij}=c_{ij}-c_{i*}-c_{*j}+c_{**}$ . Идея Д. а. ос­но­ва­на на то­ж­де­ст­вах $$c_{ij}=α+β_i+γ_j+δ_{ij},\\ i=1, …, I, j=1, …, J.$$

В при­ме­ре, свя­зан­ном со спор­тив­ны­ми со­рев­но­ва­ния­ми, функ­ция $δ_{ij}$ вы­ра­жа­ет от­но­ше­ние $j$-го су­дьи к $i$-му спорт­сме­ну (по­ло­жи­тель­ное зна­че­ние $δ_{ij}$ оз­на­ча­ет под­су­жи­ва­ние, т. е. сис­те­ма­тич. за­вы­ше­ние $j$-м судь­ёй оцен­ки мас­тер­ст­ва $i$-го спорт­сме­на, а от­ри­ца­тель­ное зна­че­ние $δ_{ij}$ – за­су­жи­ва­ние, т. е. сис­те­ма­тич. сни­же­ние оцен­ки). Ра­вен­ст­во всех $δ_{ij}$ ну­лю – обыч­ное тре­бо­ва­ние, ко­то­рое предъ­яв­ля­ют к ра­бо­те груп­пы экс­пер­тов. В слу­чае аг­ро­но­мич. опы­тов та­кое ра­вен­ст­во рас­смат­ри­ва­ет­ся как ги­по­те­за, под­ле­жа­щая про­вер­ке по ре­зуль­та­там экс­пе­ри­мен­тов. Ес­ли эта ги­по­те­за вер­на, то вы­яв­ле­ние наи­луч­ших поч­вы и об­ра­бот­ки мо­жет быть осу­ще­ст­в­ле­но раз­дель­но, что при­во­дит к су­ще­ст­вен­но­му со­кра­ще­нию чис­ла экс­пе­ри­мен­тов.

В си­туа­ции спор­тив­ных со­рев­но­ва­ний функ­ция $γ_j$ мо­жет трак­то­вать­ся как сис­те­ма­тич. ошиб­ка, до­пус­кае­мая $j$-м судь­ёй по от­но­ше­нию ко всем спорт­сме­нам, т. е. $γ_j$ – ха­рак­те­ри­сти­ка стро­го­сти или ли­бе­раль­но­сти $j$-го су­дьи. В ре­аль­ных ус­ло­ви­ях $γ_j$ мо­гут иметь не­ну­ле­вые зна­че­ния, что при­хо­дит­ся учи­ты­вать при под­ве­де­нии ито­гов экс­пер­ти­зы. Сум­ма двух ос­тав­ших­ся функ­ций $α+β_i$ за­ви­сит лишь от $i$ и по­это­му мо­жет быть ис­поль­зо­ва­на для оцен­ки мас­тер­ст­ва $i$-го спорт­сме­на. Од­на­ко сле­ду­ет учи­ты­вать, что ве­ли­чи­на $α+β_i≠a_i$ оце­ни­ва­ет не толь­ко мас­тер­ст­во $i$-го спорт­сме­на, но в той или иной ме­ре от­но­ше­ние экс­пер­тов к его мас­тер­ст­ву.

Ис­тин­ные зна­че­ния функ­ций $α, β_i, γ_j$ и $δ_{ij}$ не­из­вест­ны и вы­ра­жа­ют­ся в тер­ми­нах не­из­вест­ных функ­ций $c_{ij}$. По­это­му пер­вый этап Д. а. за­клю­ча­ет­ся в оты­ска­нии ста­ти­стич. оце­нок для $c_{ij}$ по ре­зуль­та­там на­блю­де­ний $x_{ijk}$. Не­сме­щён­ная и имею­щая ми­ни­маль­ную дис­пер­сию оцен­ка для $c_{ij}$ вы­ра­жа­ет­ся фор­му­лой $$\hat{c} _{ij}=x_{ij*}=\frac{1}{K}\sum \nolimits _kx_{ijk}.$$ Не­сме­щён­ные оцен­ки $\hatα, \hatβ_i, \hatγ_j, \hatδ_{ij}$ для функ­ций $α, β_i, γ_j, δ_{ij}$, имею­щие ми­ни­маль­ные дис­пер­сии, по­лу­ча­ют­ся в ре­зуль­та­те за­ме­ны ар­гу­мен­тов $c_{ij}$ со­от­вет­ст­вую­щи­ми оцен­ка­ми $\hat c_{ij}$.

 

На ос­но­ве этих оце­нок стро­ит­ся вто­рой этап Д. а., по­свя­щён­ный вы­яв­ле­нию влия­ния пер­во­го и вто­ро­го фак­то­ров на ре­зуль­та­ты экс­пе­ри­мен­та (в аг­ро­но­мич. опы­тах пер­вый фак­тор – сорт поч­вы, вто­рой – ме­тод об­ра­бот­ки). Ста­ти­стич. ме­то­да­ми про­ве­ря­ет­ся ги­по­те­за от­сут­ст­вия взаи­мо­дей­ст­вия фак­то­ров, ко­то­рая со­от­вет­ст­ву­ет ра­вен­ст­ву $\sum \nolimits _{ij}δ_{ij}^2=0$ а так­же ги­по­те­зы $\sum \nolimits _j\gamma_j^2=0$ и $\sum \nolimits _i\beta_i^2=0$

Даль­ней­шие эта­пы Д. а. су­ще­ст­вен­но за­ви­сят не толь­ко от ре­аль­но­го со­дер­жа­ния кон­крет­ной за­да­чи, но так­же и от ре­зуль­та­тов ста­ти­стич. про­вер­ки ги­по­тез на вто­ром эта­пе. Напр., в ус­ло­ви­ях аг­ро­но­мич. опы­тов спра­вед­ли­вость ги­по­те­зы $\sum \nolimits _{ij}δ_{ij}^2=0$ по­зво­ля­ет бо­лее эко­но­мич­но спла­ни­ро­вать даль­ней­шие экспе­ри­мен­ты (ес­ли по­ми­мо ги­по­те­зы $\sum \nolimits _{ij}δ_{ij}^2=0$ спра­вед­ли­ва так­же и ги­по­теза $\sum \nolimits _j\gamma_j^2=0$, то это оз­на­ча­ет, что урожай­ность за­ви­сит лишь от сор­та поч­вы). Спра­вед­ли­вость ги­по­те­зы $\sum \nolimits _{ij}δ_{ij}^2=0$ даёт ос­но­ва­ние для упо­ря­до­чи­ва­ния срав­ни­вае­мых объ­ек­тов (напр., спорт­сме­нов) по зна­че­ни­ям ве­ли­чин $\hatα+ \hatβ_i, i=1,...,I.$

Пер­во­на­чаль­но Д. а. был пред­ло­жен Р. Фи­ше­ром (1925) для об­ра­бот­ки ре­зуль­та­тов аг­ро­но­мич. опы­тов по вы­яв­ле­нию ус­ло­вий, при ко­то­рых ис­пы­ты­вае­мый сорт с.-х. куль­ту­ры да­ёт мак­сималь­ный уро­жай. Совр. при­ло­же­ния Д. а. ох­ва­ты­ва­ют ши­ро­кий круг за­дач эко­но­ми­ки, со­цио­ло­гии, био­ло­гии и тех­ни­ки и трак­ту­ют­ся обыч­но в тер­ми­нах ста­ти­стич. тео­рии вы­яв­ле­ния сис­те­ма­тич. раз­ли­чий ме­ж­ду ре­зуль­та­та­ми из­ме­ре­ний, вы­пол­нен­ных при тех или иных ме­няю­щих­ся ус­ло­ви­ях. См. так­же Ма­те­ма­ти­че­ская ста­ти­сти­ка.

Лит.: Хальд А. Ма­те­ма­ти­че­ская ста­ти­сти­ка с тех­ни­че­ски­ми при­ло­же­ния­ми. М., 1956; Сне­де­кор Дж. У. Ста­ти­сти­че­ские ме­то­ды в при­ме­не­нии к ис­сле­до­ва­ни­ям в сель­ском хо­зяйст­ве и био­ло­гии. М., 1961; Шеф­фе Г. Дис­пер­си­он­ный ана­лиз. 2-е изд. М., 1980.

Вернуться к началу