Подпишитесь на наши новости
Вернуться к началу с статьи up
 

НАИМЕ́НЬШИХ КВАДРА́ТОВ МЕ́ТОД

  • рубрика

    Рубрика: Математика

  • родственные статьи
  • image description

    В книжной версии

    Том 21. Москва, 2012, стр. 699

  • image description

    Скопировать библиографическую ссылку:




Авторы: По материалам одноимённой статьи из БСЭ-3

НАИМЕ́НЬШИХ КВАДРА́ТОВ МЕ́ТОД, один из ме­то­дов оши­бок тео­рии, пред­на­зна­чен­ный для оцен­ки не­из­вест­ных ве­ли­чин по ре­зуль­та­там их из­ме­ре­ний, со­дер­жа­щим слу­чай­ные ошиб­ки. Н. к. м. при­ме­ня­ет­ся так­же для при­бли­жён­но­го пред­став­ле­ния за­дан­ной функ­ции дру­ги­ми (бо­лее про­сты­ми) функ­ция­ми. Н. к. м. пред­ло­жен К. Га­ус­сом (1794–1795) и А. Ле­жан­дром (1805–06). Пер­во­на­чаль­но Н. к. м. ис­поль­зо­вал­ся для об­ра­бот­ки ре­зуль­та­тов ас­тро­но­мич. и гео­де­зич. на­блю­де­ний. Стро­гое ма­те­ма­тич. обос­но­ва­ние и ус­та­нов­ле­ние гра­ниц при­ме­ни­мо­сти Н. к. м. да­ны А. А. Мар­ко­вым (1898) и А. Н. Кол­мо­го­ро­вым (1946).

Сущ­ность обос­но­ва­ния Н. к. м. (по Га­ус­су) за­клю­ча­ет­ся в до­пу­ще­нии, что «убы­ток» от за­ме­ны точ­но­го (не­из­вест­но­го) зна­че­ния фи­зич. ве­ли­чи­ны $μ$ её при­ближён­ным зна­че­ни­ем $X$, вы­чис­лен­ным по ре­зуль­та­там на­блю­де­ний, про­пор­цио­на­лен квад­ра­ту ошиб­ки, т. е. ве­ли­чи­не $(X-μ)^2$. В этих ус­ло­ви­ях оп­ти­маль­ной оцен­кой ес­те­ст­вен­но при­знать та­кую ли­шён­ную сис­те­ма­тич. ошиб­ки ве­ли­чи­ну $X$, для ко­то­рой ср. зна­че­ние «убыт­ка» ми­ни­маль­но. Имен­но это тре­бо­ва­ние со­став­ля­ет ос­но­ву Н. к. м. В об­щем слу­чае оты­ска­ние оп­ти­маль­ной в смыс­ле Н. к. м. оцен­ки $X$ – за­да­ча весь­ма слож­ная, по­это­му на прак­ти­ке эту за­да­чу су­жа­ют и в ка­че­ст­ве $X$ вы­би­ра­ют ли­ней­ную функ­цию от ре­зуль­та­тов на­блю­де­ний, ли­шён­ную сис­те­ма­тич. ошиб­ки, и та­кую, для ко­то­рой ср. зна­че­ние «убыт­ка» ми­ни­маль­но в клас­се всех ли­ней­ных функ­ций. Ес­ли слу­чай­ные ошиб­ки на­блю­де­ний под­чи­ня­ют­ся нор­маль­но­му рас­пре­де­ле­нию и оце­ни­вае­мая ве­ли­чи­на $μ$ за­ви­сит от ср. зна­че­ний ре­зуль­та­тов на­блю­де­ний ли­ней­но (слу­чай, весь­ма час­то встре­чаю­щий­ся в при­ло­же­ни­ях Н. к. м.), то ре­ше­ние этой за­да­чи бу­дет од­но­вре­мен­но яв­лять­ся и ре­ше­ни­ем об­щей за­да­чи. При этом оп­ти­маль­ная оцен­ка $X$ ве­ли­чи­ны $μ$ так­же под­чи­ня­ет­ся нор­маль­но­му рас­пре­де­ле­нию со ср. зна­че­ни­ем $μ$ и, сле­до­ва­тель­но, плот­ность$$p(x; μ, \sigma)=\frac{1}{\sqrt{2\pi}\sigma}\text{exp}\Bigl ( -\frac{(x-\mu)^2}{2\sigma^2}\Bigr)$$ рас­пре­де­ле­ния ве­ро­ят­но­стей слу­чай­ной ве­ли­чи­ны $X$ при $x=X$ дос­ти­га­ет мак­си­му­ма в точ­ке $μ=X$ (это свой­ст­во вы­ра­жа­ет точ­ное со­дер­жа­ние рас­про­стра­нён­но­го в тео­рии оши­бок ут­вер­жде­ния «оцен­ка $X$, вы­чис­лен­ная со­глас­но Н. к. м., – наи­бо­лее ве­ро­ят­ное зна­че­ние не­из­вест­но­го па­ра­мет­ра $μ$»). Ни­же рас­смат­ри­ва­ет­ся толь­ко слу­чай од­но­го не­из­вест­но­го.

Пусть для оцен­ки зна­че­ния не­из­вест­ной ве­ли­чи­ны $μ$ про­из­ве­де­но $n$ не­за­ви­си­мых на­блю­де­ний, дав­ших ре­зуль­та­ты $Y_1, Y_2, ..., Y_n$, т. е. $Y_1=μ+d_1, Y_2=μ+d_2, ..., Yn=μ+d_n$, где $d_1, d_2, ..., d_n$ – слу­чай­ные ошиб­ки (по оп­ре­де­ле­нию, при­ня­то­му в клас­сич. тео­рии оши­бок, слу­чай­ные ошиб­ки – не­за­ви­си­мые слу­чай­ные ве­ли­чи­ны с ну­ле­вым ма­те­ма­тич. ожи­да­ни­ем, т. е. $\mathsf{Е}δ_i=0$; ес­ли же $\mathsf{Е}δ_i≠0$, то $\mathsf{Е}δ_i$ на­зы­ва­ют­ся сис­те­ма­тич. ошиб­ка­ми). Со­глас­но Н. к. м., в ка­че­ст­ве оцен­ки ве­ли­чи­ны $μ$ при­ни­ма­ют та­кое $X$, для ко­то­ро­го бу­дет наи­мень­шей сум­ма квад­ра­тов (от­сю­да назв. ме­то­да)$$S(X)=\sum\limits_{i=1}^np_i(Y_i-X)^2,$$ где $p_i=k/σ_i^2$ и $σ_i^2=\mathsf{D}δ_i=\mathsf{Е}δ_i^2$ (ко­эф. $k{>}0$ мож­но вы­би­рать про­из­воль­но). Ве­ли­чи­ну $p_i$ на­зы­ва­ют ве­сом, a $σ_i$ – квад­ра­тич­ным от­кло­не­ни­ем из­ме­ре­ния с но­ме­ром $i$. В ча­ст­но­сти, ес­ли все из­ме­ре­ния рав­но­точ­ны, то $σ_1=σ_2=...=σ_n$, и в этом слу­чае мож­но по­ло­жить $p_1=p_2=...=p_n=1$; ес­ли же ка­ж­дое $Y_i$ – ариф­ме­тич. сред­нее из $n_i$ рав­но­точ­ных из­ме­ре­ний, то по­ла­га­ют $p_i=n_i$.

Сум­ма $S(X)$ бу­дет наи­мень­шей, ес­ли в ка­че­ст­ве $X$ вы­брать взве­шен­ное сред­нее: $$X=\overline{Y}=\frac1P\sum p_iY_i,$$

X=Y¯¯¯¯=1PpiYi,

где $P=\sum p_i$. Оцен­ка $\overline Y$ ве­ли­чи­ны $μ$ ли­ше­на сис­те­ма­тич. ошиб­ки, име­ет вес $P$ и дис­пер­сию $\mathsf{D}\overline Y=k/P$. В ча­ст­но­сти, ес­ли все из­ме­ре­ния рав­но­точ­ны, то $\overline Y$ – ариф­ме­тич. сред­нее ре­зуль­та­тов из­ме­ре­ний, т. е. $$\overline Y=\frac1n\sum Y_i$$

Y¯¯¯¯=1nYi

и $\mathsf D \overline Y=σ^2/n$. При не­ко­то­рых об­щих пред­по­ло­же­ни­ях мож­но по­ка­зать, что ес­ли ко­ли­че­ст­во на­блю­де­ний $n$ дос­та­точ­но ве­ли­ко, то рас­пре­де­ле­ние оцен­ки $\overline Y$ ма­ло от­ли­ча­ет­ся от нор­маль­но­го с ма­те­ма­тич. ожи­да­ни­ем $μ$ и дис­пер­си­ей $k/P$. В этом слу­чае аб­со­лют­ная по­греш­ность при­бли­жён­но­го ра­вен­ст­ва $\mu \approx \overline Y$ мень­ше с ве­ро­ят­но­стью, близ­кой к зна­че­нию ин­те­гра­ла$$I(t)=\frac2{\sqrt{2\pi}}\int\limits_0^1e^{-u^2/2}du \qquad (1)$$ [напр., $I$(1,96)=0,950; $I$(2,58)=0,990; $I$(3,00)=0,997].

 

 

Ес­ли ве­са из­ме­ре­ний $p_i$ за­да­ны, а мно­жи­тель $k$ до на­блю­де­ний ос­та­ёт­ся не­оп­ре­де­лён­ным, то этот мно­жи­тель и дис­пер­сия оцен­ки $\overline Y$ мо­гут быть при­бли­жён­но оце­не­ны по фор­му­лам: $k≈S(\overline Y)/(n-1)$ и $\mathsf D \overline Y =k/P≈s^2=S(\overline Y)/[(n-1)P]$ (обе оцен­ки ли­ше­ны сис­те­ма­тич. оши­бок).

В том прак­ти­че­ски важ­ном слу­чае, ко­гда ошиб­ки $δ_i$ под­чи­ня­ют­ся нор­маль­но­му рас­пре­де­ле­нию, мож­но най­ти точ­ное зна­че­ние ве­ро­ят­но­сти, с ко­то­рой аб­со­лют­ная по­греш­ность при­бли­жён­но­го ра­вен­ст­ва $μ≈\overline Y$ ока­жет­ся мень­ше $ts$ ($t$ – про­из­воль­ное по­ло­жи­тель­ное чис­ло). Эту ве­ро­ят­ность, как функ­цию от $t$, на­зы­ва­ют функ­ци­ей рас­пре­де­ле­ния Стью­ден­та с $n-1$ сте­пе­ня­ми сво­бо­ды и вы­чис­ля­ют по фор­му­ле $$I_{n-1}(t)=C_{n-1}\int\limits_0^1 \left ( 1+\frac{v^2}{n-1} \right )^{-n/2}dv, \qquad (2)$$ где по­сто­ян­ная $C_{n–1}$ вы­бра­на та­ким обра­зом, что­бы вы­пол­ня­лось ус­ло­вие $I_{n–1}(∞ )= 1$. При боль­ших $n$ фор­му­лу (2) мож­но за­ме­нить фор­му­лой (1). Од­на­ко при­ме­не­ние фор­му­лы (1) при не­боль­ших $n$ при­ве­ло бы к гру­бым ошиб­кам. Так, напр., со­глас­но (1), зна­че­нию $I$= 0,99 со­от­вет­ст­ву­ет $t$ = 2,58; ис­тин­ные зна­че­ния $t$, оп­ре­де­ляе­мые при ма­лых $n$ как ре­ше­ния со­от­вет­ст­вую­щих урав­не­ний $I_{n–1}(t)$=0,99, при­ве­де­ны в таб­ли­це:

$n$23451020
$t$63,669,925,844,603,252,86
 

При­мер. Для оп­ре­де­ле­ния мас­сы не­ко­то­ро­го те­ла про­из­ве­де­но 10 не­за­ви­си­мых рав­но­точ­ных взве­ши­ва­ний, дав­ших ре­зуль­та­ты $Y_i$ (в г):

$Y_i$18,4118,4218,4318,4418,4518,46
$n_i$133111

(здесь $n_i$ – чис­ло слу­ча­ев, в ко­то­рых на­блю­дал­ся вес $Y_i$, при­чём $n=Σn_i=10$). Т. к. все взве­ши­ва­ния рав­но­точ­ные, то сле­ду­ет по­ло­жить $p_i=n_i$ и в ка­че­ст­ве оцен­ки для не­из­вест­но­го ве­са $m$ вы­брать ве­ли­чи­ну $\overline Y=Σn_iY_i/Σn_i=18,431$. За­да­вая, напр., $I_9=0,95$, по таб­ли­цам рас­пре­де­ле­ния Стью­ден­та с де­вя­тью сте­пе­ня­ми сво­бо­ды мож­но най­ти, что $t=2,262$, и по­это­му в ка­че­ст­ве пре­дель­ной аб­со­лют­ной по­греш­но­сти при­бли­жён­но­го ра­вен­ст­ва $μ≈18,431$ сле­ду­ет при­нять ве­ли­чину $ts=t\sqrt{Σn_i(Y_i-\overline Y)/90}=2,262\cdotp0,0048 = 0,011$. Т. о., $18,420{<}μ{<}18,442$.

Лит.: Мар­ков А. А. Ис­чис­ле­ние ве­ро­ят­но­стей. 4-е изд. М., 1924; Кол­мо­го­ров А. Н. К обос­но­ва­нию ме­то­да наи­мень­ших квад­ра­тов // Ус­пе­хи ма­те­ма­ти­че­ских на­ук. 1946. Т. 1. Вып. 1; Лин­ник Ю. В. Ме­тод наи­мень­ших квад­ра­тов и ос­но­вы ма­те­ма­ти­ко-ста­ти­сти­че­ской тео­рии об­ра­бот­ки на­блю­де­ний. 2-е изд. М., 1962; Ив­чен­ко Г. И., Мед­ве­дев Ю. И. Вве­де­ние в ма­те­ма­ти­че­скую ста­ти­сти­ку. М., 2009.

Вернуться к началу