МА́ЛЫЕ ВЫ́БОРКИ
-
Рубрика: Математика
-
Скопировать библиографическую ссылку:
МА́ЛЫЕ ВЫ́БОРКИ, статистич. выборки малого объёма $n$ такие, что к ним нельзя применять формулы, справедливые лишь при $n→∞$. Особенности статистич. оценивания параметров по М. в. можно понять на примере нормального распределения (с параметрами $a$ и $σ^2$), для которого малыми обычно считают выборки объёма $n\leqslant 30$. Пусть по выборке $X_1, X_2, ..., X_n$ из нормальной совокупности необходимо оценить её среднее значение $a$, причём дисперсия $σ^2$ неизвестна. Для этого вводятся статистики (функции от результатов наблюдений) $$\overline X=\frac{1}{n}\sum^n_{k=1}X_k,\\ s^2=\frac{1}{n-1}\sum^n_{k=1}(X_k-\overline X)^2$$
При больших $n$ формула (2), связывающая $ω$ и $t_ω$, может быть заменена приближённой формулой$$ω=\int_{-t_ω}^{t_ω}\frac{1}{\sqrt{2π}}e^{-t^2/2}dt,\tag3$$где подынтегральное выражение есть плотность стандартного нормального распределения, которое является предельным при $n→∞$ для упомянутых распределений Стьюдента. Эту формулу иногда неправильно применяют для определения $t_ω$ при небольших $n$, что приводит к существенным ошибкам. Так, для $ω=0,99$ из формулы (3) следует, что $t_{0,99}=2,58$; истинные значения $t_{0,99}$ для малых $n$ приведены в следующей таблице:
$n$ | 2 | 3 | 4 | 5 | 10 | 20 | 30 |
$t_{0,99}$ | 63,66 | 9,92 | 5,84 | 4,6 | 3,25 | 2,86 | 2,76 |
Если пользоваться формулой (3) при $n=5$, то получится, что неравенство$$\left| \overline X-a\right|\leqslant 2,58\frac{s}{\sqrt5}$$выполняется с вероятностью 0,99. В действительности при $n=5$ вероятность этого неравенства равна 0,94, а вероятность 0,99 имеет, в соответствии с приведённой таблицей, неравенство $$\left| \overline X-a\right|\leqslant 4,60\frac{s}{\sqrt5}.$$
Об оценке теоретич. дисперсии $σ^2$ по М. в. см. Хи-квадрат распределение. Разработаны также методы оценки по М. в. параметров многомерных распределений (напр., коэффициента корреляции).