МА́ЛЫЕ ВЫ́БОРКИ
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
Книжная версия:
Электронная версия:
МА́ЛЫЕ ВЫ́БОРКИ, статистич. выборки малого объёма n такие, что к ним нельзя применять формулы, справедливые лишь при n→∞. Особенности статистич. оценивания параметров по М. в. можно понять на примере нормального распределения (с параметрами a и σ2), для которого малыми обычно считают выборки объёма n⩽30. Пусть по выборке X1,X2,...,Xn из нормальной совокупности необходимо оценить её среднее значение a, причём дисперсия σ2 неизвестна. Для этого вводятся статистики (функции от результатов наблюдений) ¯X=1nn∑k=1Xk,s2=1n−1n∑k=1(Xk−¯X)2
При больших n формула (2), связывающая ω и t_ω, может быть заменена приближённой формулойω=\int_{-t_ω}^{t_ω}\frac{1}{\sqrt{2π}}e^{-t^2/2}dt,\tag3где подынтегральное выражение есть плотность стандартного нормального распределения, которое является предельным при n→∞ для упомянутых распределений Стьюдента. Эту формулу иногда неправильно применяют для определения t_ω при небольших n, что приводит к существенным ошибкам. Так, для ω=0,99 из формулы (3) следует, что t_{0,99}=2,58; истинные значения t_{0,99} для малых n приведены в следующей таблице:
n | 2 | 3 | 4 | 5 | 10 | 20 | 30 |
t_{0,99} | 63,66 | 9,92 | 5,84 | 4,6 | 3,25 | 2,86 | 2,76 |
Если пользоваться формулой (3) при n=5, то получится, что неравенство\left| \overline X-a\right|\leqslant 2,58\frac{s}{\sqrt5}выполняется с вероятностью 0,99. В действительности при n=5 вероятность этого неравенства равна 0,94, а вероятность 0,99 имеет, в соответствии с приведённой таблицей, неравенство \left| \overline X-a\right|\leqslant 4,60\frac{s}{\sqrt5}.
Об оценке теоретич. дисперсии σ^2 по М. в. см. Хи-квадрат распределение. Разработаны также методы оценки по М. в. параметров многомерных распределений (напр., коэффициента корреляции).