СТАТИСТИ́ЧЕСКАЯ ОЦЕ́НКА
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
СТАТИСТИ́ЧЕСКАЯ ОЦЕ́НКА, функция от результатов наблюдений, предназначенная для оценивания неизвестных параметров распределения вероятностей. Напр., если результаты наблюдений $X_1$, $...$, $X_n$ – независимые случайные величины, имеющие одно и то же нормальное распределение с неизвестным математич. ожиданием $θ$, то выборочное среднее – среднее арифметическое результатов наблюдений – $$\overline X = \frac{X_1+...+X_n}{n}$$и выборочная медиана $μ_n=μ_n (X_1, ..., X_n)$ являются С. о. неизвестного параметра $θ$. С. о., дающие числовые приближения неизвестного числа, называются точечными, только они и рассматриваются в дальнейшем. О других С. о. см. в ст. Доверительный интервал.
В качестве С. о. к.-л. параметра распределения вероятностей естественно выбирать такую функцию $θ_n^*=θ_n^*(X_1, ..., X_n)$ от результатов наблюдений, которая в некотором смысле близка к истинному значению параметра. Применяя к.-л. меру близости, можно сравнивать различные С. о. Обычно мерой близости С. о. к истинному значению параметра служит величина среднего значения квадрата ошибки $$\mathsf{E}_θ(θ_n^*-θ)^2=\mathsf{D}_θ θ_n^*+(θ-\mathsf{E}_θ θ_n^*)^2,$$выражающаяся через математич. ожидание оценки $\mathsf{E}_θθ_n^*$ и её дисперсию $\mathsf{D}_θθ_n^*$, вычисленные по распределению, зависящему от неизвестного значения $θ$. В классе всех несмещённых оценок наилучшими с этой точки зрения будут С. о., имеющие при заданном $n$ минимальную возможную дисперсию при всех $θ$, такие С. о. называются эффективными. Указанная выше С. о. $\overline X_n$ для параметра $θ$ нормального распределения является наилучшей несмещённой оценкой, поскольку дисперсия любой другой несмещённой оценки будет больше $\mathsf{D}_θ \overline X_n=σ^2/n$, где $σ^2$ – дисперсия исходного нормального распределения (см. также Рао – Крамера неравенство). В конкретных случаях отыскание наилучших оценок облегчается с помощью достаточных статистик, т. к. наилучшую несмещённую оценку нужно искать в классе С. о., зависящих только от достаточных статистик.
Имея в виду построение С. о. для больших значений $n$, изучают также асимптотич. свойства оценок. Естественно, напр., предполагать, что вероятность отклонений $θ_n^*$ от истинного значения параметра $θ$, превосходящих любое наперёд заданное число, будет стремиться к нулю при $n→∞$. С. о. с таким свойством называются состоятельными оценками. Несмещённая С. о., дисперсия которой стремится к нулю при $n→∞$, является состоятельной. Асимптотич. сравнение С. о. производят по отношению их асимптотич. дисперсий. Так, среднее арифметическое $\overline X_n$ в приведённом выше примере – наилучшая и, следовательно, асимптотически наилучшая С. о. для параметра $θ$, тогда как выборочная медиана $μ_n$, являющаяся также несмещённой оценкой, не является асимптотически наилучшей, т. к. предел отношения $\mathsf{D}_θ \overline X_n$ к $\mathsf{D}_θμ_n$ при $n→∞$ равен $2/π < 1$. Тем не менее использование $μ_n$ имеет свои положительные стороны; напр., если истинное распределение не является в точности нормальным и при этом для него по-прежнему математич. ожидание совпадает с медианой, то дисперсия $\overline X_n$ может сильно возрасти, а дисперсия $μ_n$ останется почти той же, т. е. $μ_n$ обладает свойством, называемым робастностью.
Один из распространённых общих методов получения С. о. параметров распределения – максимального правдоподобия метод.
См. также Непараметрические методы математической статистики.