НЕПАРАМЕТРИ́ЧЕСКИЕ МЕ́ТОДЫ
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
Книжная версия:
Электронная версия:
НЕПАРАМЕТРИ́ЧЕСКИЕ МЕ́ТОДЫ математической статистики, методы, не предполагающие знания функционального вида теоретич. распределения. Название «Н. м.» подчёркивает их отличие от классических (параметрических) методов, в которых предполагается, что неизвестное теоретич. распределение принадлежит к.-л. семейству, зависящему от конечного числа параметров (напр., семейству нормальных распределений), и которые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять те или иные гипотезы относительно их значений.
Одним из Н. м. является критерий Колмогорова проверки согласованности теоретич. и эмпирич. распределений. Пусть взаимно независимые случайные величины X1,X2,…,Xn (выборка объёма n) имеют теоретич. функцию распределения F(x) и пусть Fn(x) – эмпирич. функция распределения, построенная по наблюдениям над этими случайными величинами (Fn является несмещённой и состоятельной оценкой для F). Пусть Dn – наибольшее по абсолютной величине значение разности Fn(x)−F(x). Случайная величина √nDn имеет, в случае непрерывности F(x), функцию распределения Kn(λ), не зависящую от F и стремящуюся при возрастании n к пределуK(λ)=∞∑j=−∞(−1)je−2j2λ2.
Отсюда при достаточно больших n для вероятности pn,λ неравенства √nDn⩾λ получается приближённое выражениеpn,λ≈1−K(λ);функция K(λ) табулирована. Её значения для некоторых λ приведены в таблице.
Таблица значений функции Κ(λ) | ||||||
λ | 0,57 | 0,71 | 0,83 | 1,02 | 1,36 | 1,63 |
Κ(λ) | 0,10 | 0,30 | 0,50 | 0,75 | 0,95 | 0,99 |
Равенство (∗) используется для проверки гипотезы о том, что теоретич. распределением является распределение с заданной непрерывной функцией распределения F(x): сначала по результатам наблюдений находят значение величины Dn, а затем по формуле (∗) вычисляют вероятность получить отклонение Fn от F, большее или равное наблюдённому. Если указанная вероятность достаточно мала, точнее – равна наперёд заданному малому положительному числу α (см. Значимости уровень), то в соответствии с общими принципами статистических гипотез проверки проверяемую гипотезу отвергают. В противном случае считают, что результаты опыта не противоречат проверяемой гипотезе. Аналогично проверяется гипотеза о том, что для двух независимых выборок объёмов n1 и n2 соответствующие (непрерывные) теоретич. функции распределения одинаковы (гипотеза однородности двух выборок). При этом вместо формулы (∗) пользуются тем, что вероятность неравенстваDn1,n2√n1n2n1+n2<λимеет пределом K(λ), где Dn1,n2 есть наибольшее по абсолютной величине значение разности Fn1(x)−Fn2(x). Приведённые примеры относятся к Н. м., основанным на разностях теоретич. и эмпирич. или двух эмпирич. функций распределения.
Значит. место в совр. математич. статистике занимают Н. м., в которых используются не сами эмпирич. функции распределения, а некоторые функции от порядковых статистик – членов вариационного ряда. Если используются порядковые номера результатов наблюдений (они называются рангами), то такие Н. м. называются ранговыми, они, как правило, являются критериями однородности. Напр., пусть X1,X2,…,Xn и Y1,Y2,…,Ym – взаимно независимые элементы двух выборок с непрерывными функциями распределения. Для проверки гипотезы о том, что эти функции распределения одинаковы, можно использовать ранговый критерий, основанный на значениях функцийW=s(r1)+s(r2)+….+s(rm),где rj – ранги случайных величин Yj,j=1,2,…,m, в общем вариационном ряду Xi и Yj, а s(1),s(2),…,s(n+m) – одна из возможных перестановок чисел 1,2,…,n+m. Выбор перестановки может быть осуществлён оптимальным образом.