ДИСПЕРСИО́ННЫЙ АНА́ЛИЗ
-
Рубрика: Математика
-
-
Скопировать библиографическую ссылку:
Книжная версия:
Электронная версия:
ДИСПЕРСИО́ННЫЙ АНА́ЛИЗ в математике, статистич. метод, предназначенный для выявления влияния отдельных факторов на результат эксперимента, а также для последующего планирования экспериментов.
Если значения неизвестных постоянных a1,…,aI могут быть измерены с помощью разл. методов или измерительных средств M1,…,MJ и в каждом случае т. н. систематич. ошибка bij может, вообще говоря, зависеть как от выбранного метода Mj, так и от неизвестного измеряемого значения ai, то результаты таких измерений представляют собой суммы видаxijk=ai+bij+yijk,i=1,...,I,j=1,...,J,k=1,...,K, где K – число независимых измерений неизвестной величины ai методом Mj, а yijk – случайная ошибка k-го измерения величины ai методом Mj. При этом предполагается, что все yijk – независимые одинаково распределённые случайные величины, имеющие нулевое математич. ожидание. Такая линейная модель называется двухфакторной схемой Д. а.; первый фактор – истинное значение измеряемой величины, второй – метод измерения, причём в данном случае для каждой возможной комбинации значений первого и второго факторов осуществляется одинаковое число K независимых измерений (в более сложных моделях Д. а. от последнего предположения иногда отказываются).
Напр., пусть в соревнованиях участвуют I спортсменов, мастерство которых оценивается J судьями, причём каждый участник соревнований выступает K раз (имеет K попыток). В этом случае ai – истинное значение показателя мастерства спортсмена с номером i, bij – систематич. ошибка, вносимая в оценку мастерства i-го спортсмена судьёй с номером j, xijk – оценка, выставленная j-м судьёй i-му спортсмену за k-ю попытку, а yijk – случайная погрешность. Подобная схема типична для т. н. субъективной экспертизы качества нескольких объектов, осуществляемой группой экспертов. Др. пример – статистич. исследование урожайности с.-х. культуры в зависимости от одного из I сортов почвы и J методов её обработки, причём для каждого сорта почвы i и каждого метода обработки с номером j осуществляется K независимых экспериментов. В этом примере можно считать, что величины ai равны нулю, bij – истинное значение урожайности для i-го сорта почвы при j-м методе обработки, xijk – соответствующая экспериментально наблюдаемая урожайность в k-м опыте, а yijk – её случайная ошибка, возникающая из-за тех или иных случайных причин.
Пусть cij=ai+bij и ci∗=1J∑jcij,c∗j=1I∑icij,c∗∗=1IJ∑ijcij=1I∑ici∗=1J∑jc∗j.
Пусть, кроме того, α=c_{**}, β_i=c_{i*}-c_{**}, γ_j=c_{*j}-c_{**} и δ_{ij}=c_{ij}-c_{i*}-c_{*j}+c_{**} . Идея Д. а. основана на тождествах c_{ij}=α+β_i+γ_j+δ_{ij},\\ i=1, …, I, j=1, …, J.
В примере, связанном со спортивными соревнованиями, функция δ_{ij} выражает отношение j-го судьи к i-му спортсмену (положительное значение δ_{ij} означает подсуживание, т. е. систематич. завышение j-м судьёй оценки мастерства i-го спортсмена, а отрицательное значение δ_{ij} – засуживание, т. е. систематич. снижение оценки). Равенство всех δ_{ij} нулю – обычное требование, которое предъявляют к работе группы экспертов. В случае агрономич. опытов такое равенство рассматривается как гипотеза, подлежащая проверке по результатам экспериментов. Если эта гипотеза верна, то выявление наилучших почвы и обработки может быть осуществлено раздельно, что приводит к существенному сокращению числа экспериментов.
В ситуации спортивных соревнований функция γ_j может трактоваться как систематич. ошибка, допускаемая j-м судьёй по отношению ко всем спортсменам, т. е. γ_j – характеристика строгости или либеральности j-го судьи. В реальных условиях γ_j могут иметь ненулевые значения, что приходится учитывать при подведении итогов экспертизы. Сумма двух оставшихся функций α+β_i зависит лишь от i и поэтому может быть использована для оценки мастерства i-го спортсмена. Однако следует учитывать, что величина α+β_i≠a_i оценивает не только мастерство i-го спортсмена, но в той или иной мере отношение экспертов к его мастерству.
Истинные значения функций α, β_i, γ_j и δ_{ij} неизвестны и выражаются в терминах неизвестных функций c_{ij}. Поэтому первый этап Д. а. заключается в отыскании статистич. оценок для c_{ij} по результатам наблюдений x_{ijk}. Несмещённая и имеющая минимальную дисперсию оценка для c_{ij} выражается формулой \hat{c} _{ij}=x_{ij*}=\frac{1}{K}\sum \nolimits _kx_{ijk}. Несмещённые оценки \hatα, \hatβ_i, \hatγ_j, \hatδ_{ij} для функций α, β_i, γ_j, δ_{ij}, имеющие минимальные дисперсии, получаются в результате замены аргументов c_{ij} соответствующими оценками \hat c_{ij}.
На основе этих оценок строится второй этап Д. а., посвящённый выявлению влияния первого и второго факторов на результаты эксперимента (в агрономич. опытах первый фактор – сорт почвы, второй – метод обработки). Статистич. методами проверяется гипотеза отсутствия взаимодействия факторов, которая соответствует равенству \sum \nolimits _{ij}δ_{ij}^2=0 а также гипотезы \sum \nolimits _j\gamma_j^2=0 и \sum \nolimits _i\beta_i^2=0
Дальнейшие этапы Д. а. существенно зависят не только от реального содержания конкретной задачи, но также и от результатов статистич. проверки гипотез на втором этапе. Напр., в условиях агрономич. опытов справедливость гипотезы \sum \nolimits _{ij}δ_{ij}^2=0 позволяет более экономично спланировать дальнейшие эксперименты (если помимо гипотезы \sum \nolimits _{ij}δ_{ij}^2=0 справедлива также и гипотеза \sum \nolimits _j\gamma_j^2=0, то это означает, что урожайность зависит лишь от сорта почвы). Справедливость гипотезы \sum \nolimits _{ij}δ_{ij}^2=0 даёт основание для упорядочивания сравниваемых объектов (напр., спортсменов) по значениям величин \hatα+ \hatβ_i, i=1,...,I.
Первоначально Д. а. был предложен Р. Фишером (1925) для обработки результатов агрономич. опытов по выявлению условий, при которых испытываемый сорт с.-х. культуры даёт максимальный урожай. Совр. приложения Д. а. охватывают широкий круг задач экономики, социологии, биологии и техники и трактуются обычно в терминах статистич. теории выявления систематич. различий между результатами измерений, выполненных при тех или иных меняющихся условиях. См. также Математическая статистика.