Если возможно выдвинуть несколько взаимоисключающих «гипотез» о распределении элементов выборки, то возникает задача выбора одной из этих гипотез на основании выборочных данных. Как правило, по выборке конечного объема безошибочных выводов о распределении сделано быть не может, поэтому приходится считаться с возможностью выбрать неверную гипотезу.
Пусть дана выборка из распределения . Если не оговорено противное, считается, что все наблюдения имеют одно и то же распределение. В ряде случаев это предположение также нуждается в проверке (см., например, ниже: гипотеза об однородности или гипотеза о случайности) в таких случаях одинаковая распределенность наблюдений не предполагается. То же касается и независимости наблюдений.
Гипотезой () называется любое предположение о распределении наблюдений:
Гипотеза называется простой, если она однозначно определяет распределение, т.е. . Иначе называется сложной гипотезой. Сложная гипотеза предполагает, что распределение одно из некоторого множества распределений .
Если гипотез всего две, то одну из них принято называть основной, а другую альтернативой или отклонением от основной гипотезы.
Например, , .
Еще вариант: дана выборка из семейства распределений , где . Простая гипотеза . Сложная односторонняя альтернатива . Случай исключен априори.
Например, гипотеза о нормальности , .
из распределения , , из распределения . Проверяется гипотеза сложная гипотеза против (сложной) альтернативы .
По выборке из независимых наблюдений над парой проверяется гипотеза сложная гипотеза против (сложной) альтернативы .
Эту задачу ставят, например, если требуется проверить качество датчика случайных чисел.
Если имеются гипотезы , , , то критерием (нерандомизированным критерием) называется отображение
О рандомизированных критериях, которые предписывают принимать каждую гипотезу с некоторой (зависящей от выборки) вероятностью, мы поговорим позднее.
Для заданного критерия будем говорить, что произошла ошибка -го рода, если гипотеза отвергнута критерием, в то время как она верна. Вероятностью ошибки -го рода критерия называется
Говоря « верна» и вычисляя , мы имеем в виду, что распределение выборки именно такое, как предполагает гипотеза , и вычисляем вероятность в соответствии с этим распределением. Если гипотеза простая, т.е. указывает ровно на одно возможное распределение выборки, то число. Если же сложная гипотеза, то будет зависеть от того, при каком именно из распределений , отвечающих , вычисляется вероятность:
Пусть любое изделие некоторого производства оказывается браком с вероятностью . Контроль продукции допускает ошибки: годное изделие бракует с вероятностью , а бракованное пропускает (признает годным) с вероятностью .
Если ввести для наудачу взятого изделия две гипотезы: и , и критерием выбора считать контроль продукции, то есть вероятность ошибки первого рода, а вероятность ошибки второго рода данного критерия:
Надеемся, что читатель сделал для себя следующие выводы:
N.I.Chernova