Если возможно выдвинуть несколько взаимоисключающих «гипотез» о распределении элементов выборки, то возникает задача выбора одной из этих гипотез на основании выборочных данных. Как правило, по выборке конечного объема безошибочных выводов о распределении сделано быть не может, поэтому приходится считаться с возможностью выбрать неверную гипотезу.
Пусть дана выборка из распределения
. Если не оговорено противное, считается,
что все наблюдения имеют одно и то же распределение.
В ряде случаев это предположение также нуждается в проверке
(см., например, ниже: гипотеза об однородности или гипотеза о случайности)
в таких случаях одинаковая распределенность наблюдений не предполагается.
То же касается и независимости наблюдений.
Гипотезой
() называется любое предположение о распределении наблюдений:
Гипотеза называется простой, если она однозначно определяет
распределение, т.е.
.
Иначе
называется сложной
гипотезой. Сложная гипотеза предполагает, что распределение
одно из некоторого множества распределений
.
Если гипотез всего две, то одну из них принято называть основной, а другую альтернативой или отклонением от основной гипотезы.
Например,
,
.
Еще вариант: дана выборка из семейства распределений , где
. Простая
гипотеза
. Сложная односторонняя альтернатива
. Случай
исключен априори.
Например, гипотеза о нормальности
,
.
из распределения
,
,
из распределения
.
Проверяется гипотеза
сложная гипотеза против (сложной)
альтернативы
.
По выборке из
независимых наблюдений над парой
проверяется гипотеза
сложная гипотеза против (сложной)
альтернативы
.
Эту задачу ставят, например, если требуется проверить качество датчика случайных чисел.
Если имеются гипотезы ,
,
, то критерием
(нерандомизированным критерием)
называется отображение
О рандомизированных критериях, которые предписывают принимать каждую гипотезу с некоторой (зависящей от выборки) вероятностью, мы поговорим позднее.
Для заданного критерия
будем говорить, что произошла ошибка
-го рода, если
гипотеза
отвергнута критерием, в то время как она верна.
Вероятностью ошибки
-го рода критерия
называется
Говоря « верна» и вычисляя
,
мы имеем в виду, что распределение выборки именно
такое, как предполагает гипотеза
, и вычисляем вероятность в соответствии
с этим распределением. Если гипотеза
простая, т.е. указывает
ровно на одно возможное распределение выборки, то
число. Если же
сложная гипотеза, то
будет зависеть от того, при
каком именно из распределений
, отвечающих
, вычисляется вероятность:
Пусть любое изделие некоторого производства оказывается браком
с вероятностью . Контроль продукции допускает ошибки:
годное изделие бракует с вероятностью
, а бракованное пропускает (признает годным) с вероятностью
.
Если ввести для наудачу взятого изделия две гипотезы:
и
, и критерием выбора считать контроль продукции, то
есть вероятность ошибки первого рода, а
вероятность ошибки второго рода данного критерия:
Надеемся, что читатель сделал для себя следующие выводы:
N.I.Chernova