Следующее замечательное утверждение, по недоразумению называемое леммой, заявляет, что оптимальные во всех трех смыслах (минимаксные, байесовские, наиболее мощные) критерии могут быть построены в самом общем случае простым выбором различных констант в одном и том же критерии критерии отношения правдоподобия.
Пусть выборка (набор независимых, одинаково
распределенных величин), и имеются две гипотезы о распределении
:
Пусть плотность распределения
,
плотность распределения
, а
соответствующие функции правдоподобия.
Если одно из распределений дискретно, а другое абсолютно непрерывно,
то всегда существует критерий с нулевыми вероятностями ошибок.
Смешанные распределения мы рассматривать не будем. Математики вместо этого
могут предполагать, что оба распределения абсолютно непрерывны относительно одной
и той же -конечной меры и имеют относительно нее плотности
и
.
Мы будем выбирать гипотезу в зависимости от отношения функций правдоподобия. Напомним, что функция правдоподобия есть плотность распределения выборки.
Обратимся к примеру 30. Естественным кажется принимать вторую гипотезу,
если лежит правее точки пересечения плотностей
. То есть
там, где вторая плотность больше, принимать вторую гипотезу, там, где первая первую.
Такой критерий сравнивает отношение
с единицей, относя к критической области
ту часть
, где это отношение больше единицы. Заметим, что
при этом мы получим ровно один, не обязательно оптимальный, критерий
с некоторым фиксированным размером и мощностью.
Если же нужно получить критерий c заранее заданным размером
, либо иметь возможность варьировать и размер,
и мощность критерия, то следует рассмотреть класс похожих критериев, введя
свободный параметр:
там, где вторая плотность в раз превосходит первую, выбирать вторую
гипотезу, иначе первую,
т.е. сравнивать отношение
плотностей не с единицей, а с некоторой
постоянной
.
Назовем отношением правдоподобия частное
![]() | (18) |
Конструкция критерия, который мы живописали выше, сильно усложнится
в случае, когда распределение случайной величины
не является непрерывным, т.е. существует такое число
, что вероятность
отлична от нуля. Это означает, что
на некотором «большом» множестве значений выборки обе гипотезы
«равноправны»: отношение правдоподобия постоянно. Относя это множество
целиком к критическому множеству или целиком исключая из него, мы
меняем вероятность ошибки первого рода (размер) критерия
на положительную величину
:
И если вдруг мы захотим приравнять
вероятность ошибки первого рода к заранее выбранному числу , может случиться так, что критерий с критическим множеством
имеет размер больший, чем
, а критерий с критическим множеством
размер меньший, чем
.
Поэтому для математиков, не читающих [1],
мы сформулируем замечательно мощное утверждение мелким шрифтом,
зато в общем случае.
Затем для почти математиков сформулируем и докажем частный, но
наиболее частый случай, когда отношение правдоподобия
имеет при верной первой гипотезе
непрерывную функцию распределения, т.е.
для любого
.
Функция , принимающая значения
в интервале
в зависимости от значений выборки,
называется рандомизированным критерием.
Значение этой функции
трактуют как вероятность принять вторую (так удобнее) гипотезу
в некотором дополнительном эксперименте. Т.е., получив значение
, мы должны дополнительно провести испытание
с вероятностью успеха
, и в случае успеха принять
,
в случае неудачи
.
Значение предписывает
принять вторую гипотезу (с вероятностью 1, т.е. обязательно), а
значение
предписывает не принимать вторую гипотезу,
а принять первую.
Напомним, что есть отношение правдоподобия, которое
мы ввели в (18).
Размер и мощность КОП вычисляются по формуле полной вероятности. Размер равен
Мощность равна
Вероятность ошибки второго рода можно найти и иначе:
Существуют постоянные и
, при которых
критерий отношения правдоподобия является
Мы не ограничиваем значения областью
. Возможность брать
(меньше бессмысленно, ибо
) избавляет от ограничения
на возможный размер НМК. Это довольно сомнительное обобщение ведь
уже критерий
имеет единичную мощность
при размере равном
. Можно увеличивать размер
и дальше, но мощности расти уже некуда. Такой НМК будет
принимать с положительной вероятностью гипотезу
там, где она верна
быть не может в области
.
Всюду далее предполагается, что
Функция ![]() ![]() ![]() |
(19) |
Функция есть просто хвост функции распределения
случайной величины
:
Ее непрерывность означает, что
величина равна нулю для любого
. Это предположение избавляет нас от необходимости рассматривать рандомизированные
критерии. Итак,
Размер и вероятность ошибки второго рода этого критерия равны соответственно
Пусть
выполнено (19). Тогда существует постоянная , при которой
критерий отношения правдоподобия является
Доказательство. Доказать достаточно два утверждения: существование постоянной ,
удовлетворяющей первому и третьему пунктам леммы, и оптимальность соответствующего
критерия. Начнем с третьего пункта.
Итак, непрерывно меняется от
до , поэтому
для любого
существует
такое,
что
.
Функция , в отличие от
, не убывает по
. К тому же при
величина
стремится к
. Она тоже, подобно
, при
непрерывна по
из-за предположения (19):
Поэтому функции и
пересекаются
хотя бы однажды.
Действительно,
Но на множестве подынтегральная
функция
совпадает с
. И на
множестве
подынтегральная
функция
тоже совпадает с
. Продолжая
цепочку равенств, получим
Q.D.E.
Пусть любой другой критерий. Лемма 3 влечет странное
следствие:
Каково бы ни было , вероятности ошибок любого критерия
связаны с вероятностями ошибок КОП
неравенством
![]() | (20) |
Доказательство.
Рассматривая для краткости нерандомизированный критерий ,
получим
Q.D.E.
I. Пусть таково, что
.
Тогда правая часть неравенства (20) равна
, и
для любого иного критерия
Итак, , т.е.
минимаксный.
II. Пусть и
.
Тогда для любого иного критерия
неравенство (20) превращается в определение байесовского критерия:
Если же , то
. Тогда
КОП имеет нулевой размер и автоматически является байесовским.
III. Пусть таково, что
. Любой иной критерий
из класса
имеет размер
. Используя в неравенстве (20)
оба этих размера, получим
Итак, , т.е.
НМК в классе
.
Q.D.E.
Имеется выборка ,
,
из нормального распределения
со средним
и единичной дисперсией.
Построим минимаксный, байесовский для
,
и наиболее мощный
размера
критерии
для проверки гипотезы
против
альтернативы
, где
.
Отношение правдоподобия
имеет абсолютно непрерывное распределение при любой из гипотез, поэтому
критерий отношения правдоподобия 28
будет нерандомизированным, и достаточно описать только его критическую область
.
Она определяется неравенством
![]() | (21) |
Критерий будет байесовским при .
Упростим неравенство (21). Получим
Например, при и
критическая область имеет вид
.
Чтобы построить минимаксный и наиболее мощный критерии, запишем
неравенство (21) в эквивалентном виде
, и искать будем
, а не
. Размер и вероятность ошибки второго рода равны соответственно
При получим минимаксный критерий. Пользуясь
свойствами функции распределения стандартного нормального закона, запишем
откуда и
. Минимаксный критерий имеет вид
Имеется выборка ,
,
из нормального распределения
со средним и дисперсией
,
.
Построим наиболее мощный критерий размера
для проверки гипотезы
против
альтернативы
, где
.
Отношение правдоподобия снова
имеет абсолютно непрерывное распределение при любой из гипотез, поэтому
критерий отношения правдоподобия из определения 28
будет нерандомизированным. Его критическая область
определяется неравенством
что эквивалентно неравенству . Найдем
, при котором размер критерия равен
:
Отсюда , где
квантиль
-распределения с
степенями свободы уровня
. Тогда
и НМК
размера
имеет вид