Следующее замечательное утверждение, по недоразумению называемое леммой, заявляет, что оптимальные во всех трех смыслах (минимаксные, байесовские, наиболее мощные) критерии могут быть построены в самом общем случае простым выбором различных констант в одном и том же критерии критерии отношения правдоподобия.
Пусть выборка (набор независимых, одинаково распределенных величин), и имеются две гипотезы о распределении :
Пусть плотность распределения , плотность распределения , а
соответствующие функции правдоподобия.
Если одно из распределений дискретно, а другое абсолютно непрерывно, то всегда существует критерий с нулевыми вероятностями ошибок. Смешанные распределения мы рассматривать не будем. Математики вместо этого могут предполагать, что оба распределения абсолютно непрерывны относительно одной и той же -конечной меры и имеют относительно нее плотности и .
Мы будем выбирать гипотезу в зависимости от отношения функций правдоподобия. Напомним, что функция правдоподобия есть плотность распределения выборки.
Обратимся к примеру 30. Естественным кажется принимать вторую гипотезу, если лежит правее точки пересечения плотностей . То есть
там, где вторая плотность больше, принимать вторую гипотезу, там, где первая первую.
Такой критерий сравнивает отношение с единицей, относя к критической области ту часть , где это отношение больше единицы. Заметим, что при этом мы получим ровно один, не обязательно оптимальный, критерий с некоторым фиксированным размером и мощностью.
Если же нужно получить критерий c заранее заданным размером , либо иметь возможность варьировать и размер, и мощность критерия, то следует рассмотреть класс похожих критериев, введя свободный параметр:
там, где вторая плотность в раз превосходит первую, выбирать вторую гипотезу, иначе первую,
т.е. сравнивать отношение плотностей не с единицей, а с некоторой постоянной .
Назовем отношением правдоподобия частное
(18) |
Конструкция критерия, который мы живописали выше, сильно усложнится в случае, когда распределение случайной величины не является непрерывным, т.е. существует такое число , что вероятность отлична от нуля. Это означает, что на некотором «большом» множестве значений выборки обе гипотезы «равноправны»: отношение правдоподобия постоянно. Относя это множество целиком к критическому множеству или целиком исключая из него, мы меняем вероятность ошибки первого рода (размер) критерия на положительную величину :
И если вдруг мы захотим приравнять вероятность ошибки первого рода к заранее выбранному числу , может случиться так, что критерий с критическим множеством имеет размер больший, чем , а критерий с критическим множеством размер меньший, чем .
Поэтому для математиков, не читающих [1], мы сформулируем замечательно мощное утверждение мелким шрифтом, зато в общем случае. Затем для почти математиков сформулируем и докажем частный, но наиболее частый случай, когда отношение правдоподобия имеет при верной первой гипотезе непрерывную функцию распределения, т.е. для любого .
Функция , принимающая значения в интервале в зависимости от значений выборки, называется рандомизированным критерием.
Значение этой функции трактуют как вероятность принять вторую (так удобнее) гипотезу в некотором дополнительном эксперименте. Т.е., получив значение , мы должны дополнительно провести испытание с вероятностью успеха , и в случае успеха принять , в случае неудачи .
Значение предписывает принять вторую гипотезу (с вероятностью 1, т.е. обязательно), а значение предписывает не принимать вторую гипотезу, а принять первую.
Напомним, что есть отношение правдоподобия, которое мы ввели в (18).
Размер и мощность КОП вычисляются по формуле полной вероятности. Размер равен
Мощность равна
Вероятность ошибки второго рода можно найти и иначе:
Существуют постоянные и , при которых критерий отношения правдоподобия является
Мы не ограничиваем значения областью . Возможность брать (меньше бессмысленно, ибо ) избавляет от ограничения на возможный размер НМК. Это довольно сомнительное обобщение ведь уже критерий имеет единичную мощность при размере равном . Можно увеличивать размер и дальше, но мощности расти уже некуда. Такой НМК будет принимать с положительной вероятностью гипотезу там, где она верна быть не может в области .
Всюду далее предполагается, что
Функция непрерывна
по при . |
(19) |
Функция есть просто хвост функции распределения случайной величины :
Ее непрерывность означает, что величина равна нулю для любого . Это предположение избавляет нас от необходимости рассматривать рандомизированные критерии. Итак,
Размер и вероятность ошибки второго рода этого критерия равны соответственно
Пусть выполнено (19). Тогда существует постоянная , при которой критерий отношения правдоподобия является
Доказательство. Доказать достаточно два утверждения: существование постоянной , удовлетворяющей первому и третьему пунктам леммы, и оптимальность соответствующего критерия. Начнем с третьего пункта.
Итак, непрерывно меняется от до , поэтому для любого существует такое, что .
Функция , в отличие от , не убывает по . К тому же при величина стремится к . Она тоже, подобно , при непрерывна по из-за предположения (19):
Поэтому функции и пересекаются хотя бы однажды.
Действительно,
Но на множестве подынтегральная функция совпадает с . И на множестве подынтегральная функция тоже совпадает с . Продолжая цепочку равенств, получим
Q.D.E.
Пусть любой другой критерий. Лемма 3 влечет странное следствие:
Каково бы ни было , вероятности ошибок любого критерия связаны с вероятностями ошибок КОП неравенством
(20) |
Доказательство.
Рассматривая для краткости нерандомизированный критерий , получим
Q.D.E.
I. Пусть таково, что . Тогда правая часть неравенства (20) равна , и для любого иного критерия
Итак, , т.е. минимаксный.
II. Пусть и . Тогда для любого иного критерия неравенство (20) превращается в определение байесовского критерия:
Если же , то . Тогда КОП имеет нулевой размер и автоматически является байесовским.
III. Пусть таково, что . Любой иной критерий из класса имеет размер . Используя в неравенстве (20) оба этих размера, получим
Итак, , т.е. НМК в классе .
Q.D.E.
Имеется выборка , , из нормального распределения
со средним и единичной дисперсией.
Построим минимаксный, байесовский для , и наиболее мощный
размера критерии
для проверки гипотезы против
альтернативы , где .
Отношение правдоподобия
имеет абсолютно непрерывное распределение при любой из гипотез, поэтому
критерий отношения правдоподобия 28
будет нерандомизированным, и достаточно описать только его критическую область
.
Она определяется неравенством
(21) |
Критерий будет байесовским при . Упростим неравенство (21). Получим
Например, при и критическая область имеет вид . Чтобы построить минимаксный и наиболее мощный критерии, запишем неравенство (21) в эквивалентном виде , и искать будем , а не . Размер и вероятность ошибки второго рода равны соответственно
При получим НМК размера . Отсюда , где квантиль уровня стандартного нормального распределения. Тогда и НМК размера имеет видПри получим минимаксный критерий. Пользуясь свойствами функции распределения стандартного нормального закона, запишем
откуда и . Минимаксный критерий имеет вид
Имеется выборка , , из нормального распределения со средним и дисперсией , . Построим наиболее мощный критерий размера для проверки гипотезы против альтернативы , где . Отношение правдоподобия снова имеет абсолютно непрерывное распределение при любой из гипотез, поэтому критерий отношения правдоподобия из определения 28 будет нерандомизированным. Его критическая область определяется неравенством
что эквивалентно неравенству . Найдем , при котором размер критерия равен :
Отсюда , где квантиль -распределения с степенями свободы уровня . Тогда и НМК размера имеет вид