Критерий (K.Pearson, 1900) основывается на группированных данных. Область значений предполагаемого распределения делят на некоторое число интервалов. После чего строят функцию отклонения по разностям теоретических вероятностей попадания в интервалы группировки и эмпирических частот.
Имеется выборка из распределения . Проверяется простая гипотеза против сложной альтернативы .
Пусть, как в параграфе 1.6, , , интервалы группировки в области значений случайной величины с распределением . Обозначим для через число элементов выборки, попавших в интервал
и через теоретическую вероятность попадания в интервал случайной величины с распределением . С необходимостью, . Как правило, длины интервалов выбирают так, чтобы .
Пусть
(23) |
Свойство K1(б) выполнено далеко не для всех альтернатив. Если распределение выборки имеет такие же, как у , вероятности попадания в каждый из интервалов , то по данной функции эти распределения различить невозможно.
Поэтому на самом деле критерий, который мы построим по функции из (23), решает совсем иную задачу. А именно, пусть задан набор вероятностей такой, что . Критерий предназначен для проверки сложной гипотезы
против сложной альтернативы , т.е.
Покажем, что удовлетворяет условию K1(a).
Если верна гипотеза , то при фиксированном и при
где, напомним, есть -распределение с степенью свободы.
Стоит остановиться и задать себе вопрос. Величина есть сумма
слагаемых. Слагаемые, если вы не забыли ЦПТ или теорему Муавра Лапласа,
имеют распределения, близкие к квадратам каких-то нормальных.
Куда потерялась одна степень свободы? Причина кроется, конечно, в зависимости слагаемых: . |
Докажем теорему Пирсона при .
В этом случае , . Посмотрим на и вспомним ЦПТ:
.
Но величина есть сумма независимых случайных величин с распределением Бернулли , и по ЦПТ
где имеет стандартное нормальное распределение. Поэтому
Величина имеет -распределение с одной степенью свободы.
Q.D.E.
Для экономистов, только приступающих к знакомству с многомерным нормальным распределением, матрицами ковариаций и всевозможными квадратичными формами, составленными из (асимптотически) нормальных слагаемых, исключительно полезно познакомиться с доказательством теоремы Пирсона в общем случае. Параграф 1 приложения, который познакомит читателя с многомерным нормальным распределением, стоит напечатать и повесить в изголовье кровати до окончания курса эконометрики. |
Функция удовлетворяет условию K1(б). Действительно,
Осталось построить критерий в соответствии с K2.
Пусть случайная величина имеет распределение . По таблице распределения найдем равное квантили уровня этого распределения. Тогда и критерий согласия выглядит как все критерии согласия:
На самом деле критерий применяют и для решения первоначальной задачи о проверке гипотезы . Необходимо только помнить, что этот критерий не состоятелен для альтернатив с теми же вероятностями попадания в интервалы разбиения, что и у . Поэтому берут большое число интервалов разбиения чем больше, тем лучше, чтобы «уменьшить» число альтернатив, неразличимых с предполагаемым распределением.
Сходимость по распределению обеспечивается ЦПТ, поэтому разница допредельной и предельной вероятностей имеет тот же порядок, что и погрешность нормального приближения
(см. неравенство Берри Эссеена для погрешности в ЦПТ), где некоторая постоянная. Маленькие значения в знаменателе приведут к тому, что распределение будет существенно отличаться от . Тогда и реальная вероятность точный размер полученного критерия будет сильно отличаться от . Поэтому для выборки объема число интервалов разбиения выбирают так, чтобы обеспечить нужную точность при замене распределения на .
Обычно требуют, чтобы были не менее -.
N.I.Chernova