Критерий (K.Pearson, 1900) основывается на группированных данных.
Область значений предполагаемого распределения
делят на некоторое число интервалов.
После чего строят функцию отклонения
по разностям
теоретических вероятностей попадания в интервалы
группировки и эмпирических частот.
Имеется выборка из распределения
. Проверяется простая гипотеза
против сложной альтернативы
.
Пусть, как в параграфе 1.6,
,
,
интервалы группировки в области
значений случайной величины с распределением
.
Обозначим для
через
число элементов выборки,
попавших в интервал
и через теоретическую вероятность
попадания в интервал
случайной величины с распределением
. С необходимостью,
. Как правило,
длины интервалов выбирают так, чтобы
.
Пусть
![]() | (23) |
Свойство K1(б) выполнено далеко не для всех альтернатив.
Если распределение выборки имеет такие же,
как у
, вероятности
попадания в каждый из интервалов
, то по данной функции
эти распределения различить невозможно.
Поэтому на самом деле критерий, который мы построим по функции из
(23),
решает совсем иную задачу. А именно, пусть задан набор вероятностей
такой, что
. Критерий
предназначен
для проверки сложной гипотезы
против сложной альтернативы , т.е.
Покажем, что удовлетворяет условию
K1(a).
Если верна гипотеза ,
то при фиксированном
и при
где, напомним, есть
-распределение с
степенью свободы.
Стоит остановиться и задать себе вопрос. Величина ![]() ![]() Причина кроется, конечно, в зависимости слагаемых: ![]() |
Докажем теорему Пирсона при .
В этом случае ,
. Посмотрим на
и
вспомним ЦПТ:
.
Но величина есть сумма
независимых случайных величин
с распределением Бернулли
, и по ЦПТ
где имеет стандартное нормальное распределение. Поэтому
Величина имеет
-распределение
с одной степенью свободы.
Q.D.E.
Для экономистов, только приступающих к знакомству с многомерным нормальным распределением, матрицами ковариаций и всевозможными квадратичными формами, составленными из (асимптотически) нормальных слагаемых, исключительно полезно познакомиться с доказательством теоремы Пирсона в общем случае. Параграф 1 приложения, который познакомит читателя с многомерным нормальным распределением, стоит напечатать и повесить в изголовье кровати до окончания курса эконометрики. |
Функция удовлетворяет условию
K1(б). Действительно,
Осталось построить критерий в соответствии с K2.
Пусть случайная величина имеет распределение
. По таблице распределения
найдем
равное квантили
уровня
этого распределения.
Тогда
и
критерий согласия
выглядит как все критерии согласия:
На самом деле критерий применяют и для решения первоначальной
задачи о проверке гипотезы
.
Необходимо только помнить,
что этот критерий не состоятелен для альтернатив с теми же вероятностями
попадания в интервалы разбиения, что и у
. Поэтому берут большое
число интервалов разбиения чем больше, тем лучше, чтобы «уменьшить»
число альтернатив, неразличимых с предполагаемым распределением.
Сходимость по распределению обеспечивается ЦПТ, поэтому разница допредельной и предельной вероятностей
имеет тот же порядок, что и погрешность нормального приближения
(см. неравенство Берри Эссеена для погрешности в ЦПТ),
где некоторая постоянная. Маленькие значения
в знаменателе
приведут к тому, что распределение
будет существенно
отличаться от
. Тогда и реальная вероятность
точный размер полученного критерия будет сильно
отличаться от
.
Поэтому для выборки объема
число интервалов разбиения выбирают
так, чтобы обеспечить нужную точность при замене распределения
на
.
Обычно требуют, чтобы
были не менее
-
.
N.I.Chernova