next up previous index
Next:  Гипотеза о среднем нормальной совокупности   Up:  Критерии согласия   Previous:  Критерий Фишера

8.7.   Совпадение средних двух нормальных выборок с равными дисперсиями

Есть две независимые выборки: ${\mathbf X}=(X_1, \ldots, X_n)$ из ${\mathsf N}_{a_1,\sigma^2}$ и ${\mathbf Y}=(Y_1,\ldots,Y_m)$ из ${\mathsf N}_{a_2,\sigma^2}$, причем дисперсия $\sigma^2$ одинакова для обоих распределений, но, вообще говоря, неизвестна. Проверяется сложная гипотеза $H_1=\{a_1= a_2\}$.

Эта задача есть частный случай задачи об однородности. Для ее решения построим критерий Стьюдента точного размера $\varepsilon$.

Из леммы Фишера вытекает следующее утверждение.

Теорема 12.

Случайная величина $t_{n+m-2}$, равная

\begin{displaymath}
t_{n+m-2}=\sqrt{\dfrac{nm}{n+m}}\cdot \dfrac{(\overline X-a_...
 ...frac{(n-1)S_0^2({\mathbf X})+(m-1)S_0^2({\mathbf Y})}{n+m-2} }}\end{displaymath}

имеет распределение Стьюдента ${\mathsf T}_{n+m-2}$ с $n{+}m{-}2$ степенями свободы.

Доказательство теоремы 12.  

1.
Легко видеть, убедиться, что легко! что $\overline X-a_1$ имеет распределение ${\mathsf N}_{0, \sigma^2\!/n}$, а $\overline Y-a_2$ имеет распределение ${\mathsf N}_{0, \sigma^2\!/m}$. Тогда их разность распределена тоже нормально с нулевым средним и дисперсией равной

\begin{displaymath}
{\mathsf D}\,\bigl((\overline X-a_1)-(\overline Y-a_2)\bigr)...
 ...\sigma^2}{n}+\dfrac{\sigma^2}{m}=
\sigma^2\cdot\dfrac{n+m}{nm}.\end{displaymath}

Нормируем эту разность. Величина

\begin{displaymath}
\xi_0=\dfrac{1}{\sigma}\,\sqrt{\dfrac{nm}{n+m}}\,
\bigl((\overline X-a_1)-(\overline Y-a_2)\bigr)\end{displaymath}

имеет стандартное нормальное распределение.

2.
Из леммы Фишера следует, что независимые случайные величины $(n{-}1)\,S_0^2({\mathbf X})/\sigma^2$ и $(m{-}1)\,S_0^2({\mathbf Y})/\sigma^2$ имеют распределения ${\mathsf H}_{m-1}$ и ${\mathsf H}_{n-1}$ соответственно, а их сумма

\begin{displaymath}
S^2=\dfrac{1}{\sigma^2}\,\left(
(n-1)S_0^2({\mathbf X})+(m-1)S_0^2({\mathbf Y})
\right)\end{displaymath}

имеет $\chi^2$-распределение ${\mathsf H}_{n+m-2}$ с $n{+}m{-}2$ степенями свободы и не зависит от $\overline X$ и от $\overline Y$.

3.
По определению 17, отношение $\dfrac{\xi_0}{\sqrt{S^2/(n{+}m{-}2)}}$ как раз имеет распределение Стьюдента ${\mathsf T}_{n+m-2}$. Осталось подставить в эту дробь $\xi_0$ и $S^2$ и убедиться, что $\sigma$ сократится и получится в точности $t_{n+m-2}$ из теоремы 12.

Q.D.E.


Введем функцию

$\displaystyle
\rho({\mathbf X}, {\mathbf Y})\,=\,\sqrt{\dfrac{nm}{n+m}}\cdot \d...
 ...ine Y}{\sqrt{
\dfrac{(n-1)S_0^2({\mathbf X})+(m-1)S_0^2({\mathbf Y})}{n+m-2} }}$.

Из теоремы 12 следует свойство K1(a): если $H_1$ верна, т.е. если $a_1=a_2$, то величина $\rho=t_{n+m-2}$ имеет распределение Стьюдента ${\mathsf T}_{n+m-2}$.

Упражнение.    Доказать свойство K1(б): для любой альтернативы к основной гипотезе (т.е. как только $a_1\neq a_2$) величина $\lvert\rho\rvert$ неограниченно возрастает по вероятности с ростом $n$ и $m$.

Указание.    Воспользовавшись ЗБЧ или свойствами 2-4 из 1-й лекции, доказать, что числитель и знаменатель сходятся к постоянным:

\begin{displaymath}
\overline X-\overline Y \buildrel {p} \over \longrightarrow ...
 ...+m-2}
 \buildrel {p} \over \longrightarrow \mathop{const}\ne 0,\end{displaymath}

тогда как корень перед дробью неограниченно возрастает.


Поэтому остается по $\varepsilon$ найти $C=\tau_{1-\varepsilon/2}$ — квантиль распределения ${\mathsf T}_{n+m-2}$. Для такого $C$ величина $t_{n+m-2}$ из распределения ${\mathsf T}_{n+m-2}$ удовлетворяет равенству

\begin{displaymath}
{\mathsf P}\,(\lvert t_{n+m-2}\rvert\gt C)=2{\mathsf P}\,(t_{n+m-2}\gt C)=\varepsilon. \end{displaymath}


И критерий Стьюдента выглядит как все критерии согласия:

\begin{displaymath}
\delta({\mathbf X},{\mathbf Y})=\begin{cases}
 H_1, & \textr...
 ...ert\rho({\mathbf X},{\mathbf Y})\rvert\geqslant C.
 \end{cases}\end{displaymath}

Упражнение.    Доказать, что этот критерий имеет точный размер $\varepsilon$.
Упражнение.    Построить критерий для проверки гипотезы о равенстве средних двух независимых нормальных выборок с произвольными известными дисперсиями.



N.I.Chernova
9 сентября 2002