Критерий Шапиро-Уилка



В ряде опытов, особенно в медицинских исследованиях, численность выборки мала. Специально для проверки нормальности распределения малых, численностью от трех до пятидесяти элементов, выборок Шапиро и Уилк разработали критерий $W$.

Итак, пусть имеется выборка $(X_1,...,X_n)$. Вычисления статистики производятся по формулам:

\begin{displaymath}
W=b^2/S^2,
\end{displaymath}

где $S^2=\sum_{i=1}^n (X_i-\overline{X})^2$ и $b=\sum_{i=1}^k a_{n,i} (X_{(n-i+1)}-X_{(i)})$. Значение $k$ в последней формуле определяется следующим образом:
$k=n/2$, если $n$ - четное, $k=(n-1)/2$, если $n$ - нечетное, $\{a_{n,i},~i=1,...,k;~n=3,...,50\}$ - известные константы.

Для вычисления реально достигнутого уровня значимости применяется нормальная аппроксимация, используется следующая формула:

\begin{displaymath}1-\Phi_{0,1}(\vert b_n+c_n\ln((W-d_n)/(1-W))\vert),\end{displaymath}

где $\Phi_{0,1}$ - стандартное нормальное распределение, $b_n$, $c_n$ и $d_n$ - константы, для которых известны, в зависимости от объема выборки, табличные значения.





Электронные таблицы

Правила пользования таблицами.

Результаты вычислений
Объем выборки Значение статистики Шапиро-Уилка Достигаемый уровень значимости



Реализация исследуемой выборки








Правила пользования таблицами

Прежде всего в текстовое поле следует поместить изучаемую выборку (это можно сделать, набрав соответствующие значения вручную либо скопировав, скажем из Excel), затем нажать кнопку "Вычислить", после чего в таблице "Результаты вычислений" появится реально достигнутый уровень значимости в критерии Шапиро-Уилка, а также объем выборки и значение статистики Шапиро-Уилка.
Отметим, что в качестве десятичного разделителя в числах можно использовать и точку, и запятую. Удалять значения из первой таблицы можно двойным щелчком мыши. Особо обратим внимание! В качестве разделителя между отдельными числами ни в коем случае не следует использовать точку и запятую, так как эти знаки используются в качестве десятичного разделителя. Отделить одно число от другого можно используя "пробел" или "ввод". Скажем, такой ввод в текстовое поле верен:

0,23 0,56 0.98
0,98 1,56 9,9 7.908

Соответственно будут обрабатываться семь значений: 0.23 0.56 0.98 1.56 9.9 7.908.