next up previous index
Next:  Вопросы и упражнения   Up:  Основные понятия МС   Previous:  Сходимость эмпирических характеристик

1.6.   Группированные данные (некоторые вводные понятия эконометрики)

Если объем выборки очень велик, часто работают не с элементами выборки, а с группированными данными. Приведем ряд понятий, связанных с группировкой. Для простоты будем делить область выборочных данных на $k$ одинаковых интервалов $A_1$, $\ldots$, $A_k$ длины $\Delta$:

\begin{displaymath}
A_1=[a_0,a_1), \ldots, A_k=[a_{k-1},a_k), \quad a_j-a_{j-1}=\Delta.\end{displaymath}

Как прежде, пусть $\nu_j$ — число элементов выборки, попавших в интервал $A_j$, и $w_j$ — частота попадания в интервал $A_j$ (оценка вероятности попадания в интервал):

\begin{displaymath}
\nu_j=\{\textrm{\,число } X_i \in A_j\}=\sum\limits_{i=1}^n {\mathbf I}(X_i \in A_j),
\quad w_j=\dfrac{\nu_j}{n}.\end{displaymath}

На каждом из интервалов $A_j$ строят прямоугольник с высотой $f_j=\dfrac{w_j}{\Delta}$ и получают гистограмму.

Рассмотрим середины интервалов: $\overline a_j=a_{j-1}+\Delta/2$ — середина $A_j$. Набор

\begin{displaymath}
\underbrace{\overline a_1,\ldots,\overline a_1}_{\nu_1 \text...
 ...race{\overline a_k,\ldots,\overline a_k}_{\nu_k \textrm{ раз }}\end{displaymath}

можно считать «огрубленной» выборкой, в которой все $X_i$, попадающие в интервал $A_j$, заменены на $\overline a_j$. По этой выборке можно построить такие же (но более грубые) выборочные характеристики, что и по исходной (обозначим их так же), например выборочное среднее

\begin{displaymath}
\overline X = \dfrac{1}{n}\sum\limits_{j=1}^k \overline a_j \nu_j =
\sum\limits_{j=1}^k \overline a_j w_j\end{displaymath}

или выборочную дисперсию

\begin{displaymath}
S^2 = \dfrac{1}{n}\sum\limits_{j=1}^k (\overline a_j -\overl...
 ...\nu_j =
\sum\limits_{j=1}^k (\overline a_j -\overline X)^2 w_j.\end{displaymath}

Кривая, соединяющая точки $(a_0,0)$, $(\overline a_1,f_1)$, $\ldots$, $(\overline a_k,f_k)$, $(a_k,0)$, называется полигоном (частот). В отличие от гистограммы полигон — непрерывная функция (ломаная).



N.I.Chernova
9 сентября 2002