Итак, пусть , , выборка объема из параметрического семейства распределений , .
Заметим, что все характеристики случайных величин , , зависят от параметра . Так, например, для с распределением Пуассона
Чтобы отразить эту зависимость, будем писать вместо и т.д. Так, означает дисперсию, вычисленную в предположении .
Во многих случаях эта условность необходима. Предположим, что имеют распределение Пуассона . В предположении, что , имеем , тогда как при имеем . Таким образом, запись , без указания на распределение , оказывается просто бессмысленной.
Статистика есть функция от эмпирических данных, но никак не от параметра . Статистика, как правило, предназначена именно для оценивания неизвестного параметра (поэтому ее иначе называют «оценкой»), и уже поэтому от него зависеть не может.
Конечно, статистика есть не «любая», а «измеримая» функция от выборки (борелевская, для которой прообраз любого борелевского множества из есть снова борелевское множество в ), но мы никогда не встретимся с иными функциями, и более на это обращать внимание не будем.
Статистика называется несмещенной оценкой параметра , если для любого выполнено равенство
.
Статистика называется состоятельной оценкой параметра , если для любого имеет место сходимость
при .
Несмещенность свойство оценок при фиксированном . Означает это свойство отсутствие ошибки «в среднем», т.е. при систематическом использовании данной оценки.
Свойство состоятельности означает, что последовательность оценок приближается к неизвестному параметру при увеличении количества данных. Понятно, что при отсутствии этого свойства оценка совершенно «несостоятельна» как оценка.
Пусть , , выборка объема из нормального распределения , где , . Как найти оценки для параметров и , если оба эти параметра (можно считать это и одним двумерным параметром) неизвестны?
Мы уже знаем хорошие оценки для математического ожидания и дисперсии любого распределения.
Оценкой для истинного среднего может служить выборочное среднее . Свойство 2 утверждает, что эта оценка несмещенная и состоятельная.
Для дисперсии у нас есть сразу две оценки:
и
(выборочная дисперсия и несмещенная выборочная дисперсия).
Как показано в свойстве 4, обе эти оценки состоятельны, и одна из них несмещенная. которая?
Следующий метод получения оценок для неизвестных параметров как раз и предлагает использовать выборочные моменты вместо истинных.
N.I.Chernova