2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 О способах оценки Дисперсий.
Сообщение23.03.2011, 20:32 
В книге "Эконометрики"(Даугерти) читал что для оценки дисперсии $\sigma^2$ обычно использують формулу :$s^2=\dfrac{1}{n-1}\sum\limits_{i=1}^{n}(x_i-\bar{x})^2$.
Возникает вопрос почему сразу не использовать формулу
$\dfrac{1}{n}\sum\limits_{i=1}^{n}(x_i-\bar{x})^2$?
Что делить на число $n$ намного трудное занятие чем деление на $n-1$ что ли? :)

 
 
 
 
Сообщение23.03.2011, 20:40 
Аватара пользователя
Дело не в том, что трудно, а в том, что правильно.

 
 
 
 Re: О способах оценки Дисперсий.
Сообщение23.03.2011, 20:45 
Аватара пользователя
Найдите матожидание обоих оценок, и посмотрите, какая из этих оценок будет несмещённая.

 
 
 
 
Сообщение23.03.2011, 20:49 
Нет, делить не труднее.
Дело в том, что оценка дисперсии $s^2 = \dfrac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2$ является несмещённой, в отличии от $\dfrac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2$ (на всякий случай напомню, что оценка называется несмещённой, если её мат. ожидание совпадает со значением оцениваемого параметра). А с несмещёнными оценками, при теоретическом рассмотрении, чуть проще работать.

 
 
 
 
Сообщение23.03.2011, 20:50 
В принципе, при $n\geqslant30$ уже почти без разницы, какую брать, так как обе эти оценки асимптотически несмещенные.

 
 
 
 
Сообщение23.03.2011, 21:46 
Аватара пользователя
Одно из требований к качеству статистических оценок - несмещённость (это не есть обязательное требование, есть ситуации, в которых целесообразно отказаться от этого условия, и рассматривать и смещённые оценки, но, как правило, это разумное требование). Несмещённость состоит в том, что матожидание оценки равно истинному значению параметра. Иногда это неформально выражают, как "оценка не имеет систематической ошибки".
Доказать, что деление именно на (n-1) требуется для несмещённости оценки, просто. Для этого надо расписать выражение для дисперсии и взять матожидание.
Интереснее объяснить на содержательном уровне это "антиинтуитивное" действие.
Это тоже несложно. Если бы мы знали истинное значение матожидания случайной величины, а не его оценку - среднее арифметическое, то для получения оценки дисперсии делить-таки надо на n, но у нас вычитается из наблюдений перед возведением в квадрат среднее арифметическое. При этом каждое отдельное наблюдение "оттягивает" на себя среднее, входя в него с весом 1/n, и в результате сумма квадратов оказывается заниженной по сравнению со случаем, когда бы мы использовали истинное значение матожидания. Вот это занижение и компенсирует деление на (n-1) взамен n.

 
 
 
 
Сообщение23.03.2011, 22:16 
Спасибо. Полностью разбирался с этим вопросом.

 
 
 [ Сообщений: 7 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group