2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Задачка по статистике - помогите понять
Сообщение26.07.2011, 20:17 
Здравствуйте.
Задачка следующая:
Речь об опросе населения.

Простым случайным семплированием в одной из страт размера $N$ берем выборку размера $n=100 $ и внутри этой выборки для каждого объекта пытаемся измерить параметр $x$, который принимает значение 0 или 1. Получаем оценку $x_{o1}$ параметра $x$ для данной страты оценка $x_{o}_{1}=\sum w_{1i}x_{1i}$. Поскольку речь об опросе населения, то мы можем получить меньше 100 значений параметра, то есть ответить могут меньше 100 человек, но всегда нормируем так, что $\sum w_{1i}=100$. Пусть дисперсия оценки $\sigma_{1}^2

Через год снова измеряем в той же страте тот же параметр. Снова получаем выборку размером 100, по той же формуле оцениваем параметр $x$, получаем оценку $x_{o}_{2}=\sum w_{2i}x_{2i}$, где $\sum w_{2i}=100$. Дисперсия оценки $\sigma_{2}^2

В условиях сказано, что нам ничего не известно о возможных изменениях внутри страты между двумя измерениями (что это значит - что у нас фактически две независимые выборки или что-то другое?)

Затем мы объединяем (смешиваем) две эти выборки и получаем таким образом выборку в 200 измерений и для них считаем оценку параметра по той же страте и оцениваем дисперсию. Для новой выборки оценка $x_{o}$ параметра $x$ новой выборки - $x_{o}=\frac{ x_{o1}+x_{o2}}{ 2}$


Вопросы следующие:
Размер выборки увеличился в два раза. Почему оценка параметра это среднее арифметическое, а не сумма двух оценок по первым двум выборкам? (Я ответил, что это потому что мы по-прежнему должны нормировать $\sum w_{i}=100$, а поскольку количество элементов в выборке стало 200, то все коэффициенты $w_{1i}$ и $w_{2i}$ делятся на два )
Чему будет равна оценка $\sigma_{o}^2$ дисперсии для новой выборки (я считаю, что $\sigma_{o}^2=\frac{ \sigma_{o1}^2+\sigma_{o2}^2}{ 2}$)

Поправьте меня, пожалуйста, если я ошибся. Спасибо.

 
 
 
 Re: Задачка по статистике - помогите понять
Сообщение27.07.2011, 06:19 
Ээээ. Если у меня все правильно, напишите пожалуйста и об этом тоже.

 
 
 
 Re: Задачка по статистике - помогите понять
Сообщение27.07.2011, 08:46 
Аватара пользователя
0.
Цитата:
нам ничего не известно о возможных изменениях внутри страты между двумя измерениями

Это всего лишь пояснение того, отчего мы объединяем выборки, даже не пытаясь проверить, различаются ли они.
1. Среднее арифметическое из двух оценок не правильная, а приближённо-правильная оценка. Она является точной, только если число ответивших опрошеных равно в обеих выборках. Если оно различно - надо использовать взвешенное среднее, где веса пропорциональны числу опрошеных. Если доли ответивших примерно равны, простое среднее, впрочем, от взвешенного отличаться будет мало.
2. Если число ответивших в обеих выборках равно, то среднее арифметическое дисперсий будет правильной оценкой дисперсии объёдинённой выборки, если не равно - то нужно взвешеное среднее, где веса пропорциональны числу степеней свободы при расчёте дисперсий (т.е. n-1)

 
 
 
 Re: Задачка по статистике - помогите понять
Сообщение01.08.2011, 06:46 
Спасибо

 
 
 [ Сообщений: 4 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group