Здравствуйте.
Задачка следующая:
Речь об опросе населения.
Простым случайным семплированием в одной из страт размера

берем выборку размера

и внутри этой выборки для каждого объекта пытаемся измерить параметр

, который принимает значение 0 или 1. Получаем оценку

параметра

для данной страты оценка

. Поскольку речь об опросе населения, то мы можем получить меньше 100 значений параметра, то есть ответить могут меньше 100 человек, но всегда нормируем так, что

. Пусть дисперсия оценки

Через год снова измеряем в той же страте тот же параметр. Снова получаем выборку размером 100, по той же формуле оцениваем параметр

, получаем оценку

, где

. Дисперсия оценки

В условиях сказано, что нам ничего не известно о возможных изменениях внутри страты между двумя измерениями (что это значит - что у нас фактически две независимые выборки или что-то другое?)
Затем мы объединяем (смешиваем) две эти выборки и получаем таким образом выборку в 200 измерений и для них считаем оценку параметра по той же страте и оцениваем дисперсию. Для новой выборки оценка

параметра

новой выборки -
Вопросы следующие:
Размер выборки увеличился в два раза. Почему оценка параметра это среднее арифметическое, а не сумма двух оценок по первым двум выборкам? (Я ответил, что это потому что мы по-прежнему должны нормировать

, а поскольку количество элементов в выборке стало 200, то все коэффициенты

и

делятся на два )
Чему будет равна оценка

дисперсии для новой выборки (я считаю, что

)
Поправьте меня, пожалуйста, если я ошибся. Спасибо.