Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 Оценить значение параметра ген. совокупности по выборке
Помогите, пжл, решить следующую задачу.
На предприятии 1200 рабочих. 20% из них обследовано с помощью собственно-случайного исследования. Вследствие чего, средняя заработная плата составила 1200 руб. Среднее квадратичное отклонение при этом равно 30.

1) Найти доверительную вероятность того, что средняя заработная плата в генеральной совокупности отличается от средней заработной платы в выборке не более чем на 15 руб.
2) Определить объем выборки, необходимый для того, чтобы с вероятностью 0,9545 средняя заработная плата отличалась от средней заработной платы в выборке не более чем на 30 руб.

По условию ясно, что в генеральной совокупности $N=1200$ человек, в выборке - $n=240$, \overline{x}=1200, $\sigma=30$. Тогда минимальный объем выборки $n=\frac{t\cdot\sigma^2}{\delta^2}$. Но вот как найти эту $\delta$?

А по первой подзадаче я не знаю формулы для доверительной вероятности... :(

 
Аватара пользователя
Задачи решаются в предположении, что распределение зарплат можно приближенно считать нормальным.

Обе задачи решаются по формуле доверительного интервала для среднего:
$$
P\left(|\bar x - a|>\frac{\sigma t}{\sqrt{n}}\right)\le\alpha
$$
Величина $\delta$ обозначает эту разницу между истинным значением $a$ и средним $\bar x$.

В первой части задачи Вам известны $n$ и $\delta=15$. По формуле нужно найти, какому $t$ это соответствует и какая при этом получается $\alpha$.

Во второй части задана $\alpha$ (откуда находится $t$), задана $\delta=30$. По той формуле, которую написали, находите $n$.

 
PAV: не совсем так. Надо еще не забыть про поправочный коэффициент для дисперсии, поскольку выборка делается из конечной совокупности.

Формулы такие:
пусть истинное среднее в генеральной совокупности размера $N$ равно
$\tilde x = \frac1N \sum\limits_{i=1}^N x_i$
и истинная дисперсия
$\tilde\sigma = \frac1N\sum\limits_{i=1}^N (x_i-\tilde x)^2$

Мы делаем выборку размера $n$. Считаем выборочное среднее
$\overline x=\frac1n \sum\limits_{i=1}^n x_i$
Это выборочное среднее - случайная величина. Вообще говоря, она никогда не будет нормально распределена, но при больших n ее дисперсия становится настолько мала, что никто уже не отличит. Поэтому смело будем применять к ней ЦПТ. При этом мы можем явно посчитать значения
$E\overline x = \tilde x$
$D \overline x = s^2=\frac{\tilde\sigma^2}n \left(1-\frac{n-1}{N-1}\right)$
Множитель в скобках - тот самый поправочный коэффициент, возникающий вследствие того, что у нас выборка делается из конечной генеральной совокупности.

Теперь самый главный вопрос - а что нам дано по условию задачи. Там сказано "Среднее квадратичное отклонение при этом равно 30". Значит, в условии задачи нам задано либо $\sigma$, либо $s$. По логике вещей, нам должно быть дано именно $\sigma$, так как это "объективный" показатель, в то время как $s$ - необъективный.
Dionis_The_Great, не могли бы вы уточнить этот момент в условии задачи?

Предполагая, что по условию задачи нам задано именно $\sigma$, перепишу формулу, возникающую из ЦПТ, которая была у PAV:
$P\left(|\tilde x - a| > \frac{\sigma t}{\sqrt{n}}\sqrt{\frac{N-n}{N-1}}\right)\leqslant \alpha$,
где $a=\overline x$ - оценка истинного среднего значения $\tilde x$ по выборке.

 
Dan_Te, дано именно $\sigma$, а не "исправленное" ср. квадр. отклонение $s$.

То есть, если я правильно понимаю, доверительная вероятность можно будет найти по формулу $2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\right)$, где $\Phi(x)$ - функция Лапласа?

 
Неправильно.
Это было бы так, если бы $\overline x$ было распределено по нормальному закону $N(\tilde x, \frac {\sigma^2}n)$. А оно распределено (на самом деле нет, но делается такое допущение) по закону $N(\tilde x, \frac {\sigma^2}n\frac{N-n}{N-1})$

И $s$ у меня - не "исправленная выборочная дисперсия", или что вы имели в виду. Это самое что ни на есть стандартное отклонение выборочного среднего.

 
Таким образом, надежность $P=2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\sqrt{\frac{N-1}{N-n}}\right)$?

А можно ли во второй задаче найти объем выборки по формуле $n=\frac{n'\cdot N}{n'+N}$, где $n'=\frac{t^2\sigma^2}{\delta^2}$?

 
Аватара пользователя
Честно говоря, нет у меня уверенности, что в данной задаче следует учитывать этот поправочный коэффициент... Мне кажется, что задача скорее все-таки учебная и предполагается просто нормальное распределение, а конечность генеральной совокупности тут учитывать не предполагается. Но я могу и ошибаться.

 
Да, только у меня получилось в знаменателе не $n'+N$, а $n'+N-1$. Правда, на практике разницы почти никакой не будет.

 
Аватара пользователя
Я бы сказал так: если Вам рассказывали про данный поправочный коэффициент, то в задаче его нужно использовать, а если не рассказывали - то это заведомо не предполагается :wink:

 
В условии задачи вместо просто размера выборки сказано про объем ген. совокупности и долю выборки в совокупности. Поэтому мне кажется, это именно тот случай, когда нужно использовать формулы с "поправкой".

 
Аватара пользователя
Возможно. Мне это в голову не пришло, если честно. Спасибо за поправку.

 
Задача, конечно, учебная :) Только не моя :D Подруга попросила решить... А у нас в вузе так детально статистику не читали. Поэтому я и не знаю: говорили ли у них о поправочном коэффициенте или нет. Но я тоже склоняюсь к тому, что тут просто нормальное распределение. А доля, наверняка, дана для того, чтобы студент по всему объему генеральной совокупности нашел объем выборки. Но это я так думаю :)

 
Аватара пользователя
Пусть предъявит и то, и другое решение, и покажет, что разница практически отсутствует. Ее будут тогда уважать. Если, правда, не окажется, что это выходит за рамки знаний преподавателя, тогда эффект может оказаться непредсказуемым.

 
Окончательно, если поправочный коэффициент НЕ учитывать, то надежность 2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\right) и объем выборки $n=\frac{t^2\sigma^2}{\delta^2}$. Если его учитывать, то тогда $P=2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\sqrt{\frac{N-1}{N-n}}\right)$, а объем $n=\frac{n'\cdot N}{n'+N}$. Так ведь? :P :oops:

 
PAV писал(а):
Пусть предъявит и то, и другое решение, и покажет, что разница практически отсутствует. Ее будут тогда уважать. Если, правда, не окажется, что это выходит за рамки знаний преподавателя, тогда эффект может оказаться непредсказуемым.

Я думаю, если вдруг преподаватель станет вести себя как-то не так, то можно будет рассказать, откуда взялось решение.

Dionis_The_Great
Все-таки настаиваю на $n=\frac{n'\cdot N}{n'+N-1}$ во втором случае =))

 [ Сообщений: 15 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group