2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Оценить значение параметра ген. совокупности по выборке
Сообщение29.04.2007, 07:42 
Помогите, пжл, решить следующую задачу.
На предприятии 1200 рабочих. 20% из них обследовано с помощью собственно-случайного исследования. Вследствие чего, средняя заработная плата составила 1200 руб. Среднее квадратичное отклонение при этом равно 30.

1) Найти доверительную вероятность того, что средняя заработная плата в генеральной совокупности отличается от средней заработной платы в выборке не более чем на 15 руб.
2) Определить объем выборки, необходимый для того, чтобы с вероятностью 0,9545 средняя заработная плата отличалась от средней заработной платы в выборке не более чем на 30 руб.

По условию ясно, что в генеральной совокупности $N=1200$ человек, в выборке - $n=240$, \overline{x}=1200, $\sigma=30$. Тогда минимальный объем выборки $n=\frac{t\cdot\sigma^2}{\delta^2}$. Но вот как найти эту $\delta$?

А по первой подзадаче я не знаю формулы для доверительной вероятности... :(

 
 
 
 
Сообщение29.04.2007, 08:46 
Аватара пользователя
Задачи решаются в предположении, что распределение зарплат можно приближенно считать нормальным.

Обе задачи решаются по формуле доверительного интервала для среднего:
$$
P\left(|\bar x - a|>\frac{\sigma t}{\sqrt{n}}\right)\le\alpha
$$
Величина $\delta$ обозначает эту разницу между истинным значением $a$ и средним $\bar x$.

В первой части задачи Вам известны $n$ и $\delta=15$. По формуле нужно найти, какому $t$ это соответствует и какая при этом получается $\alpha$.

Во второй части задана $\alpha$ (откуда находится $t$), задана $\delta=30$. По той формуле, которую написали, находите $n$.

 
 
 
 
Сообщение29.04.2007, 09:58 
PAV: не совсем так. Надо еще не забыть про поправочный коэффициент для дисперсии, поскольку выборка делается из конечной совокупности.

Формулы такие:
пусть истинное среднее в генеральной совокупности размера $N$ равно
$\tilde x = \frac1N \sum\limits_{i=1}^N x_i$
и истинная дисперсия
$\tilde\sigma = \frac1N\sum\limits_{i=1}^N (x_i-\tilde x)^2$

Мы делаем выборку размера $n$. Считаем выборочное среднее
$\overline x=\frac1n \sum\limits_{i=1}^n x_i$
Это выборочное среднее - случайная величина. Вообще говоря, она никогда не будет нормально распределена, но при больших n ее дисперсия становится настолько мала, что никто уже не отличит. Поэтому смело будем применять к ней ЦПТ. При этом мы можем явно посчитать значения
$E\overline x = \tilde x$
$D \overline x = s^2=\frac{\tilde\sigma^2}n \left(1-\frac{n-1}{N-1}\right)$
Множитель в скобках - тот самый поправочный коэффициент, возникающий вследствие того, что у нас выборка делается из конечной генеральной совокупности.

Теперь самый главный вопрос - а что нам дано по условию задачи. Там сказано "Среднее квадратичное отклонение при этом равно 30". Значит, в условии задачи нам задано либо $\sigma$, либо $s$. По логике вещей, нам должно быть дано именно $\sigma$, так как это "объективный" показатель, в то время как $s$ - необъективный.
Dionis_The_Great, не могли бы вы уточнить этот момент в условии задачи?

Предполагая, что по условию задачи нам задано именно $\sigma$, перепишу формулу, возникающую из ЦПТ, которая была у PAV:
$P\left(|\tilde x - a| > \frac{\sigma t}{\sqrt{n}}\sqrt{\frac{N-n}{N-1}}\right)\leqslant \alpha$,
где $a=\overline x$ - оценка истинного среднего значения $\tilde x$ по выборке.

 
 
 
 
Сообщение29.04.2007, 11:52 
Dan_Te, дано именно $\sigma$, а не "исправленное" ср. квадр. отклонение $s$.

То есть, если я правильно понимаю, доверительная вероятность можно будет найти по формулу $2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\right)$, где $\Phi(x)$ - функция Лапласа?

 
 
 
 
Сообщение29.04.2007, 12:11 
Неправильно.
Это было бы так, если бы $\overline x$ было распределено по нормальному закону $N(\tilde x, \frac {\sigma^2}n)$. А оно распределено (на самом деле нет, но делается такое допущение) по закону $N(\tilde x, \frac {\sigma^2}n\frac{N-n}{N-1})$

И $s$ у меня - не "исправленная выборочная дисперсия", или что вы имели в виду. Это самое что ни на есть стандартное отклонение выборочного среднего.

 
 
 
 
Сообщение29.04.2007, 12:42 
Таким образом, надежность $P=2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\sqrt{\frac{N-1}{N-n}}\right)$?

А можно ли во второй задаче найти объем выборки по формуле $n=\frac{n'\cdot N}{n'+N}$, где $n'=\frac{t^2\sigma^2}{\delta^2}$?

 
 
 
 
Сообщение29.04.2007, 12:51 
Аватара пользователя
Честно говоря, нет у меня уверенности, что в данной задаче следует учитывать этот поправочный коэффициент... Мне кажется, что задача скорее все-таки учебная и предполагается просто нормальное распределение, а конечность генеральной совокупности тут учитывать не предполагается. Но я могу и ошибаться.

 
 
 
 
Сообщение29.04.2007, 12:58 
Да, только у меня получилось в знаменателе не $n'+N$, а $n'+N-1$. Правда, на практике разницы почти никакой не будет.

 
 
 
 
Сообщение29.04.2007, 12:59 
Аватара пользователя
Я бы сказал так: если Вам рассказывали про данный поправочный коэффициент, то в задаче его нужно использовать, а если не рассказывали - то это заведомо не предполагается :wink:

 
 
 
 
Сообщение29.04.2007, 13:05 
В условии задачи вместо просто размера выборки сказано про объем ген. совокупности и долю выборки в совокупности. Поэтому мне кажется, это именно тот случай, когда нужно использовать формулы с "поправкой".

 
 
 
 
Сообщение29.04.2007, 13:07 
Аватара пользователя
Возможно. Мне это в голову не пришло, если честно. Спасибо за поправку.

 
 
 
 
Сообщение29.04.2007, 13:15 
Задача, конечно, учебная :) Только не моя :D Подруга попросила решить... А у нас в вузе так детально статистику не читали. Поэтому я и не знаю: говорили ли у них о поправочном коэффициенте или нет. Но я тоже склоняюсь к тому, что тут просто нормальное распределение. А доля, наверняка, дана для того, чтобы студент по всему объему генеральной совокупности нашел объем выборки. Но это я так думаю :)

 
 
 
 
Сообщение29.04.2007, 13:20 
Аватара пользователя
Пусть предъявит и то, и другое решение, и покажет, что разница практически отсутствует. Ее будут тогда уважать. Если, правда, не окажется, что это выходит за рамки знаний преподавателя, тогда эффект может оказаться непредсказуемым.

 
 
 
 
Сообщение29.04.2007, 13:27 
Окончательно, если поправочный коэффициент НЕ учитывать, то надежность 2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\right) и объем выборки $n=\frac{t^2\sigma^2}{\delta^2}$. Если его учитывать, то тогда $P=2\Phi\left(\frac{\delta\sqrt{n}}{\sigma}\sqrt{\frac{N-1}{N-n}}\right)$, а объем $n=\frac{n'\cdot N}{n'+N}$. Так ведь? :P :oops:

 
 
 
 
Сообщение29.04.2007, 14:01 
PAV писал(а):
Пусть предъявит и то, и другое решение, и покажет, что разница практически отсутствует. Ее будут тогда уважать. Если, правда, не окажется, что это выходит за рамки знаний преподавателя, тогда эффект может оказаться непредсказуемым.

Я думаю, если вдруг преподаватель станет вести себя как-то не так, то можно будет рассказать, откуда взялось решение.

Dionis_The_Great
Все-таки настаиваю на $n=\frac{n'\cdot N}{n'+N-1}$ во втором случае =))

 
 
 [ Сообщений: 15 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group