2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 Re: Статистика.
Сообщение11.05.2013, 00:26 
Аватара пользователя
Otta, я так понимаю, что для повторной выборки необходимый объем выборки вычисляется по формуле n=\displaystyle\frac{\omega(1-\omega)t^2}{\Delta^2}=81, т.е. тут не нужно знать объем генеральной совокупности,
а для бесповторной выборки формула такая: n=\displaystyle\frac{t^2\omega(1-\omega)N}{\Delta^2N+t^2\omega(1-\omega)}=76.

Здесь \omega=0.9, t=3, \Delta=0.1, N=1200.

 
 
 
 Re: Статистика.
Сообщение11.05.2013, 02:58 
Заметьте все же, что процент первой и второй выборки очень слабо различаются.
Это не сейчас и не я придумала, что при некоторых условиях бесповторностью выборки можно пренебречь.

Однако же вот что. Избавить от килограммов я Вас не смогу:), как Вы сами заметили, в граммах они приобретают совсем другое значение, а вот самый простой способ заменить доверительный интервал более точным следующий.

Интервал $|\omega -p|<t\sqrt{\omega(1-\omega)(1-r)/n}=\Delta$, где $r=n/N$, получен заменой параметра $p$ на его точечную оценку $\omega$ в $\Delta$. Исходно на этом месте стоит p, и с доверительной вероятностью $|\omega -p|<t\sqrt{p(1-p)(1-r)/n}$.

Решив это неравенство относительно $p$ (это реально), Вы получите некий диапазон, в котором $p$ содержится с исходной довер. вероятностью. Должен получиться хороший интервал.

 
 
 
 Re: Статистика.
Сообщение11.05.2013, 09:42 
Аватара пользователя
Otta в сообщении #722051 писал(а):
Ширина доверительного интервала тем больше, чем меньше объем выборки, то есть напрямую от него зависит. Значит, нам не все равно, какие именно фрукты мы покупали. Потому что если это арбузы, то объем выборки будет мал, а значит, разброс значений.велик, а если это смородина - наоборот. То есть при одном и том же уровне значимости у Вас получатся разные доверит. интервалы. Нужно именно количество выбранных фруктов. Или средняя масса каждого, поскольку здесь доверит. инт. все равно носит асимптотический характер.

Ерунду говорите. Объём выборки задан через процент. 1 кг это 1 штука в дискретном распределении.

 
 
 
 Re: Статистика.
Сообщение11.05.2013, 14:43 
Александрович в сообщении #722265 писал(а):
Ерунду говорите.

Возможно. Только объясните мне, какая сила нас заставила считать 1 кг 1 штукой. А не один грамм, например.

 
 
 
 Re: Статистика.
Сообщение11.05.2013, 16:24 
Asalex, я нашла решение похожей задачи тут. Они действительно за единицу выборки принимают единицу массы, причем ее выбор на их совести. Кажется, я поняла, в чем дело: я не обратила внимание на отсутствие слова математическая в названии Вашей темы. С точки зрения матстата это полный маразм.

Однако же интервалы с самого начала Вы считали именно так, как предлагается по ссылке, и именно такое дельта у Вас и получится. Хотите более точных оценок - пользуйтесь другими. Один способ я Вам написала, он в силе.

 
 
 
 Re: Статистика.
Сообщение12.05.2013, 00:16 
Аватара пользователя
Otta, похоже, что неравенство |\omega-p|<t\sqrt{\displaystyle{\frac{p(1-p)}{n}\left(1-\frac{n}{N}\right)}}, (обозначим его *), всегда дает интервалы, строго содержащиеся внутри интервала (0,1), и в этом его преимущество перед неравенством |\omega-p|<t\sqrt{\displaystyle{\frac{\omega(1-\omega)}{n}\left(1-\frac{n}{N}\right)}}. (обозначим его **)

В самом деле, решая первое неравенство, приходим к квадратному неравенству
\displaystyle p^2\left(1+\frac{t^2}{n}\left(1-\frac{n}{N}\right)\right)-\left(2\omega+\frac{t^2}{n}\left(1-\frac{n}{N}\right)\right)p+\omega^2<0.
Для корней p_1\leq p_2 этого квадратного трехчлена на основании теоремы Виета получаем, что p_1+p_2>0,\ \ p_1p_2>0, а отсюда делаем вывод что оба корня положительны: 0<p_1\leq p_2.
С другой стороны, делая замену переменных q=1+p, приходим к следующему квадратному неравенству: \displaystyle q^2\left(1+t^2\left(\frac{1}{n}-\frac{1}{N}\right)\right)+\left(2(1-\omega)+t^2\left(\frac{1}{n}-\frac{1}{N}\right)\right)q+(1-\omega)^2<0, и на основании той же теоремі Виета делаем вывод, что q_1q_2>0,\ \ q_1+q_2<0, и, значит, q_1\leq q_2<0.
Поскольку q_j=1+p_j, заключаем что 0<p_j<1, что и требовалось доказать.


С другой стороны, интервал для неравенства (**) не обязательно содержит интервал для неравенства (*), и вообще не обязан быть больше. Например, для значений параметров t=3, \ \ \omega=0.9,\ \  n=\frac{60}{m},\ \ m=0.3, \frac{n}{N}=0.05,
интервал для неравенства (*) ----- это \quad \ \  (0.820683, 0.946519),
а для неравенства (**) -- это интервал (0.837972, 0.962028).
Эти два интервала не вложены, и длина второго даже меньше длины первого интервала.

 
 
 
 Re: Статистика.
Сообщение12.05.2013, 01:02 
Приятное доказательство, спасибо.
Asalex в сообщении #722622 писал(а):
С другой стороны, интервал для неравенства (**) не обязательно содержит интервал для неравенства (*),

Это естественно, у них разные центры.
(**) получается из (*) отбрасыванием величин $t/n$ и $(t/n)^2$ в выражении для корней этого трехчлена в тех случаях, когда n велико и этими величинами можно пренебречь. Как раз и получится более известная асимптотическая формула.
А что касается ширины, тут сложнее. При отбрасывании каждый корень уменьшится как в числителе, так и в знаменателе, причем на величины одного порядка, так что результат может быть разным, действительно. Можно, при желании, посмотреть асимптотику.

 
 
 
 Re: Статистика.
Сообщение12.05.2013, 04:30 
Кстати, что интервал уменьшается при отбрасывании "несущественно" малых, необязательно хорошо. (Или обязательно нехорошо? - тоже интересно). Таким насильственным образом уменьшая погрешность оценки, мы, по идее, должны несколько терять в уровне надежности.

 
 
 
 Re: Статистика.
Сообщение13.05.2013, 01:14 
Аватара пользователя
Otta, спасибо Вам большое за помощь!!!

 
 
 
 Re: Статистика.
Сообщение13.05.2013, 01:28 
Да и Вам спасибо.

 
 
 [ Сообщений: 25 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group