2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Статистика.
Сообщение11.05.2013, 00:26 
Аватара пользователя


02/07/07
163
Харьков
Otta, я так понимаю, что для повторной выборки необходимый объем выборки вычисляется по формуле n=\displaystyle\frac{\omega(1-\omega)t^2}{\Delta^2}=81, т.е. тут не нужно знать объем генеральной совокупности,
а для бесповторной выборки формула такая: n=\displaystyle\frac{t^2\omega(1-\omega)N}{\Delta^2N+t^2\omega(1-\omega)}=76.

Здесь \omega=0.9, t=3, \Delta=0.1, N=1200.

 Профиль  
                  
 
 Re: Статистика.
Сообщение11.05.2013, 02:58 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Заметьте все же, что процент первой и второй выборки очень слабо различаются.
Это не сейчас и не я придумала, что при некоторых условиях бесповторностью выборки можно пренебречь.

Однако же вот что. Избавить от килограммов я Вас не смогу:), как Вы сами заметили, в граммах они приобретают совсем другое значение, а вот самый простой способ заменить доверительный интервал более точным следующий.

Интервал $|\omega -p|<t\sqrt{\omega(1-\omega)(1-r)/n}=\Delta$, где $r=n/N$, получен заменой параметра $p$ на его точечную оценку $\omega$ в $\Delta$. Исходно на этом месте стоит p, и с доверительной вероятностью $|\omega -p|<t\sqrt{p(1-p)(1-r)/n}$.

Решив это неравенство относительно $p$ (это реально), Вы получите некий диапазон, в котором $p$ содержится с исходной довер. вероятностью. Должен получиться хороший интервал.

 Профиль  
                  
 
 Re: Статистика.
Сообщение11.05.2013, 09:42 
Аватара пользователя


21/01/09
3925
Дивногорск
Otta в сообщении #722051 писал(а):
Ширина доверительного интервала тем больше, чем меньше объем выборки, то есть напрямую от него зависит. Значит, нам не все равно, какие именно фрукты мы покупали. Потому что если это арбузы, то объем выборки будет мал, а значит, разброс значений.велик, а если это смородина - наоборот. То есть при одном и том же уровне значимости у Вас получатся разные доверит. интервалы. Нужно именно количество выбранных фруктов. Или средняя масса каждого, поскольку здесь доверит. инт. все равно носит асимптотический характер.

Ерунду говорите. Объём выборки задан через процент. 1 кг это 1 штука в дискретном распределении.

 Профиль  
                  
 
 Re: Статистика.
Сообщение11.05.2013, 14:43 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Александрович в сообщении #722265 писал(а):
Ерунду говорите.

Возможно. Только объясните мне, какая сила нас заставила считать 1 кг 1 штукой. А не один грамм, например.

 Профиль  
                  
 
 Re: Статистика.
Сообщение11.05.2013, 16:24 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Asalex, я нашла решение похожей задачи тут. Они действительно за единицу выборки принимают единицу массы, причем ее выбор на их совести. Кажется, я поняла, в чем дело: я не обратила внимание на отсутствие слова математическая в названии Вашей темы. С точки зрения матстата это полный маразм.

Однако же интервалы с самого начала Вы считали именно так, как предлагается по ссылке, и именно такое дельта у Вас и получится. Хотите более точных оценок - пользуйтесь другими. Один способ я Вам написала, он в силе.

 Профиль  
                  
 
 Re: Статистика.
Сообщение12.05.2013, 00:16 
Аватара пользователя


02/07/07
163
Харьков
Otta, похоже, что неравенство |\omega-p|<t\sqrt{\displaystyle{\frac{p(1-p)}{n}\left(1-\frac{n}{N}\right)}}, (обозначим его *), всегда дает интервалы, строго содержащиеся внутри интервала (0,1), и в этом его преимущество перед неравенством |\omega-p|<t\sqrt{\displaystyle{\frac{\omega(1-\omega)}{n}\left(1-\frac{n}{N}\right)}}. (обозначим его **)

В самом деле, решая первое неравенство, приходим к квадратному неравенству
\displaystyle p^2\left(1+\frac{t^2}{n}\left(1-\frac{n}{N}\right)\right)-\left(2\omega+\frac{t^2}{n}\left(1-\frac{n}{N}\right)\right)p+\omega^2<0.
Для корней p_1\leq p_2 этого квадратного трехчлена на основании теоремы Виета получаем, что p_1+p_2>0,\ \ p_1p_2>0, а отсюда делаем вывод что оба корня положительны: 0<p_1\leq p_2.
С другой стороны, делая замену переменных q=1+p, приходим к следующему квадратному неравенству: \displaystyle q^2\left(1+t^2\left(\frac{1}{n}-\frac{1}{N}\right)\right)+\left(2(1-\omega)+t^2\left(\frac{1}{n}-\frac{1}{N}\right)\right)q+(1-\omega)^2<0, и на основании той же теоремі Виета делаем вывод, что q_1q_2>0,\ \ q_1+q_2<0, и, значит, q_1\leq q_2<0.
Поскольку q_j=1+p_j, заключаем что 0<p_j<1, что и требовалось доказать.


С другой стороны, интервал для неравенства (**) не обязательно содержит интервал для неравенства (*), и вообще не обязан быть больше. Например, для значений параметров t=3, \ \ \omega=0.9,\ \  n=\frac{60}{m},\ \ m=0.3, \frac{n}{N}=0.05,
интервал для неравенства (*) ----- это \quad \ \  (0.820683, 0.946519),
а для неравенства (**) -- это интервал (0.837972, 0.962028).
Эти два интервала не вложены, и длина второго даже меньше длины первого интервала.

 Профиль  
                  
 
 Re: Статистика.
Сообщение12.05.2013, 01:02 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Приятное доказательство, спасибо.
Asalex в сообщении #722622 писал(а):
С другой стороны, интервал для неравенства (**) не обязательно содержит интервал для неравенства (*),

Это естественно, у них разные центры.
(**) получается из (*) отбрасыванием величин $t/n$ и $(t/n)^2$ в выражении для корней этого трехчлена в тех случаях, когда n велико и этими величинами можно пренебречь. Как раз и получится более известная асимптотическая формула.
А что касается ширины, тут сложнее. При отбрасывании каждый корень уменьшится как в числителе, так и в знаменателе, причем на величины одного порядка, так что результат может быть разным, действительно. Можно, при желании, посмотреть асимптотику.

 Профиль  
                  
 
 Re: Статистика.
Сообщение12.05.2013, 04:30 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Кстати, что интервал уменьшается при отбрасывании "несущественно" малых, необязательно хорошо. (Или обязательно нехорошо? - тоже интересно). Таким насильственным образом уменьшая погрешность оценки, мы, по идее, должны несколько терять в уровне надежности.

 Профиль  
                  
 
 Re: Статистика.
Сообщение13.05.2013, 01:14 
Аватара пользователя


02/07/07
163
Харьков
Otta, спасибо Вам большое за помощь!!!

 Профиль  
                  
 
 Re: Статистика.
Сообщение13.05.2013, 01:28 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Да и Вам спасибо.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 25 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group