2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 Задача по статистике, есть вопросы
Сообщение18.10.2012, 00:10 


23/09/12
180
Помогите, пожалуйста, ответить на несколько вопросов в задаче, которые не дают не покоя...

Опрос $187$ участников конференции «Деловая женщина» показал, что $133$ участницы имели по крайней мере одного ребенка. Предположим, что группа $187$ женщин представляет собой случайную выборку из генеральной совокупности всех деловых женщин, достигших успеха.
1. Чему равна выборочная доля деловых женщин, имеющих детей?
2. Можно ли утверждать, что более половины деловых женщин, достигших успеха, не имеют детей, если уровень значимости равен $0,05$?
3. Можно ли утверждать, что более двух третей деловых женщин, достигших успеха, имеют детей, если уровень значимости равен $0,05$?

Первый пункт, вроде как - легкий, а вот второй и третий -- сомневаюсь.

1. $w_1=\dfrac{133}{187}$

2. А как узнать -- можно ли утверждать? Можно ли построить доверительный интервал для генеральной доли $w_2+\delta\le\w_2+\delta$ или нужно проверять гипотезу $H_0: p_1>0,5\;\;\;\;\;\;\;\;\;H_1:p_\le 0,5$
$w_2=\dfrac{44}{187}$

По какой таблице смотреть критические точки? Лапласа или Стьюдента? Как научиться находить в задачах зацепки, которые позволяют сразу понять -- какие таблицы использовать?

3. Тут, похоже, почти тоже самое, что и во втором пункте

 Профиль  
                  
 
 Re: Задача по статистике, есть вопросы
Сообщение18.10.2012, 10:14 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Если и строить интервал для теоретической вероятности, то либо односторонний, либо двусторонний вдвое большего уровня доверия, потому как гипотеза односторонняя.

Во второй задаче, если $p$ - вероятность не иметь детей, соответственно $w_2$ - доля таковых в выборке, и гипотезы $H_0=\{p>0,5\}$ и $H_1=\{p\leqslant 0,5\}$, критерий должен принимать основную гипотезу, если $w_2>C$, и альтернативу, когда $w_2\leqslant C$, причём $C$ таково, чтобы вероятность ошибки первого рода была примерно равна $0,05$. Ошибка первого рода есть вероятность при $p>0,5$ получить в идеальной (а не реальной) выборке $w_2\leqslant C$. Самое большое значение эта вероятность ошибки достигает при нижней грани всех возможных $p>0,5$, т.е. при $p=0,5$. Поэтому нам нужно, чтобы $\mathsf P_{p=0,5}(w_2 < C)\approx 0,05$.

По интегральной теореме Лапласа величина $\sqrt{n}\dfrac{w_2-p}{\sqrt{p(1-p)}}=\sqrt{n}\dfrac{w_2-0,5}{\sqrt{0,5\cdot (1-0,5)}}$ имеет распределение, близкое к стандартному нормальному. Чтобы вероятность неравенства $w_2< C$ при $p=0,5$ примерно равнялась $0,05$, нужно, чтобы $\sqrt{n}\dfrac{w_2-0,5}{\sqrt{0,5\cdot (1-0,5)}} < \tau_{0,05}=-\tau_{0,95}$.
Окончательно получаем критическую область $w_2 < 0,5 - \tau_{0,95}\dfrac{\sqrt{0,5\cdot(1-0,5)}}{\sqrt{n}}$ - в этой области принимается альтернатива $H_1$.

Квантиль уровня $0,95$ для нормального распределения есть $1,64$. Вот и сравните эту область с доверительным интервалом.

Можно было при таком небольшом числе испытаний воспользоваться Excel для нахождения границы $C$, для которой $\mathsf P_{p=0,5}(w_2< C)\leqslant 0,05$. Просто подбором находим такое число успехов С, что BINOMRASP($C$; $187$; $0,5$; $1$) чуть превышает $0,05$ (это вероятность события $w_2\leqslant C$), а в точке $C-1$ уже меньше $0,05$. Должно получиться $C=82$. Почти то же самое, но проще.

А распределению Стьюдента тут неоткуда взяться.

 Профиль  
                  
 
 Re: Задача по статистике, есть вопросы
Сообщение18.10.2012, 15:37 


23/09/12
180
--mS-- в сообщении #632368 писал(а):
Если и строить интервал для теоретической вероятности, то либо односторонний, либо двусторонний вдвое большего уровня доверия, потому как гипотеза односторонняя.

Во второй задаче, если $p$ - вероятность не иметь детей, соответственно $w_2$ - доля таковых в выборке, и гипотезы $H_0=\{p>0,5\}$ и $H_1=\{p\leqslant 0,5\}$, критерий должен принимать основную гипотезу, если $w_2>C$, и альтернативу, когда $w_2\leqslant C$, причём $C$ таково, чтобы вероятность ошибки первого рода была примерно равна $0,05$. Ошибка первого рода есть вероятность при $p>0,5$ получить в идеальной (а не реальной) выборке $w_2\leqslant C$. Самое большое значение эта вероятность ошибки достигает при нижней грани всех возможных $p>0,5$, т.е. при $p=0,5$. Поэтому нам нужно, чтобы $\mathsf P_{p=0,5}(w_2 < C)\approx 0,05$.

По интегральной теореме Лапласа величина $\sqrt{n}\dfrac{w_2-p}{\sqrt{p(1-p)}}=\sqrt{n}\dfrac{w_2-0,5}{\sqrt{0,5\cdot (1-0,5)}}$ имеет распределение, близкое к стандартному нормальному. Чтобы вероятность неравенства $w_2< C$ при $p=0,5$ примерно равнялась $0,05$, нужно, чтобы $\sqrt{n}\dfrac{w_2-0,5}{\sqrt{0,5\cdot (1-0,5)}} < \tau_{0,05}=-\tau_{0,95}$.
Окончательно получаем критическую область $w_2 < 0,5 - \tau_{0,95}\dfrac{\sqrt{0,5\cdot(1-0,5)}}{\sqrt{n}}$ - в этой области принимается альтернатива $H_1$.

Квантиль уровня $0,95$ для нормального распределения есть $1,64$. Вот и сравните эту область с доверительным интервалом.

Можно было при таком небольшом числе испытаний воспользоваться Excel для нахождения границы $C$, для которой $\mathsf P_{p=0,5}(w_2< C)\leqslant 0,05$. Просто подбором находим такое число успехов С, что BINOMRASP($C$; $187$; $0,5$; $1$) чуть превышает $0,05$ (это вероятность события $w_2\leqslant C$), а в точке $C-1$ уже меньше $0,05$. Должно получиться $C=82$. Почти то же самое, но проще.

А распределению Стьюдента тут неоткуда взяться.


Спасибо :-) У меня получилось вот так:

2) Здесь посчитал, как вы описали, если $p$ - вероятность не иметь детей, соответственно $w_2$. Значение критерия $U_{\text{набл}}=-5,77705<-\tau_{0,95}=-1,64$, значит мы отвергаем основную гипотезу, принимаем альтернативную.

3) $p$ - вероятность иметь детей, доля в выборке $w_1$

Значение критерия $U_{\text{набл}}=1,29>-\tau_{0,95}=-1,64$, значит мы принимаем основную гипотезу, отвергаем альтернативную.

 Профиль  
                  
 
 Re: Задача по статистике, есть вопросы
Сообщение18.10.2012, 16:13 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Совершенно верно. Во втором случае можно было ничего и не считать, потому что $133/187 > 2/3$, а в критическую область попадают только значения $w_1$, значимо меньшие, чем $2/3$.

 Профиль  
                  
 
 Re: Задача по статистике, есть вопросы
Сообщение18.10.2012, 16:27 


23/09/12
180
--mS-- в сообщении #632467 писал(а):
Совершенно верно. Во втором случае можно было ничего и не считать, потому что $133/187 > 2/3$, а в критическую область попадают только значения $w_1$, значимо меньшие, чем $2/3$.

Спасибо большое!
Только я еще строил интервальные оценки для вероятности.

Спасибо, я еще построил интервальные оценки для вероятности:

2) Во втором пункте получилось, что $0,223814489<p<0,353725618$. Где $p$ - вероятность успешной женщине не иметь детей. Явно, что этот интервал не пересекается с интервалом $0,5<p\le 1$

3) Во третьем пункте получилось, что $0,646274382<p<0,776185511$. $p$ -вероятность иметь детей успешной женщине.Этот интервал пересекается с интервалом $0,(6)<p\le 1$
Говорит ли это пересечение о чем-либо в смысле ответа на вопрос третьего пункта?

============================
Еще пару вопросов по excel

1) Можно ли как-то в экселе находить значения критических точек $u_{\text{кр}}$ по значениям функции Лапласа $\Phi(u_{\text{кр}})$

2) Мне сказали, что в экселе есть где-то волшебная кнопка Data Analysis, вот только не могу найти ее...(эта функция сразу высчитывает среднее, отклонения итп)

 Профиль  
                  
 
 Re: Задача по статистике, есть вопросы
Сообщение18.10.2012, 17:09 
Заслуженный участник
Аватара пользователя


23/11/06
4171
champion12 в сообщении #632472 писал(а):
Говорит ли это пересечение о чем-либо в смысле ответа на вопрос третьего пункта?


Нет. Прочтите, пожалуйста, первую фразу моего ответа выше. Если Вы возьмёте уровень доверия вдвое больший, Вы получите доверительный интервал, левая граница которого есть $$w_2 -  \tau_{0,95}\sqrt{w_2(1-w_2)}/\sqrt{n}$$ (или $w_1-\ldots$), а у нашей критической области граница $$w_2-\tau_{0,95}\sqrt{p_0(1-p_0)}/\sqrt{n}$$ (или $w_1-\ldots$).
В силу того, что при $p=p_0$ величина $w_2$ (соответственно, $w_1$) есть состоятельная оценка для $p_0$, размер этих двух критериев будет при больших $n$ одинаков. Хотя численно область будет и иная.

champion12 в сообщении #632472 писал(а):
1) Можно ли как-то в экселе находить значения критических точек $u_{\text{кр}}$ по значениям функции Лапласа $\Phi(u_{\text{кр}})$

2) Мне сказали, что в экселе есть где-то волшебная кнопка Data Analysis, вот только не могу найти ее...(эта функция сразу высчитывает среднее, отклонения итп)


1) Разумеется, есть. Не знаю, что Вы называете функцией Лапласа (тут много вариантов), поэтому см. функцию НОРМСТОБР.
2) Тут не помогу, Excel'я у меня нет. Поищите в гугле "excel надстройка пакет анализа".

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 6 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group