2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Статистика, доверительная вероятность
Сообщение13.07.2016, 02:11 
Заслуженный участник
Аватара пользователя


01/03/06
13626
Москва
Первая часть задачи очень похожа на так называемые $2x2$ таблицы сопряженности признаков.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение13.07.2016, 13:45 


11/06/16
191
Спасибо, что помогаете разобраться!!!

По поводу первого пункта задачи.

В оффтопе условие задачи, чтобы не перелистывать

(Оффтоп)

Изображение

1) Есть ли основания полагать, что вероятность первого рождения ребенка для женщин возраста $\geqslant 30$ больше в группе case, чем в control на уровне значимости $5$%


Я понял, что один из вариантов через $p$-значение.

$H_0: p_1\geqslant p_2$ при $H_A: p_1<p_2$ через $p$-значение $P(Z\leqslant z)$

Хорошо, я понял, что нужно вычислить статистику:

$$z=\displaystyle\dfrac{\hat{p_1}-\hat{p_2}}{\sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n_1}+\frac{\hat{p_2}(1-\hat{p_2})}{n_2}}}$$

Правильно ли я понимаю, что $\hat{p_1}=\dfrac{648}{3220}$, а $\hat{p_2}=\dfrac{1498}{10245}$, $n_1=3220$, $n_2=10245$?

$p=0,05$, но какое распределение имеет $z$? Стандартное нормальное нужно брать или как? Вот этого я совсем не понял.

-- 13.07.2016, 13:53 --

У меня получилось значение статистики $z=6,98$, проверка

Пока что дальше не знаю, что делать, потому как не очевидно -- какое распределение нужно брать и как пользоваться $p$ значением, не уверен, что правильно выбрал выборочные доли.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение14.07.2016, 16:47 
Заслуженный участник


09/05/13
8904
PWT в сообщении #1137609 писал(а):
Стандартное нормальное нужно брать или как?

$Z$ - стандартное нормальное. Чтобы пользоваться $p$-value (его часто так и пишут по-русски, не переводя), нужно знать, что это такое. Тогда, по идее, все вопросы должны сняться как-то сами собой.

Выборочные доли посчитаны, конечно, правильно. Разве там есть еще какие-то варианты?

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение15.07.2016, 00:41 


11/06/16
191
Спасибо!

По таблице для уровня значимости, находим $t=1,96$. Тогда, так как $6,98>1,96$, то значение $6,98$ попадает в критическую область, значит мы отклоняем $H_0$ с вероятностью $0,95$. Верно ли?

И еще, я не очень понял -- как строить доверительный интервал для доли. В книжках я читал про доверительный интервал для разностей долей, а тут просто для долей нужно, оказывается...


В оффтопе ерунда.

(Оффтоп)

$\varPhi(x)=\dfrac{1}{\sqrt{2\pi}}\displaystyle\int_{-\infty}^{x}e^{-\frac{t^2}{2}}\; dt$

$\varPhi(6,98)\approx 1$

Значит у нас гипотеза принимается.

Но как здесь участвует уровень значимости?

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение15.07.2016, 06:18 
Заслуженный участник


09/05/13
8904
PWT в сообщении #1137901 писал(а):
Тогда, так как $6,98>1,96$, то значение $6,98$ попадает в критическую область, значит мы отклоняем $H_0$ с вероятностью $0,95$. Верно ли?

Можно подробней? И что такое p-value?

PWT в сообщении #1137901 писал(а):
И еще, я не очень понял -- как строить доверительный интервал для доли.

Совершенно типовая задача. Доверительный интервал для параметра $p$ в биномиальном (или Бернулли, смотря как ставить задачу) распределении. Уж это везде есть.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение15.07.2016, 11:28 


11/06/16
191
Спасибо!

В первом пункте уровень значимости $5$%, потому p-value будет $0,05$.

p-value -- это вероятность совершить ошибку первого рода (то есть вероятность ошибки при отклонении нулевой гипотезы).

В той книжке, что вы посоветовали, написано:

$H_0: p_1\geqslant p_2$ при $H_A: p_1<p_2$ через $p$-значение $P(Z\leqslant z)$

Из этого я понял, что нам нужно подумать над неравенством $P(Z\leqslant z)=0,95$

Далее, по таблице я нашел, что $z=1,96$, критическая область правосторонняя. Потому туда попадает значение $6,98$.

Это означает, что мы как раз отклоняем нулевую гипотезу.

Над вторым пунктом буду думать.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 13:58 


11/06/16
191
Видимо я написал что-то не так.

А по второму пункту так нужно делать?)

$w-\Delta<p<w+\Delta$, где $\Delta =\dfrac{z_{\alpha/2}\sqrt{w(1-w)}}{\sqrt{n}}$

$z_{\alpha/2}$ -- корень уравнения $\Phi(z_{\alpha/2})=\dfrac{1-\alpha}{2}$.

$\alpha=0,99$

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:01 
Заслуженный участник


09/05/13
8904
PWT в сообщении #1138204 писал(а):
Видимо я написал что-то не так.

Вы не прочитали, что такое p-значение.

-- 16.07.2016, 16:02 --

PWT в сообщении #1138204 писал(а):
А по второму пункту так нужно делать?)

Можно и так, большой беды не будет.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:03 


11/06/16
191
$P$-значение это вероятность того, что случайная величина с данным распределением (распределением тестовой статистики при нулевой гипотезе) примет значение, не меньшее, чем фактическое значение тестовой статистики.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:12 
Заслуженный участник


09/05/13
8904
Это хорошо, но неинформативно. Прочитайте где-нибудь, какое это все отношение имеет к ошибке первого рода, когда гипотезу следует отвергнуть/принять и т.д.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:19 


11/06/16
191
PWT в сообщении #1137959 писал(а):

p-value -- это вероятность совершить ошибку первого рода (то есть вероятность ошибки при отклонении нулевой гипотезы).


А что нужно брать в качестве $w$ для доверительного интервала для доли? $\dfrac{683}{3220}$ или $\dfrac{1498}{10245}$ или $\dfrac{2181}{13465}$?

В оффтопе условие задачи, на всякий случай

(Оффтоп)

В медицинской литературе выдвигается гипотеза, что риск рака молочной железы возрастает, когда возраст матери на момент рождения первого ребенка увеличивается. Чтобы проверить эту гипотезу, провели исследование.
Были выделены 2 группы case и control.

Изображение

2) Постройте $99$% доверительный интервал для процента рождения первого ребенка в возрасте $\geqslant 30$.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:36 
Заслуженный участник


09/05/13
8904
PWT в сообщении #1138211 писал(а):
p-value -- это вероятность совершить ошибку первого рода (то есть вероятность ошибки при отклонении нулевой гипотезы).

Это лучше, но тоже не вполне хорошо, потому, что Вы потом не знаете, куда это приткнуть, а когда притыкаете - оно оказывается не туда.

Есть два способа работы с гипотезами и уровнем значимости:
Способ первый:
Уровень значимости задан, ищем критическую область по заданному уровню значимости, смотрим, попала ли туда нужная статистика.
Способ второй:
Уровень значимости, вообще говоря, не задан. Мы можем сами найти наименьший уровень значимости, при котором нулевая гипотеза должна быть отвергнута. Это и есть p-value.

Потом (в случае, если уровень значимости все же известен), можно вернуться и посмотреть: а отвергать ли в результате нам гипотезу при таком уровне значимости или нет.

Но p-value сам по себе достаточно информативен, причем более информативен, чем изначально заданный фиксированный уровень значимости.

Вы мешаете оба способа в кучу, и добро бы Вы это делали осознанно, с пониманием происходящего, - тогда бы что-то и вышло путное. А так - не, не выходит.

В общем, давайте-ка придерживаться способа два.

-- 16.07.2016, 16:58 --

PWT в сообщении #1138211 писал(а):
для доверительного интервала для доли?

А Вы как думаете? Долю чего Вы оцениваете?

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 23:22 


11/06/16
191
Честно говоря я не очень понял второй способ, как там будут обстоять дела с критической областью?
Что мне лучше сделать? Просто не вижу -- как разобраться грамотно.

-- 16.07.2016, 23:24 --

Otta в сообщении #1138217 писал(а):
А Вы как думаете? Долю чего Вы оцениваете?

Думаю, что $\dfrac{2181}{13465}$. Потому как общее число женщин после 30 нужно разделить на общее число женщин.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 23:35 
Заслуженный участник


09/05/13
8904
PWT в сообщении #1138312 писал(а):
Думаю, что $\dfrac{2181}{13465}$.

Ну и правильно.

А что касается первого вопроса - я вже не можу среди ночи его который раз разжевывать, да и не хочу. Прочитайте еще раз сами, что такое p-значение, осознайте. Осознайте, при каких уровнях значимости нулевая гипотеза должна отклоняться, если p-значение такое. Будет ли она отклоняться, если $\alpha=0.05$. Это нужно просто хорошо понять, прямо с уровня определений.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 29 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group