2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Статистика, доверительная вероятность
Сообщение13.07.2016, 02:11 
Заслуженный участник
Аватара пользователя


01/03/06
13626
Москва
Первая часть задачи очень похожа на так называемые $2x2$ таблицы сопряженности признаков.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение13.07.2016, 13:45 


11/06/16
191
Спасибо, что помогаете разобраться!!!

По поводу первого пункта задачи.

В оффтопе условие задачи, чтобы не перелистывать

(Оффтоп)

Изображение

1) Есть ли основания полагать, что вероятность первого рождения ребенка для женщин возраста $\geqslant 30$ больше в группе case, чем в control на уровне значимости $5$%


Я понял, что один из вариантов через $p$-значение.

$H_0: p_1\geqslant p_2$ при $H_A: p_1<p_2$ через $p$-значение $P(Z\leqslant z)$

Хорошо, я понял, что нужно вычислить статистику:

$$z=\displaystyle\dfrac{\hat{p_1}-\hat{p_2}}{\sqrt{\frac{\hat{p_1}(1-\hat{p_1})}{n_1}+\frac{\hat{p_2}(1-\hat{p_2})}{n_2}}}$$

Правильно ли я понимаю, что $\hat{p_1}=\dfrac{648}{3220}$, а $\hat{p_2}=\dfrac{1498}{10245}$, $n_1=3220$, $n_2=10245$?

$p=0,05$, но какое распределение имеет $z$? Стандартное нормальное нужно брать или как? Вот этого я совсем не понял.

-- 13.07.2016, 13:53 --

У меня получилось значение статистики $z=6,98$, проверка

Пока что дальше не знаю, что делать, потому как не очевидно -- какое распределение нужно брать и как пользоваться $p$ значением, не уверен, что правильно выбрал выборочные доли.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение14.07.2016, 16:47 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
PWT в сообщении #1137609 писал(а):
Стандартное нормальное нужно брать или как?

$Z$ - стандартное нормальное. Чтобы пользоваться $p$-value (его часто так и пишут по-русски, не переводя), нужно знать, что это такое. Тогда, по идее, все вопросы должны сняться как-то сами собой.

Выборочные доли посчитаны, конечно, правильно. Разве там есть еще какие-то варианты?

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение15.07.2016, 00:41 


11/06/16
191
Спасибо!

По таблице для уровня значимости, находим $t=1,96$. Тогда, так как $6,98>1,96$, то значение $6,98$ попадает в критическую область, значит мы отклоняем $H_0$ с вероятностью $0,95$. Верно ли?

И еще, я не очень понял -- как строить доверительный интервал для доли. В книжках я читал про доверительный интервал для разностей долей, а тут просто для долей нужно, оказывается...


В оффтопе ерунда.

(Оффтоп)

$\varPhi(x)=\dfrac{1}{\sqrt{2\pi}}\displaystyle\int_{-\infty}^{x}e^{-\frac{t^2}{2}}\; dt$

$\varPhi(6,98)\approx 1$

Значит у нас гипотеза принимается.

Но как здесь участвует уровень значимости?

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение15.07.2016, 06:18 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
PWT в сообщении #1137901 писал(а):
Тогда, так как $6,98>1,96$, то значение $6,98$ попадает в критическую область, значит мы отклоняем $H_0$ с вероятностью $0,95$. Верно ли?

Можно подробней? И что такое p-value?

PWT в сообщении #1137901 писал(а):
И еще, я не очень понял -- как строить доверительный интервал для доли.

Совершенно типовая задача. Доверительный интервал для параметра $p$ в биномиальном (или Бернулли, смотря как ставить задачу) распределении. Уж это везде есть.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение15.07.2016, 11:28 


11/06/16
191
Спасибо!

В первом пункте уровень значимости $5$%, потому p-value будет $0,05$.

p-value -- это вероятность совершить ошибку первого рода (то есть вероятность ошибки при отклонении нулевой гипотезы).

В той книжке, что вы посоветовали, написано:

$H_0: p_1\geqslant p_2$ при $H_A: p_1<p_2$ через $p$-значение $P(Z\leqslant z)$

Из этого я понял, что нам нужно подумать над неравенством $P(Z\leqslant z)=0,95$

Далее, по таблице я нашел, что $z=1,96$, критическая область правосторонняя. Потому туда попадает значение $6,98$.

Это означает, что мы как раз отклоняем нулевую гипотезу.

Над вторым пунктом буду думать.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 13:58 


11/06/16
191
Видимо я написал что-то не так.

А по второму пункту так нужно делать?)

$w-\Delta<p<w+\Delta$, где $\Delta =\dfrac{z_{\alpha/2}\sqrt{w(1-w)}}{\sqrt{n}}$

$z_{\alpha/2}$ -- корень уравнения $\Phi(z_{\alpha/2})=\dfrac{1-\alpha}{2}$.

$\alpha=0,99$

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:01 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
PWT в сообщении #1138204 писал(а):
Видимо я написал что-то не так.

Вы не прочитали, что такое p-значение.

-- 16.07.2016, 16:02 --

PWT в сообщении #1138204 писал(а):
А по второму пункту так нужно делать?)

Можно и так, большой беды не будет.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:03 


11/06/16
191
$P$-значение это вероятность того, что случайная величина с данным распределением (распределением тестовой статистики при нулевой гипотезе) примет значение, не меньшее, чем фактическое значение тестовой статистики.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:12 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Это хорошо, но неинформативно. Прочитайте где-нибудь, какое это все отношение имеет к ошибке первого рода, когда гипотезу следует отвергнуть/принять и т.д.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:19 


11/06/16
191
PWT в сообщении #1137959 писал(а):

p-value -- это вероятность совершить ошибку первого рода (то есть вероятность ошибки при отклонении нулевой гипотезы).


А что нужно брать в качестве $w$ для доверительного интервала для доли? $\dfrac{683}{3220}$ или $\dfrac{1498}{10245}$ или $\dfrac{2181}{13465}$?

В оффтопе условие задачи, на всякий случай

(Оффтоп)

В медицинской литературе выдвигается гипотеза, что риск рака молочной железы возрастает, когда возраст матери на момент рождения первого ребенка увеличивается. Чтобы проверить эту гипотезу, провели исследование.
Были выделены 2 группы case и control.

Изображение

2) Постройте $99$% доверительный интервал для процента рождения первого ребенка в возрасте $\geqslant 30$.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 14:36 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
PWT в сообщении #1138211 писал(а):
p-value -- это вероятность совершить ошибку первого рода (то есть вероятность ошибки при отклонении нулевой гипотезы).

Это лучше, но тоже не вполне хорошо, потому, что Вы потом не знаете, куда это приткнуть, а когда притыкаете - оно оказывается не туда.

Есть два способа работы с гипотезами и уровнем значимости:
Способ первый:
Уровень значимости задан, ищем критическую область по заданному уровню значимости, смотрим, попала ли туда нужная статистика.
Способ второй:
Уровень значимости, вообще говоря, не задан. Мы можем сами найти наименьший уровень значимости, при котором нулевая гипотеза должна быть отвергнута. Это и есть p-value.

Потом (в случае, если уровень значимости все же известен), можно вернуться и посмотреть: а отвергать ли в результате нам гипотезу при таком уровне значимости или нет.

Но p-value сам по себе достаточно информативен, причем более информативен, чем изначально заданный фиксированный уровень значимости.

Вы мешаете оба способа в кучу, и добро бы Вы это делали осознанно, с пониманием происходящего, - тогда бы что-то и вышло путное. А так - не, не выходит.

В общем, давайте-ка придерживаться способа два.

-- 16.07.2016, 16:58 --

PWT в сообщении #1138211 писал(а):
для доверительного интервала для доли?

А Вы как думаете? Долю чего Вы оцениваете?

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 23:22 


11/06/16
191
Честно говоря я не очень понял второй способ, как там будут обстоять дела с критической областью?
Что мне лучше сделать? Просто не вижу -- как разобраться грамотно.

-- 16.07.2016, 23:24 --

Otta в сообщении #1138217 писал(а):
А Вы как думаете? Долю чего Вы оцениваете?

Думаю, что $\dfrac{2181}{13465}$. Потому как общее число женщин после 30 нужно разделить на общее число женщин.

 Профиль  
                  
 
 Re: Статистика, доверительная вероятность
Сообщение16.07.2016, 23:35 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
PWT в сообщении #1138312 писал(а):
Думаю, что $\dfrac{2181}{13465}$.

Ну и правильно.

А что касается первого вопроса - я вже не можу среди ночи его который раз разжевывать, да и не хочу. Прочитайте еще раз сами, что такое p-значение, осознайте. Осознайте, при каких уровнях значимости нулевая гипотеза должна отклоняться, если p-значение такое. Будет ли она отклоняться, если $\alpha=0.05$. Это нужно просто хорошо понять, прямо с уровня определений.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 29 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Mikhail_K


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group