2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Уровень значимости, доверительный интервал
Сообщение11.10.2012, 23:05 
В ходе опроса оценивалось влияние СМИ на воспитание детей. Один из вопросов звучал так: «Используете ли вы компьютер ежедневно?». Из выборки, содержащей $1090$ детей в возрасте $2-7$ лет, $283$ ребенка пользовались компьютером каждый день. Среди $2065$ опрошенных подростков в возрасте $8-18$ лет пользовались компьютером каждый день $1053$ человека.
1. Можно ли утверждать, что между долями детей и подростков, использующих компьютер ежедневно, существует значительная разница, если уровень значимости равен $0,05$?
2. Постройте $99%$-ый доверительный интервал, содержащий разность между долями детей и подростков, использующих компьютер ежедневно


1,2

Можно ли эти формулы использовать? А значительная разница когда начинается, как узнать?

w_1-w_2-\Delta<p_1-p_2<w_1-w_2+\Delta

\Delta=z_{\alpha/2}\sqrt{\dfrac{w_1(1-w_1)}{n_1}+\dfrac{w_2(1-w_2)}{n_2}}

 
 
 
 Re: Уровень значимости, доверительный интервал
Сообщение12.10.2012, 15:00 
Аватара пользователя
Andrei94 в сообщении #629721 писал(а):
Можно ли эти формулы использовать? А значительная разница когда начинается, как узнать?

Можно, разрешаю. Когда ноль не попадает в указанный доверительный интервал при соответствующем уровне доверия $1-0,05$.

 
 
 
 Re: Уровень значимости, доверительный интервал
Сообщение12.10.2012, 17:34 
Спасибо, просто странно, сложно провести мне грань между разницей и значительной разницей. Ведь, если ноль не попадает в интервал с вероятностью 0,95, то ведь разве значит ли это, что разница значительна?

 
 
 
 Re: Уровень значимости, доверительный интервал
Сообщение12.10.2012, 20:01 
Аватара пользователя
Истинные вероятности или одинаковы или не одинаковы. Непопадание нуля в интервал с уровнем доверия 0,95 означает, что наблюдаемые доли различаются настолько значимо, что критерий, который всего лишь в пяти процентах случаев видит различие там, где его нет, различие заметил.

Вам следует с самого начала понять устройство критериев согласия: Вы не понимаете, откуда они берутся, вот и все проблемы. Общую теорию лень писать, да и написано уже всюду, поэтому на данном примере.

Есть две независимые выборки с объёмами $n_1$ и $n_2$ из распределений Бернулли с параметрами $p_1$ и $p_2$ (вероятностями успеха). Требуется проверить гипотезу $H_0: p_1=p_2$ при альтернативе $p_1\neq p_2$. По выборкам посчитаны количества успехов $m_1$ и $m_2$ и частоты $w_1=\frac{m_1}{n_1}$ и $w_2=\frac{m_2}{n_2}$ .

Поскольку по закону больших чисел частота $w_1$$w_2$) с ростом $n_1$ (соответственно, $n_2$) приближается в любом вероятностном смысле к своей вероятности успеха $p_1$ (соответственно, $p_2$), то существенная разница между $w_1$ и $w_2$ свидетельствует в пользу альтернативы.

Возникает вопрос: что есть существенная разница? Заранее зададимся числом $\alpha$ таким, что событие вероятности $\alpha$ или меньшей считается маловероятным. Предположим, что мы нашли такую границу $c$, что при верной основной гипотезе (при равных вероятностях) очень маловероятно будет увидеть разницу частот, превышающую $c$. Иначе говоря, хотим, чтобы $\mathsf P_{H_0}(|w_1-w_2|>c) = \alpha$.

Осталось найти такую границу. Для этого следует данную вероятность свести к какому-то известному распределению. Разницу $w_1-w-2$ можно нормировать и центрировать, получив, что распределение дроби
$$\dfrac{w_1-w_2 - (p_1-p_2)}{\sqrt{\dfrac{w_1(1-w_1)}{n_1}+\dfrac{w_2(1-w_2)}{n_2}}}$$
при больших $n_1$ и $n_2$ близко к стандартному нормальному. Поэтому можно взять такую точку $z_{\alpha/2}$, что $\mathsf P(|X|>z_{\alpha/2})=\alpha$, где $X$ имеет стандартное нормальное распределение. Если рассматривать эту дробь при верной основной гипотезе $p_1=p_2$, то разность вероятностей из числителя уходит.

Таким образом, можно считать, что при верной основной гипотезе событие $$\dfrac{|w_1-w_2|}{\sqrt{\dfrac{w_1(1-w_1)}{n_1}+\dfrac{w_2(1-w_2)}{n_2}}} > z_{\alpha/2}$$ имеет вероятность (близкую к) $\alpha$ и означает, что разница частот значительна. Это как раз событие, означающее, что $$|w_1-w_2|>z_{\alpha/2}\sqrt{\dfrac{w_1(1-w_1)}{n_1}+\dfrac{w_2(1-w_2)}{n_2}}.$$ Или что ноль ($0=p_1-p_2$) не попадает в Ваш доверительный интервал, если в его терминах рассуждать.

 
 
 
 Re: Уровень значимости, доверительный интервал
Сообщение12.10.2012, 21:03 
Спасибо, что так все подробно объяснили! Походу все понял, кроме одного - почему $S^2=S_1^2+S_2^2$? То есть почему складываются дисперсии? (наверное, странный вопрос)

$S_1^2=\dfrac{w_1(1-w_1)}{n_1}\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;S_2^2=\dfrac{w_2(1-w_2)}{n_2}$

 
 
 
 Re: Уровень значимости, доверительный интервал
Сообщение12.10.2012, 21:34 
Аватара пользователя
Правильный вопрос. Дисперсия суммы независимых случайных величин равна сумме дисперсий: $\mathsf D(X+Y)=\mathsf DX+\mathsf DY$, для разности таких же величин следует воспользоваться ещё и свойством $\mathsf D(cX)=c^2\mathsf DX$. Из-за этого свойства
$$\mathsf D(X-Y)=\mathsf D(X+(-1)\cdot Y) = \mathsf DX + \mathsf D(-1\cdot Y) = \mathsf DX + (-1)^2 \mathsf DY = \mathsf DX + \mathsf DY.$$

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group