2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Проверка гипотез о равенстве
Сообщение17.01.2013, 14:24 
Дамы и Господа! Возник такой вопрос – как связаны интервальные оценки параметров распределений с проверками гипотез об их равенстве? Для гипотез о равенстве параметра заданному значению все ясно: если это заданное значение попадает в $\alpha$-процентный доверительный интервал, то гипотеза о равенстве принимается на уровне значимости $1- \alpha$, если не попадает, то гипотеза отвергается на том же уровне значимости. Т.е. существует прямая связь между вероятностью доверительного интервала и уровнем значимости проверки гипотезы. Существует ли подобная связь для гипотез о равенстве двух оцениваемых параметров (средних, дисперсий)? Например, есть две выборки, взятые из нормальных распределений с дисперсиями $\sigma ^2$, объемами $n_X$ и $n_Y$. Тогда средние арифметические $\bar x$ и $\bar y$ будут подчинятся нормальным распределениям с центрами $a_X$ и $a_Y$ (истинными центрами), и дисперсиями $\frac{\sigma ^2}{n_X}$ и $\frac{\sigma ^2}{n_Y}$, из чего можно построить интервальные оценки для истинных центров $a_X$ и $a_Y$. При равенстве истинных центров $a_X= a_Y$ статистика $\frac {\bar x - \bar y }{\sigma } \sqrt {\frac {n_X n_Y}{ n_X + n_Y }}$ подчиняется нормальному распределению с центром 0 и дисперсией 1. Как связаны интервальные оценки истинных центров и гипотеза об их равенстве?

 
 
 
 Re: Проверка гипотез о равенстве
Сообщение17.01.2013, 15:59 
Аватара пользователя
Ну, связать можно, конечно :-)

Если пользоваться статистикой $\dfrac{\overline x-\overline y}{\sigma}\sqrt{\dfrac{n_Xn_Y}{n_X+n_Y}}\sim \textrm N_{0,1}$, то критическая область при проверке гипотезы $a_X=a_Y$ критерия размера $\varepsilon$ равна
$$|\overline x-\overline y| >\sigma \tau_{1-\varepsilon/2}\sqrt{\dfrac{n_X+n_Y}{n_Xn_Y}},$$
где $\tau_{1-\varepsilon/2}$ - квантиль стандартного нормального распределения уровня $1-\varepsilon/2$.

Если строить критерий для проверки той же гипотезы основываясь на том, пересекаются или нет доверительные интервалы (например, одного и того же уровня $1-\delta$) для матожиданий, то критическая область будет такой:
$$|\overline x-\overline y| >\sigma \tau_{1-\delta/2}\left(\dfrac{1}{\sqrt{n_X}}+\dfrac{1}{\sqrt{n_Y}}\right)= \sigma \tau_{1-\delta/2}\dfrac{\sqrt{n_X}+\sqrt{n_Y}}{\sqrt{n_Xn_Y}}.$$
Если мы хотим получить критерий размера $\varepsilon$, следует брать $\delta$ таким, чтобы
$$\tau_{1-\delta/2}\dfrac{\sqrt{n_X}+\sqrt{n_Y}}{\sqrt{n_Xn_Y}} = \tau_{1-\varepsilon/2}\sqrt{\dfrac{n_X+n_Y}{n_Xn_Y}},$$
т.е. $$\tau_{1-\delta/2} = \dfrac{\sqrt{n_X+n_Y}}{\sqrt{n_X}+\sqrt{n_Y}}\tau_{1-\varepsilon/2}.$$

 
 
 
 Re: Проверка гипотез о равенстве
Сообщение19.02.2013, 13:31 
Да, действительно забавно. Получается, что при равных объемах выборок если 83%-ные доверительные интервалы пересекаются, то гипотеза о равенстве принимается на 5%-ном уровне значимости. А если 93%-ные интервалы не пересекаются, то гипотезу о равенстве можно отвергнуть на 1%-ном уровне. Навскидку цифры никак не связаны. Только в пределе при $n_X \gg n_Y$ или $n_X \ll n_Y$ будет равенство $\varepsilon=\delta$, но это понятно. А при небольших различиях, видя только графики с доверительными интервалами, сразу и не сообразишь, равны средние или не равны.

 
 
 [ Сообщений: 3 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group