2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 стат. гипотеза о вероятности успеха в испытаниях
Сообщение20.08.2009, 15:19 
Здравствуйте!
Не подскажите как решить такую задачу по статистике: проведено $n_1$ испытаний, из них $m_1$ оказались успешными, также были проведены $n_2$ других испытаний и $m_2$ из них были успешными. Как провирить стат. гипотезу, что вероятность успеха во втором случае выше чем в первом.

 
 
 
 Re: стат. гипотеза
Сообщение20.08.2009, 22:20 
Аватара пользователя
Обычно постановка звучит как-то так:основная гипотеза -- $p_1 = p_2$, альтернатива -- $p_1>p_2$.

Тут, как я понимаю: основная гипотеза -- $p_1 < p_2$, альтернатива -- $p_1\ge p_2$.

Откровенно говоря, вообще не представляю, как такое решать.

 
 
 
 Re: стат. гипотеза
Сообщение21.08.2009, 10:43 
Здравствуйте!
Не могли бы вы проверить ход рассуждений.
Допустим у нас есть две сл.в. $X, Y$ удовлетворяющие биномиальным распределениям, $B(n_1, p_1)$ и $B(n_2, p_2)$, где $p_1=\frac{m_1}{n_1}, p_2 = \frac{m_2}{n_2}, p_2 > p_1$ с вероятностями $P_1, P_2$ соответственно. И два независимых испытания с результатами $m_1$ из $n_1$ , $m_2$ из $n_2$. В случае когда испытания имеют одинаковую вероятность успеха, то или второе испытание подчиняется первому распределению, либо первое испытание подчиняется второму распределению. Зададим квантиль $\alpha$, находим область принятия гипотезы, такое $L$, что $P_1(X < L) < \alpha < P_1(X < L+1)$, т.е вероятность ошибки что второе испытание подчиняется первому рспределению $\sigma_1 =P_1(X \in [L+1, \infty])$, и наоборот $\sigma_2 = P_2(Y \in [0, L])$. Если $m_2 > L$ то данная гипотеза не выполняется и значит вероятность успеха во втором случае выше чем в первом с вероятностью $1-\sigma_1-\sigma_2$.

 
 
 
 Re: стат. гипотеза
Сообщение21.08.2009, 11:46 
Аватара пользователя
Это так, но не совсем так.

Вместо случайных величин с биномиальным распределением надо говорить о выборках из распределения Бернулли. Казалось бы, какая разница, но для статистики существенная. Ваша формулировка не статистическая.

Далее, это:
Цитата:
$p_1=\frac{m_1}{n_1}, p_2 = \frac{m_2}{n_2}$
ересь.

Теперь, статистика критерия должна быть одна, а у Вас две: $X$ и $Y$. Можно взять что-то вроде
$\frac{m_1 n_2}{m_2 n_1}$.

Получившийся критерий не будет состоятельным, ну и черт с ним, в этой постановке не может быть состоятельного критерия.

 
 
 
 Re: стат. гипотеза
Сообщение21.08.2009, 11:59 
droid в сообщении #236679 писал(а):
Теперь, статистика критерия должна быть одна, а у Вас две: $X$ и $Y$. Можно взять что-то вроде
$\frac{m_1 n_2}{m_2 n_1}$.

А какое распределение будет у этой статистики?
Хорхе в сообщении #236603 писал(а):
Обычно постановка звучит как-то так:основная гипотеза -- $p_1 = p_2$, альтернатива -- $p_1>p_2$

Никак не пойму как можно проверить эту стат. гипотезу при произвольных $p_1, p_2$

 
 
 
 Re: стат. гипотеза
Сообщение21.08.2009, 13:54 
Аватара пользователя
Хорхе в сообщении #236603 писал(а):
Обычно постановка звучит как-то так:основная гипотеза -- $p_1 = p_2$, альтернатива -- $p_1>p_2$.

Тут, как я понимаю: основная гипотеза -- $p_1 < p_2$, альтернатива -- $p_1\ge p_2$.

Откровенно говоря, вообще не представляю, как такое решать.

Скорее, мне кажется, нужно рассматривать простую основную гипотезу $p_1=p_2$, а в качестве желаемой альтернативы брать $p_2>p_1$. Например, строить критерий заданного асимптотического размера, основанный на статистике $$\rho(\vec X, \vec Y)=\dfrac{\frac{m_1}{n_1} - \frac{m_2}{n_2}}{\sqrt{\frac{m_1+m_2}{n_1+n_2}\left(1-\frac{m_1+m_2}{n_1+n_2}\right)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.$$ При верной основной гипотезе её распределение сходится к стандартному нормальному, и можно задавать левостороннюю критическую область $\rho < \tau_\alpha$, где $\tau_\alpha$ - квантиль уровня $\alpha$ стандартного нормального распределения.

 
 
 
 Re: стат. гипотеза
Сообщение21.08.2009, 14:04 
--mS-- в сообщении #236744 писал(а):
Например, строить критерий заданного асимптотического размера, основанный на статистике $$\rho(\vec X, \vec Y)=\dfrac{\frac{m_1}{n_1} - \frac{m_2}{n_2}}{\sqrt{\frac{m_1+m_2}{n_1+n_2}\left(1-\frac{m_1+m_2}{n_1+n_2}\right)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.$$

А где можно про эту статистику прочесть(с доказательствами).

 
 
 
 Re: стат. гипотеза
Сообщение21.08.2009, 18:33 
Аватара пользователя
droid в сообщении #236746 писал(а):
--mS-- в сообщении #236744 писал(а):
Например, строить критерий заданного асимптотического размера, основанный на статистике $$\rho(\vec X, \vec Y)=\dfrac{\frac{m_1}{n_1} - \frac{m_2}{n_2}}{\sqrt{\frac{m_1+m_2}{n_1+n_2}\left(1-\frac{m_1+m_2}{n_1+n_2}\right)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.$$

А где можно про эту статистику прочесть(с доказательствами).

Точно не скажу. Эта статистика (квадрат её) используется в критерии $\chi^2$ для проверки однородности двух выборок по двум интервалам группировки. Например, Г.И.Ивченко, Ю.И.Медведев "Математическая статистика", параграф 3.4. Однако доказательства там нет. Грубо говоря, для двух независимых бернуллиевских выборок с одним и тем же параметром $p$ распределения величин $\dfrac{\frac{m_1}{n_1} - p}{\sqrt{p (1-p)}}$ и $\dfrac{\frac{m_2}{n_2} - p}{\sqrt{p (1-p)}}$ при $n_1,\; n_2 \to \infty$ аппроксимируется нормальными соответственно $N(0, \frac{1}{n_1})$ и $N(0, \frac{1}{n_2})$.
Если вместо $p$ в знаменателях взять состоятельную оценку $p^*=\dfrac{m_1+m_2}{n_1+n_2}$, вычесть друг из друга дроби $\dfrac{\frac{m_1}{n_1} - p}{\sqrt{p^* (1-p^*)}}$ и $\dfrac{\frac{m_2}{n_2} - p}{\sqrt{p^* (1-p^*)}}$, то разность имеет распределение, близкое к $N(0, \frac{1}{n_1}+\frac{1}{n_2})$. Осталось на корень из дисперсии поделить, и получится $\rho$, распределение которой при любом стремлении $n_1,\; n_2 \to \infty$ приближается к стандартному нормальному.

Если кто знает, как это корректно и просто доказать, напишите, плз. Туплю.

На самом деле критериев-то много предложить можно, в том числе и просто очевидный критерий для проверки _основной_ гипотезы $p_1 < p_2$, которая будет приниматься, если $\dfrac{m_1}{n_1} < \dfrac{m_2}{n_2}$ и отвергаться в противном случае. Такой критерий годится? Ведь слова "проверить гипотезу" сами по себе ничего не означают, покуда не сформулировано, какими качествами должен обладать критерий для проверки гипотезы.

 
 
 
 Re: стат. гипотеза
Сообщение21.08.2009, 20:50 
droid в сообщении #236746 писал(а):
На самом деле критериев-то много предложить можно, в том числе и просто очевидный критерий для проверки _основной_ гипотезы $p_1 < p_2$, которая будет приниматься, если $\dfrac{m_1}{n_1} < \dfrac{m_2}{n_2}$ и отвергаться в противном случае. Такой критерий годится? Ведь слова "проверить гипотезу" сами по себе ничего не означают, покуда не сформулировано, какими качествами должен обладать критерий для проверки гипотезы.

Нужен критерий проверки гипотезы с некоторой вероятностью, вообщем вполне подойдет тот про который вы писали выше. Но там вычисляется ошибка первого рода, т.е. ошибка гипотезы $p_1 = p_2$, а как вычислить ошибку сложной гипотезы$p_1 < p_2$ или этого не нужно делать(т. е если$p_1 = p_2$ ошибочна то точно выполнена гипотеза $p_1 < p_2$)

 
 
 
 Re: стат. гипотеза
Сообщение22.08.2009, 09:37 
Аватара пользователя
droid в сообщении #236879 писал(а):
Нужен критерий проверки гипотезы с некоторой вероятностью, вообщем вполне подойдет тот про который вы писали выше. Но там вычисляется ошибка первого рода, т.е. ошибка гипотезы $p_1 = p_2$, а как вычислить ошибку сложной гипотезы$p_1 < p_2$ или этого не нужно делать(т. е если$p_1 = p_2$ ошибочна то точно выполнена гипотеза $p_1 < p_2$)

Вероятность ошибки второго рода будет зависеть от неизвестных $p_1, p_2$. Заведомо при любых $p_1 < p_2$ вероятность этой ошибки стремится к нулю с ростом объемов выборок, т.е. критерий состоятелен. Вряд ли что-то ещё можно получить.

 
 
 
 Re: стат. гипотеза
Сообщение22.08.2009, 15:56 
Понятно, и все-таки хотелось бы прочесть доказательство состоятельности критерия :roll:

 
 
 
 Re: стат. гипотеза
Сообщение23.08.2009, 06:15 
Аватара пользователя
droid в сообщении #237039 писал(а):
Понятно, и все-таки хотелось бы прочесть доказательство состоятельности критерия :roll:

Закон больших чисел используйте, и докажете состоятельность.

 
 
 [ Сообщений: 12 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group