2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 стат. гипотеза о вероятности успеха в испытаниях
Сообщение20.08.2009, 15:19 


13/04/09
17
Здравствуйте!
Не подскажите как решить такую задачу по статистике: проведено $n_1$ испытаний, из них $m_1$ оказались успешными, также были проведены $n_2$ других испытаний и $m_2$ из них были успешными. Как провирить стат. гипотезу, что вероятность успеха во втором случае выше чем в первом.

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение20.08.2009, 22:20 
Заслуженный участник
Аватара пользователя


14/02/07
2648
Обычно постановка звучит как-то так:основная гипотеза -- $p_1 = p_2$, альтернатива -- $p_1>p_2$.

Тут, как я понимаю: основная гипотеза -- $p_1 < p_2$, альтернатива -- $p_1\ge p_2$.

Откровенно говоря, вообще не представляю, как такое решать.

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение21.08.2009, 10:43 


13/04/09
17
Здравствуйте!
Не могли бы вы проверить ход рассуждений.
Допустим у нас есть две сл.в. $X, Y$ удовлетворяющие биномиальным распределениям, $B(n_1, p_1)$ и $B(n_2, p_2)$, где $p_1=\frac{m_1}{n_1}, p_2 = \frac{m_2}{n_2}, p_2 > p_1$ с вероятностями $P_1, P_2$ соответственно. И два независимых испытания с результатами $m_1$ из $n_1$ , $m_2$ из $n_2$. В случае когда испытания имеют одинаковую вероятность успеха, то или второе испытание подчиняется первому распределению, либо первое испытание подчиняется второму распределению. Зададим квантиль $\alpha$, находим область принятия гипотезы, такое $L$, что $P_1(X < L) < \alpha < P_1(X < L+1)$, т.е вероятность ошибки что второе испытание подчиняется первому рспределению $\sigma_1 =P_1(X \in [L+1, \infty])$, и наоборот $\sigma_2 = P_2(Y \in [0, L])$. Если $m_2 > L$ то данная гипотеза не выполняется и значит вероятность успеха во втором случае выше чем в первом с вероятностью $1-\sigma_1-\sigma_2$.

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение21.08.2009, 11:46 
Заслуженный участник
Аватара пользователя


14/02/07
2648
Это так, но не совсем так.

Вместо случайных величин с биномиальным распределением надо говорить о выборках из распределения Бернулли. Казалось бы, какая разница, но для статистики существенная. Ваша формулировка не статистическая.

Далее, это:
Цитата:
$p_1=\frac{m_1}{n_1}, p_2 = \frac{m_2}{n_2}$
ересь.

Теперь, статистика критерия должна быть одна, а у Вас две: $X$ и $Y$. Можно взять что-то вроде
$\frac{m_1 n_2}{m_2 n_1}$.

Получившийся критерий не будет состоятельным, ну и черт с ним, в этой постановке не может быть состоятельного критерия.

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение21.08.2009, 11:59 


13/04/09
17
droid в сообщении #236679 писал(а):
Теперь, статистика критерия должна быть одна, а у Вас две: $X$ и $Y$. Можно взять что-то вроде
$\frac{m_1 n_2}{m_2 n_1}$.

А какое распределение будет у этой статистики?
Хорхе в сообщении #236603 писал(а):
Обычно постановка звучит как-то так:основная гипотеза -- $p_1 = p_2$, альтернатива -- $p_1>p_2$

Никак не пойму как можно проверить эту стат. гипотезу при произвольных $p_1, p_2$

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение21.08.2009, 13:54 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Хорхе в сообщении #236603 писал(а):
Обычно постановка звучит как-то так:основная гипотеза -- $p_1 = p_2$, альтернатива -- $p_1>p_2$.

Тут, как я понимаю: основная гипотеза -- $p_1 < p_2$, альтернатива -- $p_1\ge p_2$.

Откровенно говоря, вообще не представляю, как такое решать.

Скорее, мне кажется, нужно рассматривать простую основную гипотезу $p_1=p_2$, а в качестве желаемой альтернативы брать $p_2>p_1$. Например, строить критерий заданного асимптотического размера, основанный на статистике $$\rho(\vec X, \vec Y)=\dfrac{\frac{m_1}{n_1} - \frac{m_2}{n_2}}{\sqrt{\frac{m_1+m_2}{n_1+n_2}\left(1-\frac{m_1+m_2}{n_1+n_2}\right)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.$$ При верной основной гипотезе её распределение сходится к стандартному нормальному, и можно задавать левостороннюю критическую область $\rho < \tau_\alpha$, где $\tau_\alpha$ - квантиль уровня $\alpha$ стандартного нормального распределения.

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение21.08.2009, 14:04 


13/04/09
17
--mS-- в сообщении #236744 писал(а):
Например, строить критерий заданного асимптотического размера, основанный на статистике $$\rho(\vec X, \vec Y)=\dfrac{\frac{m_1}{n_1} - \frac{m_2}{n_2}}{\sqrt{\frac{m_1+m_2}{n_1+n_2}\left(1-\frac{m_1+m_2}{n_1+n_2}\right)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.$$

А где можно про эту статистику прочесть(с доказательствами).

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение21.08.2009, 18:33 
Заслуженный участник
Аватара пользователя


23/11/06
4171
droid в сообщении #236746 писал(а):
--mS-- в сообщении #236744 писал(а):
Например, строить критерий заданного асимптотического размера, основанный на статистике $$\rho(\vec X, \vec Y)=\dfrac{\frac{m_1}{n_1} - \frac{m_2}{n_2}}{\sqrt{\frac{m_1+m_2}{n_1+n_2}\left(1-\frac{m_1+m_2}{n_1+n_2}\right)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}}.$$

А где можно про эту статистику прочесть(с доказательствами).

Точно не скажу. Эта статистика (квадрат её) используется в критерии $\chi^2$ для проверки однородности двух выборок по двум интервалам группировки. Например, Г.И.Ивченко, Ю.И.Медведев "Математическая статистика", параграф 3.4. Однако доказательства там нет. Грубо говоря, для двух независимых бернуллиевских выборок с одним и тем же параметром $p$ распределения величин $\dfrac{\frac{m_1}{n_1} - p}{\sqrt{p (1-p)}}$ и $\dfrac{\frac{m_2}{n_2} - p}{\sqrt{p (1-p)}}$ при $n_1,\; n_2 \to \infty$ аппроксимируется нормальными соответственно $N(0, \frac{1}{n_1})$ и $N(0, \frac{1}{n_2})$.
Если вместо $p$ в знаменателях взять состоятельную оценку $p^*=\dfrac{m_1+m_2}{n_1+n_2}$, вычесть друг из друга дроби $\dfrac{\frac{m_1}{n_1} - p}{\sqrt{p^* (1-p^*)}}$ и $\dfrac{\frac{m_2}{n_2} - p}{\sqrt{p^* (1-p^*)}}$, то разность имеет распределение, близкое к $N(0, \frac{1}{n_1}+\frac{1}{n_2})$. Осталось на корень из дисперсии поделить, и получится $\rho$, распределение которой при любом стремлении $n_1,\; n_2 \to \infty$ приближается к стандартному нормальному.

Если кто знает, как это корректно и просто доказать, напишите, плз. Туплю.

На самом деле критериев-то много предложить можно, в том числе и просто очевидный критерий для проверки _основной_ гипотезы $p_1 < p_2$, которая будет приниматься, если $\dfrac{m_1}{n_1} < \dfrac{m_2}{n_2}$ и отвергаться в противном случае. Такой критерий годится? Ведь слова "проверить гипотезу" сами по себе ничего не означают, покуда не сформулировано, какими качествами должен обладать критерий для проверки гипотезы.

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение21.08.2009, 20:50 


13/04/09
17
droid в сообщении #236746 писал(а):
На самом деле критериев-то много предложить можно, в том числе и просто очевидный критерий для проверки _основной_ гипотезы $p_1 < p_2$, которая будет приниматься, если $\dfrac{m_1}{n_1} < \dfrac{m_2}{n_2}$ и отвергаться в противном случае. Такой критерий годится? Ведь слова "проверить гипотезу" сами по себе ничего не означают, покуда не сформулировано, какими качествами должен обладать критерий для проверки гипотезы.

Нужен критерий проверки гипотезы с некоторой вероятностью, вообщем вполне подойдет тот про который вы писали выше. Но там вычисляется ошибка первого рода, т.е. ошибка гипотезы $p_1 = p_2$, а как вычислить ошибку сложной гипотезы$p_1 < p_2$ или этого не нужно делать(т. е если$p_1 = p_2$ ошибочна то точно выполнена гипотеза $p_1 < p_2$)

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение22.08.2009, 09:37 
Заслуженный участник
Аватара пользователя


23/11/06
4171
droid в сообщении #236879 писал(а):
Нужен критерий проверки гипотезы с некоторой вероятностью, вообщем вполне подойдет тот про который вы писали выше. Но там вычисляется ошибка первого рода, т.е. ошибка гипотезы $p_1 = p_2$, а как вычислить ошибку сложной гипотезы$p_1 < p_2$ или этого не нужно делать(т. е если$p_1 = p_2$ ошибочна то точно выполнена гипотеза $p_1 < p_2$)

Вероятность ошибки второго рода будет зависеть от неизвестных $p_1, p_2$. Заведомо при любых $p_1 < p_2$ вероятность этой ошибки стремится к нулю с ростом объемов выборок, т.е. критерий состоятелен. Вряд ли что-то ещё можно получить.

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение22.08.2009, 15:56 


13/04/09
17
Понятно, и все-таки хотелось бы прочесть доказательство состоятельности критерия :roll:

 Профиль  
                  
 
 Re: стат. гипотеза
Сообщение23.08.2009, 06:15 
Заслуженный участник
Аватара пользователя


23/11/06
4171
droid в сообщении #237039 писал(а):
Понятно, и все-таки хотелось бы прочесть доказательство состоятельности критерия :roll:

Закон больших чисел используйте, и докажете состоятельность.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 12 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group