2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Статистика.
Сообщение24.02.2010, 21:08 
Есть две гипотезы и даны вероятности успехов:
$H_0=\{p=\dfrac{1}{2}\}$
$H_1=\{p=\dfrac{1}{4}\}$
Проводится 100 испытаний.
Построить оптимальный критерий с уровнем значимости $\alpha =0,05$

Сложность собственно вот в чем возникла. Для трех испытаний данная задача решается легко, а как бы в этом случае? (Чувствуется что надо как-то интегральную теорему Муавра—Лапласа прикрутить, но как?)

 
 
 
 Re: Статистика.
Сообщение25.02.2010, 12:19 
Видимо оптимальный критерий это наиболее мощный.
Воспользуйтесь леммой Неймана — Пирсона (иногда это утверждение называют критерием Неймана — Пирсона) и постройте критерий уровня значимости $\alpha$ или более. (Для построения критерия уровня $\alpha$ нужно использовать рандомизированный критерий, но так как вам предложен «большой» объем выборки, видимо это не предполагается). После того как критерий будет построен, можно будет получить нормальную аппроксимацию.

 
 
 
 Re: Статистика.
Сообщение25.02.2010, 13:28 
Аватара пользователя
Критерий в данной задаче имеет следующий вид: фиксируется пороговое значение $T$. Если наблюдаемое число успехов меньше $T$ - принимаем решение в пользу $H_1$, в противном случае - в пользу $H_0$. Значение $T$ необходимо выбрать так, чтобы уровень значимости был бы равен данному. Приведите определение уровня значимости. Действительно, надо будет применить Муавра-Лапласа.

 
 
 
 Re: Статистика.
Сообщение25.02.2010, 14:08 
Аватара пользователя
G_Ray в сообщении #291929 писал(а):
Есть две гипотезы и даны вероятности успехов:
$H_0=\{p=\dfrac{1}{2}\}$
$H_1=\{p=\dfrac{1}{4}\}$
Проводится 100 испытаний.
Построить оптимальный критерий с уровнем значимости $\alpha =0,05$

Изображение


Цитата:
Построить оптимальный критерий с уровнем значимости $\alpha =0,05$

$P(X \leq 41)=0,0443$

У меня вопрос к форуму: что изменится, если опустить слово "оптимальный"?

 
 
 
 Re: Статистика.
Сообщение25.02.2010, 15:01 
Аватара пользователя
faruk в сообщении #292080 писал(а):
У меня вопрос к форуму: что изменится, если опустить слово "оптимальный"?


Например, можно будет всегда (независимо от результата эксперимента) принимать решение в пользу $H_0$. Или, менее тривиально, сдвинуть порог принятия решения ниже оптимального значения.

-- Чт фев 25, 2010 15:03:23 --

А у меня ответный вопрос: зачем приводить решение и ответ учебной задачи? Не первый же день на форуме.

 
 
 
 Re: Статистика.
Сообщение25.02.2010, 15:08 
faruk в сообщении #292080 писал(а):
У меня вопрос к форуму: что изменится, если опустить слово "оптимальный"?
Не понял смысла вопроса. Если опустить слово "оптимальный" (наиболее мощный), то выбор критической области станет неоднозначным; можно будет построить критерий уровня $\alpha$, который обладает меньшей мощностью, чем оптимальный. Например, выбрать в качестве критической области область вида $T \le T_l \, \vee \, T \ge T_h$.

(Оффтоп)

Думаю, со студенческой точки зрения отсутствие слова «оптимальный» означает, что доказывать оптимальность не нужно. Но уверенно об этом сказать может только составитель задания.

 
 
 
 Re: Статистика.
Сообщение25.02.2010, 15:31 
Аватара пользователя
PAV в сообщении #292096 писал(а):
А у меня ответный вопрос: зачем приводить решение и ответ учебной задачи? Не первый же день на форуме.

Потому что я не понял смысл условия. Если бы было просто сказано: "Построить критерий с уровнем значимости $\alpha =0,05$", то тогда просто смотрим биномиальное распределение $B(100;0,5)$ и находим максимальное $k$, для которого выполняется условие:
$P(X \leq k)  \leq \alpha$

А добавление слова "оптимальный" сбило меня с толку.

Приношу свои извинения.

 
 
 
 Re: Статистика.
Сообщение25.02.2010, 21:46 
Опа. И решение написали, и гистограмму нарисовали, все за меня сделали:) Спасибо конечно, за труды:) (кстати вопрос, в какой программе все это делается?)
По этой задаче все ясно, всем спасибо.

Есть вторая задача.
$H_0=\{\xi - $равномерно распределена на $[0,2]\}$
$H_1=\{\xi - $равномерно распределена на $[-1,3]\}$

Нужно так же построить оптимальный критерий с уровнем значимости. (он задан)

Находим плотности распределения:

$p_0(x)=\left\{\begin{matrix} \frac{1}{2}, & x\in [0,2] \\ 0,& x\notin [0,2]\end{matrix}$
$p_1(x)=\left\{\begin{matrix} \frac{1}{4}, & x\in [-1,3] \\ 0,& x\notin [-1,3]\end{matrix}$

Находим отношение правдоподобия:
$L(x)=\left\{\begin{matrix} \frac{1}{2}, & x\in [0,2]  \\ \infty, & x\in[-1,0)\cup(2,3] \\ ... ,& x\notin [-1,3] \end{matrix}$

Тут тоже леммой Неймана-Пирсона надо пользоваться:

$\varphi(x)=\left\{\begin{matrix} 1, & L(x)>C  \\ 0, & L(x)< C \\ \varepsilon ,& L(x)=C \end{matrix}$

А вопрос собственно вот в чем:
Для дискретного случая:
$\alpha=\sum p_0(x)\varphi(x)$

Для непрерывного, значит интеграл:
$\alpha=\int\limits_{-\infty}^{+\infty} p_0(x)\varphi(x) dx$

Понятно что тут интеграл разбивается на три слагаемых, из которых (т.к. $\varphi(x)$ принимает значения только $1,0, \varepsilon$) последнее нулевое.
А как границы интегрирования расставить в остальных двух? И как выбрать константу?

 
 
 
 Re: Статистика.
Сообщение26.02.2010, 16:47 
G_Ray в сообщении #292315 писал(а):
Находим отношение правдоподобия:
$L(x)=\left\{\begin{matrix} \frac{1}{2}, & x\in [0,2]  \\ \infty, & x\in[-1,0)\cup(2,3] \\ ... ,& x\notin [-1,3] \end{matrix}$
Неправильно нашли статистику отношения правдоподобия.

 
 
 
 Re: Статистика.
Сообщение26.02.2010, 17:02 
Ну нас учили, что:
$L(x)=\dfrac{p_1(x)}{p_0(x)}$
В чем ошибка?

 
 
 
 Re: Статистика.
Сообщение26.02.2010, 17:12 
Сформулируйте лемму, полностью.

 
 
 
 Re: Статистика.
Сообщение26.02.2010, 17:34 
Как нам её сформулировали:

$H_0=\{\theta=\theta_0\}$
$H_1=\{\theta=\theta_1\}$
$p_k(x)=P\{\xi=x|H_k\}$
$\forall \alpha \in [0,1] $ существует оптимальный критерий c функцией

$\varphi(x)=\left\{\begin{matrix} 1, & L(x)>C \\ 0, & L(x)< C \\ \varepsilon ,& L(x)=C \end{matrix}$

$\varepsilon \in [0,1]$
$\alpha$ - уровень значимости.

 
 
 
 Re: Статистика.
Сообщение26.02.2010, 20:11 
Формулировка неполна! Вы, как минимум, пропустили ограничение $\mathsf P_0 \{L >0\} \ge \alpha$, и соотношение
$\mathsf E_0 \varphi(x) \equiv \mathsf P_0 \{L(X) > C\} + \varepsilon \mathsf P_0 \{L(X) = C\} = \alpha$. \quad (1)
(Это тот интеграл, который Вы писали выше, и забыли/поленились переписать.)

Из выражения для отношения функций правдоподобия я делаю вывод, что объем выборки у Вас равен 1.

При $X \in [-1, 0) \cup (2, 3]$, $L = +\infty$, следовательно, при таких $X$ имеем $\phi(X) =1$, при $X \in [0, 2]$ отношение правдоподобия постоянно, и для нахождения $\varepsilon$ из (1) имеем соотношение $\varepsilon\mathsf P_0 \{L(X) = C\} = \alpha$.

-- Пт 26.02.2010 19:21:48 --

Забыл дописать. В определении критерия $\varepsilon$ — это вероятность, с которой отвергается основная гипотеза, если $L = C$.

 
 
 
 Re: Статистика.
Сообщение26.02.2010, 20:25 
Вот, у меня такие же рассуждения были:

$\int\limits_{-1}^{0} \frac{1}{2} dx + \int\limits_{2}^{3} \frac{1}{2} dx+\varepsilon\int\limits_{0}^{2} \frac{1}{2} dx=\alpha$

Это самое не получается меньше единицы. Ну ни как...

 
 
 
 Re: Статистика.
Сообщение26.02.2010, 20:42 
G_Ray в сообщении #292708 писал(а):
$\int\limits_{-1}^{0} \frac{1}{2} dx + \int\limits_{2}^{3} \frac{1}{2} dx+\varepsilon\int\limits_{0}^{2} \frac{1}{2} dx=\alpha$
Откуда взялись первые два интеграла?

(Оффтоп)

P.S. Вы постоянно что-то не дописываете. Постоянно приходится угадывать. Если бы Вы писали подробней, думаю, нашлись бы желающие Вам помочь и без меня.

 
 
 [ Сообщений: 18 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group