Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
Аватара пользователя
Почитайте ссылку, которую привел GAA, или любой другой материал "Интервальная оценка вероятности успеха в схеме Бернулли"

 
:cry:

Добавлено спустя 1 час 9 минут 54 секунды:

В книге ван дер Вардена нашла какую-то километровую формулу. Похоже на формулу для приближенного вычисления интеграла Ф. Больше ничего не нашла. В полной растерянности :(

 
Аватара пользователя
В лекциях, ссылку на которые приводил GAA, этот вопрос разбирается.

 Доверительный интервал для параметра биномиального распредел
определенте доверительного интервала для случайной величины имеюший биномиальное распределение

кто что знает, пожалуйста помогите, завтра отвечать нужно!

 Асимптотически доверительный интервал
Об асимптотически доверительном интервале см. указанные выше лекции И.Н. Володина и книгу А.Н. Ширяева, о точном интервале — книгу Ван дер Вардена.
Обозначим оценку параметра $p$ через $p^*$, т.е. $p^* = m/n$, где $m$ — количество испытаний, в которых событие наступило,$n$ — объем выборки. Интервал асимтотического уровня $1-\epsilon$ [приближенный интервал уровня $1-\epsilon$] имеет вид
$\left( p^* - c \sqrt{p^*(1-p^*)/n}, p^* + c\sqrt{p^*(1-p^*)/n} \right)$,
где $c = \Phi^{-1}(1-\epsilon/2)$, $\Phi(x)$ — функция стандартного нормального распределения, $\Phi^{-1}(x)$ — обратная к функции стандартного нормального распределения.

 Гипергеометрическое распределение: доверительный интервал
Аватара пользователя
Очень редко сталкиваюсь с математической статистикой, а тут задачка попалась. В имеющейся у меня литературе ничего похожего не нашёл.
В урне лежат $N$ шаров, из них $M$ белых. Без возвращения извлечены $n$ шаров, среди которых оказалось $m$ белых (числа $N$, $n$, $m$ известны). Требуется найти доверительный интервал для величины $M$, накрывающий её с заданной вероятностью $\gamma$.
Предполагается, что $N$ - порядка 50-100 тысяч, $n$ - порядка 500-1500, $m$ - несколько сотен.

Порекомендуйте что-нибудь.

 Re: Гипергеометрическое распределение: доверительный интервал
Ну у Вас, если я правильно понял, извлекается порядка процента всех шаров. В этой ситуации, скорее всего, надо просто перейти к распределению Бернулли и к нормальной аппроксимации для него (если только количества вынутых чёрных и белых шаров хоть более-менее одного порядка).

 Re: Гипергеометрическое распределение: доверительный интервал
Аватара пользователя
Здесь законно будет построить доверительный интервал для вероятности успеха в схеме Бернулли, а потом просто умножить его границы на $N$?

ewert в сообщении #472197 писал(а):
если только количества вынутых чёрных и белых шаров хоть более-менее одного порядка
Различаются в 2-5 раз, так что примерно одного порядка.

 Re: Гипергеометрическое распределение: доверительный интервал
Someone в сообщении #472200 писал(а):
Здесь законно будет построить доверительный интервал для вероятности успеха в схеме Бернулли, а потом просто умножить его границы на $N$?

Да, только интервал имеет смысл строить --- асимптотический. Уже была такая тема.

-- Sat 30.07.2011 20:17:08 --

Someone, слить темы?

 Re: Гипергеометрическое распределение: доверительный интервал
Аватара пользователя
ewert, GAA, спасибо за консультацию.

GAA в сообщении #472263 писал(а):
слить темы?
Можно.

// 31.07.11 темы соединены. / GAA

 Доверительный интервал параметра биномиального распределения
Аватара пользователя
Nephi в сообщении #108561 писал(а):
Помогите решить задачку
В выборке, состоящей из n= 21 изделий, только 7 бракованные. С вероятностью 0,95 оценить пределы, в которых будет находиться доля брака во всей партии, если известно, что вся партия содержит 700 изделий.

$N=700$ - количество изделий в генеральной совокупности,
$M$ - количество бракованных изделий в генеральной совокупности,
$n=21$ - объём выборки,
$m=7$ - количество бракованных изделий в выборке.

Нижнюю границу доверительного интервала $M_1$ находим решая уравнение:

$\sum_{m = 8}^{21}\frac{C_{M_1}^m C_{N-M_1}^{n-m}}{C_N^n}=0.025; M_1=129$


Верхнюю границу доверительного интервала $M_2$ находим решая уравнение:

$\sum_{m = 0}^{6}\frac{C_{M_2}^m C_{N-M_2}^{n-m}}{C_N^n}=0.025; M_2=363$

Доверительный интервал в долях $[0.184;0.519]$

 Re: Доверительный интервал параметра биномиального распределения
Думаю, интервал [129, 363] слишком узок, чтобы гарантировать: вероятность накрытия им параметра $M$ не меньше наперед заданной доверительной вероятности $1-\varepsilon$, т.е. $\mathsf P \{M_1< M < M_2\} \ge 1- \varepsilon$.

В п.3 Построение доверительного интервала с использованием распределения точечной оценки параметра § 2.3 книги [3] приводится общая схема построения доверительного интервала для случая, когда функция распределения непрерывна и монотонна по параметру (и в частности, для дискретных распределений, например, для параметра бернуллиевсой модели, пример 2.34).
Для случая дискретного параметра, на мой взгляд, нет существенных отличий. Пусть $F(m; M) = \sum_{k=0}^m \frac {C_{N-M}^{n-k}C_{M}^k}{C_N^n}$ (функция распределения непрерывна справа). Следуя [1] и учитывая убывание функции распределения по параметру $M$, получим соотношения, которым должны удовлетворять границы доверительного интервала ($M_1$ и $M_2$):
$1 - F(m-1; M_1) \le \varepsilon/2$, $1 - F(m-1; M_1+1) > \varepsilon/2$;
$F(m; M_2) \le \varepsilon/2$, $F(m; M_2-1) > \varepsilon/2$.
При заданных $N$, $n$ и $m$, численный расчет в Maple дает значения $M_1=103$ и $M_2=397$, т.е. доверительным интервал уровня 0.95 для $M$ будет (103, 397), а для $M/N$ — (0.1471, 0.5671). Замечу, что центральный доверительный интервал (см. указанный выше пример 2.34 в [3]) для параметра $p$ биномиального распределения будет (0.1459, 0.5697). Т.е. переход к биномиальному распределению, как выше и предполагалось, оправдан.

[3] Ивченко Г. И., Медведев Ю. И. Математическая статистика. — М.: Наука, 1984 (djvu).

Добавлено 5.08.11.

О доверительном интервале для параметра $p$ биномиального распределения. Дополнение.
Границы центрального ($\mathsf P \{p \le p_1\} \le \varepsilon/2$ и $\mathsf P \{ p \ge p_2\} \le \varepsilon/2$) интервала $(p_1 < p <p_2)$ уровня $1- \varepsilon$ могут быть выражены через квантили распределения Фишера:
$$p_1 = \frac{m}{m+(n-m+1)f_{2(n-m+1), 2m}(1-\varepsilon/2)},$$$$ p_2 = \frac{m+1}{m+1 + (n-m)f_{2(n-m), 2(m+1)}(\varepsilon/2)}.$$Здесь $n$ — объем выборки, $m$ — число благоприятных исходов, $f_{\nu_1, \nu_2}(u)$ — квантиль уровня $u$ распределения Фишера c $\nu_1$ (числитель) и $\nu_2$ степенями свободы.


Вывод формул.
Общий ход. Зная производную функции биномиального распределения по параметру $p$, находим выражение этой функции через функцию бета-распределения, которую, в свою очередь, выражаем через функцию распределения Фишера.
Детали. Обозначим через $F_p (m)$ — функцию биномиального распределения. $\frac{d}{dp} F_p (m) = -\frac{n!}{m!(n-m-1)!}p^m(1-p)^{n-m-1}$, при $m=0, \ldots, n-1$. Используя это выражение для производной, можно записать
$F_p (m) = \frac{\Gamma(n+1)}{\Gamma(m+1)\Gamma(n-m)} \int\limits_p^{1}y^m(1-y)^{ n-m-1}\,dy =$
$=\frac{\Gamma(n+1)}{\Gamma(m+1)\Gamma(n-m)} \int\limits_0^{1-p}y^{(n-m)-1}(1-y)^{(m+1)-1}\,dy \equiv B_{n-m, m+1} (1-p). $
Здесь через $B_{a, b} (x)$ обозначена функция B-распределения.

Функция распределения Фишера имеет вид
$$F_{\nu_1, \nu_2}(x) = \frac{\Gamma\left(\frac{\nu_1+\nu_2}{2}\right)}
{\Gamma\left(\frac{\nu_1}{2}\right)\Gamma\left(\frac{\nu_2}{2}\right)} 
 \int\limits_0^ x \frac{\left(\frac{\nu_1}{\nu_2} u \right)^{\frac{\nu_1}{2}-1}}{(1+\frac{\nu_1}{\nu_2}u)^{\frac{\nu_1+\nu_2}{2}}}\frac{\nu_1}{\nu_2}du. $$

Делая в $F_p(m)$ замену $y = \frac{z}{1+z}$, а затем $z=\frac{\nu_1}{\nu_2}x$ получим $B_{n-m, m+1}(1-p) = F_{2(n-m), 2(m+1)} \left( \frac{2(m+1)}{2(n-m)}\frac{1-p}{p}\right)$.
Границы доверительного интервала задаются соотношениями:
$1- F_{2(n-m+1), 2m} \left( \frac{2m}{2(n-m+1)} \frac{1-p_1}{p_1}\right) = \varepsilon/2$;
$F_{2(n-m), 2(m+1)} \left( \frac{2(m+1)}{2(n-m)}\frac{1-p_2}{p_2}\right) = \varepsilon/2$.
Отсюда получаются указанные выше границы доверительного интервала.

 Re: Доверительный интервал параметра биномиального распределения
Добрый день!

Возник вопрос в продолжение темы построения доверительного интервала для параметра биномиального распределения.

Пусть $m$ — количество благоприятных исходов, $n$ — объем выборки.
На всякий случай подытожу 3 варианта построения искомого доверительного интервала для параметра уровня $1-\varepsilon$:
1. $\left(m/n - c \sqrt{m(1-m/n)/n^2}, m/n + c \sqrt{m(1-m/n)/n^2} \right)$, где $c = \Phi^{-1}(1-\varepsilon/2)$, $\Phi(x)$ — функция стандартного нормального распределения, $\Phi^{-1}(x)$ — обратная к функции стандартного нормального распределения.
2. $\left(\sin^2\left(\arcsin\sqrt{m/n}-c/(2\sqrt{n})\right), \sin^2\left(\arcsin\sqrt{m/n}+c/(2\sqrt{n})\right)\right)$.
3. 3-й вариант совпадает с приведенным в предыдущем сообщении.

Предположим, что есть два биномиальных распределения, для каждого из которых мы можем построить такой доверительный интервал (по формулам, приведенным выше), т.е. доверительные интервалы для параметров $p_1$ и $p_2$.
В первом случае объем выборки был $n_1$, а количество благоприятных объектов - $m_1$.
В первом случае объем выборки был $n_2$, а количество благоприятных объектов - $m_2$.

Как теперь построить доверительный интервал для разницы параметров ($p_1-p_2$)?

 Re: Доверительный интервал параметра биномиального распределения
Аватара пользователя
Посмотрите, например, статью Newcombe RG (1998) "Interval estimation for the difference between independent proportions: comparison of eleven methods".

 Re: Доверительный интервал параметра биномиального распределения
Спасибо!
Даже макрос нашел готовый!

 [ Сообщений: 30 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group