Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 Доверительный интервал параметра биномиального распределения
Помогите решить задачку
В выборке, состоящей из n= 21 изделий, только 7 бракованные. С вероятностью 0,95 оценить пределы, в которых будет находиться доля брака во всей партии, если известно, что вся партия содержит 700 изделий.

Добавлено спустя 6 минут 10 секунд:

Правильно ли я мыслю:
В выборке из 21 изделий - 7 бракованных. Т.е. бракованное каждое третье изделие.
Всего в партии 700 изделий, значит бракованных - 700/3. Вероятность - 0,95. Тогда пределы бракованных изделий
нижний: 700/3*0,95
верхний: 700/3*1,05, т.е
доля брака в пределах больше 221 но меньше 245 изделий
Это верно, или я где-то туплю?

// тема изменена на более информативную. maxal

 
Аватара пользователя
Неправильно. Используйте теорему Муавра-Лапласа.

 
никак не могу разобраться.
вероятность того, что изделие бракованное
p=7/21=1/3=0.33
сответственно
q=0.67
Всего изделий
n=700
с вероятностью 0,95 оценить пределы, в которых будет находится доля брака.
Это мне числа k1 и k2 что ли найти надо?
$$
P_n(k1,n)=\Phi\Big(\frac{k_2-np}{\sqrt{npq}}\Big)-\Phi\Big(\frac{k_1-np}{\sqrt{npq}}\Big)
$$
$$
0.95=\Phi(x'')-\Phi(x')=\Phi\Big(\frac{k_2-700* 0.33}{\sqrt{700*0.33*0.67}}\Big)-\Phi\Big(\frac{k_1-700*0.33}{\sqrt{700*0.33*0.67}}\Big)
$$
И дальше чего?

 
Аватара пользователя
Это тоже верно, но таких пар будет много.
Обычно в подобных задачах считается, что интервал, в который попадает искомое количество симмеричен относительно матем. ожидания (и тем самым минимален по длине). Вот и исходите из того, что Вам нужно найти не две границы, а только длину интервала - отклонение от матем. ожидания.

Добавлено спустя 4 минуты 27 секунд:

И вместо равенства ставьте $\approx$. Это ведь приближенные вычисления.

 
Обозначим число бракованных изделий в выборке через $m$, объем выборки через $n$, объем партии через $N$, количество бракованных изделий в партии через $M$.
Nephi писал(а):
... вероятность того, что изделие бракованное p=7/21...
Может быть оценка доли бракованных изделий p*=m/n?
В ответ на сообщение Nephi участник Henrylee писал(а):
Это тоже верно...
$m/n$ - величина случайная, а доля $M/N$ бракованных изделий в партии величина детерминированная. Мы доверительный интервал для случайной величины строим?! Как-то выглядит все это очень подозрительно.:)

 
Аватара пользователя
Нет, немного не так по-моему.

Допустим, что бракованных изделий $m$. Тогда количество брака в выборке объема 21 имеет гипергеометрическое распределение; в частности, можно указать интервал (симметричный относительно среднего), в котором с вероятностью 0.95 будет лежать число брака. Нам нужны такие значения $m$, при которых этот интервал будет захватывать наблюденное значение 7.

Поскольку объем выборки достаточно мал относительно объема всей генеральной совокупности, а доля брака явно не очень мала, то можно пользоваться приближением Бернулли. Т.е. игнорировать тот факт, что выборка бесповторная, и рассматривать ее как повторную. Присходит 21 испытание Бернулли, вероятность "успеха" (наблюдение брака) равна $p=m/700$.

Нам нужно отсеять неправдоподобные значения $p$ сверху и снизу. Нижним порогом будет такое наибольшее $p_0$, при котором вероятность получить $\ge 7$ успехов из 21 возможного не превышает 0.025. Верхним порогом будет такое наименьшее значение $p_1$, при котором вероятность получить $\le 7$ успехов из 21 возможного не превышает 0.025. Это и будет доверительный интервал для $p$, из которого легко получить интервал для $m$.

 
Аватара пользователя
Ах вот Вы в каком смысле... Да, согласен, что предположение о том, что это порсто схема Бернулли с $p=7/21$ натянуто. Посчитал, что задача типовая. С другой стороны не могу отделаться от ощущения, что это просто формулировка неудачная, которая ведет к усложенению задачи.
PS Ждем Архипова, который, радостно потирая руки, объявит задачу некорректной :twisted: Удивлюсь, если не дождемся..

 
Кажется, PAV, буквой m мы обозначаем разные величины, но я ввел обозначение раньше.

По первой части совпадаем:
Случайная величина $m$ имеет гипергеометрическое распределение (GG). При стремлении $M$ и $N$ к бесконечности, так что $M/N \to  p = \text{const}$ биномиальное распределение $\text{B}(n,p)$ является предельным для GG($N$, $M$, $n$) [Nephi, см., например, раздел 3 "Условная вероятность и независимость событий" первой части лекций И.Н. Володина]. Поэтому, возможно, составитель задания предполагает построение для $M/N$ асимптотически доверительный интервал для параметра $p$ биномиального распределения.

Дальше просто строим асимптотически доверительный интервал для параметра биномиального распределения. О построении асимптотически доверительного см.:
1. Ширяев “Вероятность”, 1989.
2. Часть II, раздел “Доверительные интервалы” лекций И.Н. Володина (я скачивал ps, а затем конвертировал в pdf).

 Re: Теория вероятностей
Аватара пользователя
А ведь правда
Nephi писал(а):
С вероятностью 0,95 оценить пределы, в которых будет находиться доля брака во всей партии

тут имеют $p$ в виду. :oops:

 
Аватара пользователя
GAA, действительно, тут фактически имеется в виду доверительное оценивание параметра биномиального распределения $p$ по наблюденным 7 успехам в 21 испытании. Но только асимптотический метод тут не очень подходит, потому что число испытаний невелико.

 
Ох, запутали вы меня совсем. Будем считать, что задачка типовая. Без усложнений. Так мне не понятно, как мне оценить пределы?
Мне нужно найти интервал, $\Phi_2-\Phi_1=0.95$, используя таблицу, чтобы в него попадало число 700?

 
Аватара пользователя
Nephi писал(а):
Ох, запутали вы меня совсем. Будем считать, что задачка типовая. Без усложнений. Так мне не понятно, как мне оценить пределы?
Мне нужно найти интервал, $\Phi_2-\Phi_1=0.95$, используя таблицу, чтобы в него попадало число 700?

Нет, я уже намекнул, что жестко лоханулся, невнимательно прочитав условие. Действовать надо как подсказывают GAA и PAV.

 
О (точном) доверительном интервале для параметра $p$ биномиального распределения можно посмотреть в книге Б.Л. ван дер Варден "Математическая статистика", 1960.
Только в типовых упражнениях предполагается именно асимптотический интервал. Просто условие не очень удачное. Еще лучше построить доверительный интервал для параметрической функции $M/N$ исходного GG распределения. :)

Добавлено 02.12.08

Книгу Ван дер Вардена можно скачать с EqWord или c сайта Теория вероятностей, математическая статистика и их приложения.

 
Аватара пользователя
Я согласен, что отказ от асимптотического приближения действительно существенно усложняет вычисления и выводит задачку из категории учебных. Впрочем, можно воспользоваться таблицами биномиального распределения, хотя при этом возникают погрешности из-за дискретности по $p$.

Можно, конечно, для простоты действительно взять нормальное приближение, это будет некоторое решение, но тогда условие действительно не очень удачное.

Добавлено спустя 8 минут 59 секунд:

Половина от 0.05. Чтобы строить двусторонние доверительные интервалы, нужно вероятность ошибки поровну раскидать влево и вправо (выражаясь очень вульгарно :oops: ). Более аккуратно это в курсе статистики объясняется.

(Это был ответ на вопрос "Откуда 0.025?", который автор успел удалить, пока я писал ответ :lol:

 
PAV
спасибо, за пояснение, только пока вы писали ответ, автор сам успел понять, что это за 0.025. Извините, не видела, иначе бы не удалила :wink:

Добавлено спустя 6 минут 10 секунд:

Так я снова ничего не понимаю. Повторюсь, скорее всего, задачка стандартна.
В этом приближении, то что я писала выше верно?
Как действовать дальше?
Открываю Гмурмана "Руководство к решению задач..." в конце на 389 странице, приложение 2 Таблица значений функции Ф(х).
там
минимальное значение х=0, Ф(х)=0
максимальное значение х=5, Ф(х)=0,499997
и что мне с этим делать-то?

 [ Сообщений: 30 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group