2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Теория вероятностей
Сообщение02.07.2008, 14:09 


12/10/06
11
Господа!
Стыдно, конечно, но не подскажете ли, как решить задачку?
Есть M деталей,
среди них N бракованных.
Случайным образом выбирают без возвращения K деталей.
Какова вероятность того, что из числа выбранных L содержат брак?

 Профиль  
                  
 
 
Сообщение02.07.2008, 14:39 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Это гипергеометрическое распределение.

 Профиль  
                  
 
 
Сообщение02.07.2008, 14:42 
Заслуженный участник
Аватара пользователя


23/08/07
5500
Нов-ск
Из мешка с $N$ бракованными деталями берите $L$ бракованных деталей (сколькими способами?).
Из мешка с $M-N$ небракованными деталями берите $K-L$ небракованных деталей (сколькими способами?).

 Профиль  
                  
 
 
Сообщение02.07.2008, 15:18 


12/10/06
11
Спасибо, слова "гипергеометрическое распределение" были ключевыми.

 Профиль  
                  
 
 
Сообщение03.07.2008, 19:47 


03/07/08
2
Господа! "Извините, что мы к вам обращаемся" (с), но уж очень давно проходился теорвер, а задача требует срочного, к сожалению решения.
Собственно задача к первому посту этой темы, поэтому решил не открывать новую.
Итак, Есть M деталей, среди них предположительно 0.1% бракованных
Сколько деталей надо проверить (без возврата), чтобы с вероятностью, скажем, 95% убедиться, что процент брака не превышает заявленных 0.1%

 Профиль  
                  
 
 
Сообщение03.07.2008, 23:51 
Аватара пользователя


06/01/06
967
ZxZx писал(а):
Сколько деталей надо проверить (без возврата), чтобы с вероятностью, скажем, 95% убедиться, что процент брака не превышает заявленных 0.1%

Если исходить из биномиального распределения, то получается, что минимальный объем выборки составляет 2995 деталей, при этом в выборке не должно оказаться ни одной дефектной детали. Или же не более одной дефектной в 4742, или же не более двух дефектных в 6294 итд.


$p = 0.001$

$n = 2995, P(X=0) = 0.049962$
$n = 4742, P(X \leq 1) = 0.050000$
$n = 6294, P(X \leq 2) = 0.049987$
$n = 7752, P(X \leq 3) = 0.049976$
$n = 9151, P(X \leq 4) = 0.049998$
$n = 10511, P(X \leq 5) = 0.049979$

Excel, статистические функции

Процент брака не превышает 0.1%, т.е. в среднем среди 1000 деталей не более одной дефектной. Поэтому понятно, почему проверять нужно так много деталей, если требуется высокая статистическая надежность контроля.

Edit:
Нет, это я что-то не то написал. Если объем генеральной совокупности сильно ограничен, то проверять нужно все-таки не такое огромное количество деталей. Тогда, действительно, можно воспользоваться формулой гипергеометрического распределения.

Например, если N=3000, тогда D=3, и тогда ни одной дефектной не должно быть среди n=1895 проверенных (95%-ная статистическая надежность проверки). (Обозначения согласно Википедии: Гипергеометрическое распределение)
Но получается довольно странная картина: в 1895 не должно быть ни одной дефектной, а в 3000 допустимо 3 дефектных, при том, что во втором случае еще и надежность 100%.

 Профиль  
                  
 
 
Сообщение04.07.2008, 13:43 
Заслуженный участник


11/05/08
32166
ZxZx писал(а):
Господа! "Извините, что мы к вам обращаемся" (с), но уж очень давно проходился теорвер, а задача требует срочного, к сожалению решения.
Собственно задача к первому посту этой темы, поэтому решил не открывать новую.
Итак, Есть M деталей, среди них предположительно 0.1% бракованных
Сколько деталей надо проверить (без возврата), чтобы с вероятностью, скажем, 95% убедиться, что процент брака не превышает заявленных 0.1%

Что-то я не понял. Биномиальное распределение ведь асимптотически симметрично. И если фактически именно 0.1% бракованных, то надёжность гипотезы о том, что процент брака не превышает ровно 0.1%, будет примерно той же, что и для противоположной. Т.е. 50 процентов.

 Профиль  
                  
 
 
Сообщение04.07.2008, 14:25 
Заслуженный участник
Аватара пользователя


01/03/06
13626
Москва
На мой взгляд, так это обычная учебная задача. Обычно такие задачи решают с помощью т. Муавра - Лапласа: http://www.nsu.ru/matlab/Exponenta_RU/educat/class/test/9/intteor.asp.htm
http://www.nsu.ru/mmf/tvims/chernova/tv/lec/node61.htm.

 Профиль  
                  
 
 
Сообщение04.07.2008, 20:21 
Заслуженный участник


11/05/08
32166
С помощью формулы Муавра-Лапласа можно найти доверительный интервал по зарегистрированному проценту успехов. Например, если процент, полученный по выборке, есть 0.0998%, то вероятность того, что он фактически лежит в интервале от 0.0898% до 0.1098% -- такая-то, в зависимости от объёма выборки.

А вот вероятность того, что он именно меньше 0.1% -- примерно фифти-фифти и выйдет.

 Профиль  
                  
 
 
Сообщение04.07.2008, 20:28 
Заслуженный участник


12/07/07
4532
Условие задачи сформулировано крайне небрежно. Вряд ли можно уверенно предложить какое-либо решение. Хотелось бы обратить внимание на три момента.
1. В условии говорится о «предположительном» значении доли брака. Отсюда напрашивается вывод: требуется построить критерий проверки основной гипотезы $H_1$: доля брака не больше $k_0$, при альтернативе $H_2$: доля брака больше $k_0$.
2. В условии говорится о выборе «без возврата». Это означает большие объемы выборки по сравнению с объемом всего множества, и, как следствие, неприменимость биномиального приближения. Это согласуется с очень малым гипотетическим значением доли брака.
3. Неясно 1 – 0.95 — это точная верхняя грань вероятности отвергнуть верную основную гипотезу ($\alpha$) или точная верхняя грань вероятности отвергнуть верную альтернативу($\beta$). Вроде бы второе, но тогда неясно чему равно $\alpha$.

Боюсь, только автор задачи сможет пояснить — о чем она.
Добавлено на следующий день (в субботу)
Обозначим объем выборки через $n$, число бракованных деталей в выборке — через $k$, объем партии — через $N$, число бракованных деталей в партии — через $K$, гипотетическое число дефектов в партии через $k_0$, $k_0=[0.001N]$.
Пусть $\alpha=0$, $\beta=1-0.95$, тогда критерий будет иметь вид:
Если $k > k_0$, то основная гипотеза отвергается.
Очевидно, вероятность ошибки второго рода достигает максимума на ближайшей альтернативе ($K=k_0+1$). Следовательно $\beta=\sum\limits_{k=0}^{k_0}{C_K^k C_{N-K}^{n-k}/C_N^n}= 1-C_{N-(k_0+1)}^{n-(k_0+1)}$.
По заданному $N$ всегда можно найти такое минимальное $n$, что $\beta \le 1-0.95$.
Например:
$N = 1000$, $k_0 = 1$, $n=975$;
$N = 1999$, $k_0 = 1$, $n=1949$;
$N = 3000$, $k_0 = 3$, $n=2962$.
Возможно, я не правильно интерпретирую «% бракованных деталей», «усекая» до ближайшего целого, а не округляя. Но замена «усечения» на округление принципиально дело не меняет.
Добавлено в субботу вечером
Рассмотрим случай большой выборки: $N = 30000$.
При $\alpha=0$ и $k_0 = 30$ получим $n=25249$.
Пусть теперь $\alpha \ne 0$. Критерий будет иметь вид:
Если $k > k_c$, то основная гипотеза отвергается.
$\alpha = \sum\limits_{k=k_c+1}^{K}{C_K^k C_{N-K}^{n-k}/C_N^n}$, при $K = k_0$; $\beta = \sum\limits_{k=0}^{k_c}{C_K^k C_{N-K}^{n-k}/C_N^n}$, при $K = k_0 +1$.
Считая, что $\alpha=\beta=1-0.95$ ($\alpha \le 0.05$, $\beta \le 0.05$) при $k_c = 26$ получим минимальный объем выборки $n=22774$.
Для партии в 3000 изделий не получается положить $k_c < k_0$ с тем чтобы $\alpha \le 0.05$ — увеличение $\alpha$ c нуля до 0.05 не дает выигрыша в объеме выборки. Для партии в 30000 элементов выигрыш имеется. Конечно, выигрыш начинается с партий меньшего объема, но это численно не проверял, не было времени.
Добавлено в воскресенье утром
Биномиальное приближение. Обозначим долю брака в партии через $p$, гипотетическое значение доли брака в партии — $p_0 = 0.001$.
Критерий. Если $k > C$, то основная гипотеза отвергается.
$\alpha = \sum\limits_{k=C+1}^n C_n^k p^k (1-p)^{n-k}$, при $p=p_0$;
$\beta = \sum\limits_{k=0}^C C_n^k p^k(1-p)^{n-k}$, при $p=p_0$.
[Теперь $p$ на альтернативах ($p > p_0$) могут принимать сколь угодно близкие значения к $p_0$]. Отсюда вытекает, что, в нашем случае, $\alpha + \beta = 1$ и сделать эти величины одновременно малыми уже невозможно. [В нормальной аппроксимации все, естественно, будет обстоять также.] Остается делать малой вероятность отвергнуть альтернативу, когда она верна (т.е. не пропустить брак) невзирая на безжалостную отбраковку неплохих партий (делая $\alpha$ большой). Полагая $C=0$, $\beta \le 0.05$ получаем минимальный объем выборки 2995.
Полагая $C= 1$ и по-прежнему $\beta \le 0.05$ получаем минимальный объем выборки 4742. Т.е. начиная с этого объема, выборка, содержащая одну дефектную деталь, должна признаваться содержащей допустимый процент брака.
Эти результаты совпадают с полученными выше результатами faruk для биномиального приближения, однако мои результаты расходятся с результатами faruk при точном решении задачи т.е. при использовании гипергеометрического распределения.

 Профиль  
                  
 
 
Сообщение08.07.2008, 09:54 


03/07/08
2
Большое человеческое спасибо.
Ушел копать :)

 Профиль  
                  
 
 теория вероятностей
Сообщение17.11.2008, 09:26 


17/11/08
2
задача по теме гипергеометрическое распределение.
Предположим,что из озера вылавливают 1000 рыб,помечают их красной и выпускают обратно.При повторном отлове 1000 рыб среди них оказалось 100 помеченных.Какие выводы можно сделать относительно числа рыб в озере?помогите пожалуйста решить и оформить...

 Профиль  
                  
 
 
Сообщение17.11.2008, 11:04 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Чтобы этот вопрос не выглядел как "решите за меня", напишите сначала, каким образом к этой задаче применяется стандартная гипергеометрическая схема, а также без формул, просто на уровне здравого смысла, что можно сказать про число рыб в озере. Какое их количество, к примеру, представляется наиболее вероятным?

 Профиль  
                  
 
 
Сообщение17.11.2008, 12:59 


17/11/08
2
10000 рыб-наиболее вероятное количество рыб в озере.
хм..подскажите как сюда вписывать формулы :( [/math][/url][/list][/quote][/u]

 Профиль  
                  
 
 
Сообщение17.11.2008, 14:46 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
По поводу записи формул читайте здесь и здесь

Добавлено спустя 1 час 4 минуты 35 секунд:

rosa1224 в сообщении #159124 писал(а):
10000 рыб-наиболее вероятное количество рыб в озере.


Нормально для начала. Теперь поясните, как в задаче возникает гипергеометрическое распределение. Поясните (без формул, только здравый смысл!), как пришли к числу 10000. Ну и поясните, для примера, что можете сказать насчет правдоподобия, скажем, числа 4000 как оценки количества рыб в озере.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 15 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group