2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Теория вероятностей
Сообщение02.07.2008, 14:09 
Господа!
Стыдно, конечно, но не подскажете ли, как решить задачку?
Есть M деталей,
среди них N бракованных.
Случайным образом выбирают без возвращения K деталей.
Какова вероятность того, что из числа выбранных L содержат брак?

 
 
 
 
Сообщение02.07.2008, 14:39 
Аватара пользователя
Это гипергеометрическое распределение.

 
 
 
 
Сообщение02.07.2008, 14:42 
Аватара пользователя
Из мешка с $N$ бракованными деталями берите $L$ бракованных деталей (сколькими способами?).
Из мешка с $M-N$ небракованными деталями берите $K-L$ небракованных деталей (сколькими способами?).

 
 
 
 
Сообщение02.07.2008, 15:18 
Спасибо, слова "гипергеометрическое распределение" были ключевыми.

 
 
 
 
Сообщение03.07.2008, 19:47 
Господа! "Извините, что мы к вам обращаемся" (с), но уж очень давно проходился теорвер, а задача требует срочного, к сожалению решения.
Собственно задача к первому посту этой темы, поэтому решил не открывать новую.
Итак, Есть M деталей, среди них предположительно 0.1% бракованных
Сколько деталей надо проверить (без возврата), чтобы с вероятностью, скажем, 95% убедиться, что процент брака не превышает заявленных 0.1%

 
 
 
 
Сообщение03.07.2008, 23:51 
Аватара пользователя
ZxZx писал(а):
Сколько деталей надо проверить (без возврата), чтобы с вероятностью, скажем, 95% убедиться, что процент брака не превышает заявленных 0.1%

Если исходить из биномиального распределения, то получается, что минимальный объем выборки составляет 2995 деталей, при этом в выборке не должно оказаться ни одной дефектной детали. Или же не более одной дефектной в 4742, или же не более двух дефектных в 6294 итд.


$p = 0.001$

$n = 2995, P(X=0) = 0.049962$
$n = 4742, P(X \leq 1) = 0.050000$
$n = 6294, P(X \leq 2) = 0.049987$
$n = 7752, P(X \leq 3) = 0.049976$
$n = 9151, P(X \leq 4) = 0.049998$
$n = 10511, P(X \leq 5) = 0.049979$

Excel, статистические функции

Процент брака не превышает 0.1%, т.е. в среднем среди 1000 деталей не более одной дефектной. Поэтому понятно, почему проверять нужно так много деталей, если требуется высокая статистическая надежность контроля.

Edit:
Нет, это я что-то не то написал. Если объем генеральной совокупности сильно ограничен, то проверять нужно все-таки не такое огромное количество деталей. Тогда, действительно, можно воспользоваться формулой гипергеометрического распределения.

Например, если N=3000, тогда D=3, и тогда ни одной дефектной не должно быть среди n=1895 проверенных (95%-ная статистическая надежность проверки). (Обозначения согласно Википедии: Гипергеометрическое распределение)
Но получается довольно странная картина: в 1895 не должно быть ни одной дефектной, а в 3000 допустимо 3 дефектных, при том, что во втором случае еще и надежность 100%.

 
 
 
 
Сообщение04.07.2008, 13:43 
ZxZx писал(а):
Господа! "Извините, что мы к вам обращаемся" (с), но уж очень давно проходился теорвер, а задача требует срочного, к сожалению решения.
Собственно задача к первому посту этой темы, поэтому решил не открывать новую.
Итак, Есть M деталей, среди них предположительно 0.1% бракованных
Сколько деталей надо проверить (без возврата), чтобы с вероятностью, скажем, 95% убедиться, что процент брака не превышает заявленных 0.1%

Что-то я не понял. Биномиальное распределение ведь асимптотически симметрично. И если фактически именно 0.1% бракованных, то надёжность гипотезы о том, что процент брака не превышает ровно 0.1%, будет примерно той же, что и для противоположной. Т.е. 50 процентов.

 
 
 
 
Сообщение04.07.2008, 14:25 
Аватара пользователя
На мой взгляд, так это обычная учебная задача. Обычно такие задачи решают с помощью т. Муавра - Лапласа: http://www.nsu.ru/matlab/Exponenta_RU/educat/class/test/9/intteor.asp.htm
http://www.nsu.ru/mmf/tvims/chernova/tv/lec/node61.htm.

 
 
 
 
Сообщение04.07.2008, 20:21 
С помощью формулы Муавра-Лапласа можно найти доверительный интервал по зарегистрированному проценту успехов. Например, если процент, полученный по выборке, есть 0.0998%, то вероятность того, что он фактически лежит в интервале от 0.0898% до 0.1098% -- такая-то, в зависимости от объёма выборки.

А вот вероятность того, что он именно меньше 0.1% -- примерно фифти-фифти и выйдет.

 
 
 
 
Сообщение04.07.2008, 20:28 
Условие задачи сформулировано крайне небрежно. Вряд ли можно уверенно предложить какое-либо решение. Хотелось бы обратить внимание на три момента.
1. В условии говорится о «предположительном» значении доли брака. Отсюда напрашивается вывод: требуется построить критерий проверки основной гипотезы $H_1$: доля брака не больше $k_0$, при альтернативе $H_2$: доля брака больше $k_0$.
2. В условии говорится о выборе «без возврата». Это означает большие объемы выборки по сравнению с объемом всего множества, и, как следствие, неприменимость биномиального приближения. Это согласуется с очень малым гипотетическим значением доли брака.
3. Неясно 1 – 0.95 — это точная верхняя грань вероятности отвергнуть верную основную гипотезу ($\alpha$) или точная верхняя грань вероятности отвергнуть верную альтернативу($\beta$). Вроде бы второе, но тогда неясно чему равно $\alpha$.

Боюсь, только автор задачи сможет пояснить — о чем она.
Добавлено на следующий день (в субботу)
Обозначим объем выборки через $n$, число бракованных деталей в выборке — через $k$, объем партии — через $N$, число бракованных деталей в партии — через $K$, гипотетическое число дефектов в партии через $k_0$, $k_0=[0.001N]$.
Пусть $\alpha=0$, $\beta=1-0.95$, тогда критерий будет иметь вид:
Если $k > k_0$, то основная гипотеза отвергается.
Очевидно, вероятность ошибки второго рода достигает максимума на ближайшей альтернативе ($K=k_0+1$). Следовательно $\beta=\sum\limits_{k=0}^{k_0}{C_K^k C_{N-K}^{n-k}/C_N^n}= 1-C_{N-(k_0+1)}^{n-(k_0+1)}$.
По заданному $N$ всегда можно найти такое минимальное $n$, что $\beta \le 1-0.95$.
Например:
$N = 1000$, $k_0 = 1$, $n=975$;
$N = 1999$, $k_0 = 1$, $n=1949$;
$N = 3000$, $k_0 = 3$, $n=2962$.
Возможно, я не правильно интерпретирую «% бракованных деталей», «усекая» до ближайшего целого, а не округляя. Но замена «усечения» на округление принципиально дело не меняет.
Добавлено в субботу вечером
Рассмотрим случай большой выборки: $N = 30000$.
При $\alpha=0$ и $k_0 = 30$ получим $n=25249$.
Пусть теперь $\alpha \ne 0$. Критерий будет иметь вид:
Если $k > k_c$, то основная гипотеза отвергается.
$\alpha = \sum\limits_{k=k_c+1}^{K}{C_K^k C_{N-K}^{n-k}/C_N^n}$, при $K = k_0$; $\beta = \sum\limits_{k=0}^{k_c}{C_K^k C_{N-K}^{n-k}/C_N^n}$, при $K = k_0 +1$.
Считая, что $\alpha=\beta=1-0.95$ ($\alpha \le 0.05$, $\beta \le 0.05$) при $k_c = 26$ получим минимальный объем выборки $n=22774$.
Для партии в 3000 изделий не получается положить $k_c < k_0$ с тем чтобы $\alpha \le 0.05$ — увеличение $\alpha$ c нуля до 0.05 не дает выигрыша в объеме выборки. Для партии в 30000 элементов выигрыш имеется. Конечно, выигрыш начинается с партий меньшего объема, но это численно не проверял, не было времени.
Добавлено в воскресенье утром
Биномиальное приближение. Обозначим долю брака в партии через $p$, гипотетическое значение доли брака в партии — $p_0 = 0.001$.
Критерий. Если $k > C$, то основная гипотеза отвергается.
$\alpha = \sum\limits_{k=C+1}^n C_n^k p^k (1-p)^{n-k}$, при $p=p_0$;
$\beta = \sum\limits_{k=0}^C C_n^k p^k(1-p)^{n-k}$, при $p=p_0$.
[Теперь $p$ на альтернативах ($p > p_0$) могут принимать сколь угодно близкие значения к $p_0$]. Отсюда вытекает, что, в нашем случае, $\alpha + \beta = 1$ и сделать эти величины одновременно малыми уже невозможно. [В нормальной аппроксимации все, естественно, будет обстоять также.] Остается делать малой вероятность отвергнуть альтернативу, когда она верна (т.е. не пропустить брак) невзирая на безжалостную отбраковку неплохих партий (делая $\alpha$ большой). Полагая $C=0$, $\beta \le 0.05$ получаем минимальный объем выборки 2995.
Полагая $C= 1$ и по-прежнему $\beta \le 0.05$ получаем минимальный объем выборки 4742. Т.е. начиная с этого объема, выборка, содержащая одну дефектную деталь, должна признаваться содержащей допустимый процент брака.
Эти результаты совпадают с полученными выше результатами faruk для биномиального приближения, однако мои результаты расходятся с результатами faruk при точном решении задачи т.е. при использовании гипергеометрического распределения.

 
 
 
 
Сообщение08.07.2008, 09:54 
Большое человеческое спасибо.
Ушел копать :)

 
 
 
 теория вероятностей
Сообщение17.11.2008, 09:26 
задача по теме гипергеометрическое распределение.
Предположим,что из озера вылавливают 1000 рыб,помечают их красной и выпускают обратно.При повторном отлове 1000 рыб среди них оказалось 100 помеченных.Какие выводы можно сделать относительно числа рыб в озере?помогите пожалуйста решить и оформить...

 
 
 
 
Сообщение17.11.2008, 11:04 
Аватара пользователя
Чтобы этот вопрос не выглядел как "решите за меня", напишите сначала, каким образом к этой задаче применяется стандартная гипергеометрическая схема, а также без формул, просто на уровне здравого смысла, что можно сказать про число рыб в озере. Какое их количество, к примеру, представляется наиболее вероятным?

 
 
 
 
Сообщение17.11.2008, 12:59 
10000 рыб-наиболее вероятное количество рыб в озере.
хм..подскажите как сюда вписывать формулы :( [/math][/url][/list][/quote][/u]

 
 
 
 
Сообщение17.11.2008, 14:46 
Аватара пользователя
По поводу записи формул читайте здесь и здесь

Добавлено спустя 1 час 4 минуты 35 секунд:

rosa1224 в сообщении #159124 писал(а):
10000 рыб-наиболее вероятное количество рыб в озере.


Нормально для начала. Теперь поясните, как в задаче возникает гипергеометрическое распределение. Поясните (без формул, только здравый смысл!), как пришли к числу 10000. Ну и поясните, для примера, что можете сказать насчет правдоподобия, скажем, числа 4000 как оценки количества рыб в озере.

 
 
 [ Сообщений: 15 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group