2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Оценка множества типов по выборочным данным
Сообщение19.04.2013, 17:35 
прим. Это практическая задача фирмы где работает мой сын, возможно постановка некорректна.
Дана некая совокупность магазинов объема N и выборка из нее объема m
В каждом из магазинов есть набор чеков каких-то типов. Перечень типов составлен по данным обследования выборки. Какая вероятность того, что в полной совокупности не будет чеков вне этого перечня типов c достаточным уровнем значимости?.
--------------------------------------------
Понятно что данных в задаче слишком мало, тем не менее попробуем выудить из нее все.Обозначим
Вероятности появления чека j-типа - $p_j$
Объем выборки $m$, объем ген.совокупности $N$
Пусть все множество типов чеков T мощности t ,а подмножество T1 типы чеков обнаруженных в выборке –мощности $t_1$
обозначим суммарную вероятность чеков не появившихся типов через p Т.е. «склеим» типы непоявившихся чеков в один единый.
Вероятность событий не появления чеков дополнительных типов в выборке
$P_m(k=0)=q^m=(1-p)^m$
Если задаться каким то уровнем значимости например $\alpha=0.9$ то из $P_m(k=0) \geq \alpha$
следует $q \geq \alpha^{1/m}$
Если же оценить вероятность события $P_N(k>0) $
при условии $P_m(k=0)$ т.е наличия в полной совокупности хотя бы 1 чека нового типа не входящего в T1 то она очевидно равна
$$P_{N-m}(k>0)P_m(k=0)=(1-q^{N-m})q^m=q^m-q^N$
Если выполнено условие $q^{N-m} \geq 0.5 $ то получим
$ q^m-q^N \geq 0.5\alphfa=0.45$это довольно приличная вероятность
---------------------------------------------------------
1)Какие минимальные априорные сведения надо добавить к исходной постановке чтобы получить осмысленную модель?
2)Известна эта или близкие ей по постановке задачи в теории вероятностей.

 
 
 
 Re: Оценка множества типов по выборочным данным
Сообщение26.04.2013, 08:39 
Можно поставить задачу чуть по другому. Известно множество из N магазинов.
Сделана выборка по $m<N$ магазинах в результате которой получено заданное количество типов чеков $t_1$.Оценить какая должна быть минимальная доля $m/N$ чтобы вероятность ошибки принятия гипотезы $P(L_1){L_1: t=t_1}$ была не больше $1-\alpha$ (т.е. какой мин объем выборки надо сделать для минимизации ошибки 1 рода)
Пусть k - кол-во чеков неизвестного типа (не входящих в $t_1$)
Тогда вероятность ошибки при этом $P(k)=1-\frac{C^m_{N-k}}{C^m_N}$ а интересующая вероятность ошибки гипотезы
$P(L_1)=\sum{P(k)}$

 
 
 [ Сообщений: 2 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group