2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Непараметрическое сглаживание и разрешение неравенств
Сообщение08.05.2009, 10:41 
Ищу любую информацию о следующей задаче:

* Исходом является случайный вектор с k единицами из n (k < K << n). Например, {0,1,0,0,1,…,0,1}.
* K ~ 4, n ~ 100
* s - количество единиц в случайном векторе.
* Допустим, есть две группы реализаций (G и H) случайных векторов:
1)
{0,0,…,0} – N_G(s=0) раз (случайное количество)
{0,0,…,1}, {0,0,…,1,0},..., {1,0,…,0,0,0} – всего N_G(s=1) раз (случайное количество случайных векторов)
{0,0,…,1,1}, {0,0,…,1,0,1}, ..., {1,1,…,0,0,0,0} – всего N_G(s=2) раз
...
{0,0,…,1,1},...,{1,1,…,0,0} - и так далее до N_G(s=K).

Всего N_G = N_G(s=0) + … + N_G(s=K) реализаций в группе G.

2)
{0,0,…,0} – N_H(s=0) раз (случайное количество)
{0,0,…,1}, {0,0,…,1,0}, ...,{1,0,…,0,0,0} – всего N_H(s=1) раз (случайное количество случайных векторов)
{0,0,…,1,1}, {0,0,…,1,0,1},..., {1,1,…,0,0,0} – всего N_H(s=2) раз

{0,0,…,1,1}, ..., {1,1,…,0,0}, - и так далее до N_H(s=K).

Всего N_H= N_H(s=0)+…+ N_H(s=K) реализаций в группе H.

* s1 - число единиц в позициях от 1 до u (u ~ 50 задано). s2 - число единиц в позициях от u+1 до n: s1 + s2 = s.

* Принимаем, что частотные оценки вероятностей \nu_G(s=k) и \nu_H(s=k) (частоты события s=k в группах G и H) и для условных вероятностей \nu_G(s1=i|s=j), \nu_G(s1=i|s=j) - являются наилучшими оценками вероятностей (несмещенными и состоятельными), с дисперсиями, зависящими только от N_G и N_H.

* Среднее число единиц <s>_G = 0*\nu_G(s=0) + 1*\nu_G(s=1) + ... ,
<s>_H = 0*\nu_H(s=0) + 1*\nu_H(s=1) + ...

* Верно ли, что при N_G > 150 и N_H > 150, P(<s>_G - M_G(s)) и P(<s>_H - M_H(s)), где M_G(s=k) - математическое ожидание числа единиц, можно считать (примерно) нормальным распределением.

* Допустим известно, что должно быть M_G(s=k) \ge M_H(s=k).

* Найти допустимые алгоритмы трансформации данных для групп G и H, такие, чтобы после этих трансформаций: {<s>_G} \ge {<s>_H} и частотные оценки вероятности оставались бы наилучшими оценками вероятностей.

 
 
 [ 1 сообщение ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group