2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Ядерное сглаживание диск. распределения
Сообщение01.10.2009, 13:11 
Подскажите, где можно почитать подробно о ядерном сглаживании диск. распределения, которое зависит от параметра?
В обычных учебниках по непараметрической статистике такая задача не рассматривается :(.
Например, нужно найти плотность вероятностей для исходов бросания кости, если известно, что кость несимметричная и задан некоторый параметр ассиметрии кости. То есть, например, на основании данных (0<x<1 - параметр ассиметрии, q - исход бросания):
(0.7, 5)
(0.5, 1)
(0.6, 1)
(0.1, 2)
(0.2, 4)
...
Нужно для заданного параметра ассиметрии x0 найти распределение вероятностей (p1(x0), p2(x0),..., p6(x0)).

Понятно, что можно пытаться оценивать совместную плотность, но какое тогда вводить ядро, на вскидку, не так очевидно.

Разумным выглядит следующее сглаживание эмпирического распределения (\nu(q;x0)=$\#\{q \in S_{x0-\Delta/2,x0+\Delta/2}\}/ \Omega(S_{x0-\Delta/2,x0+\Delta/2})$, $S_{x0-\Delta/2,x0+\Delta/2}$ - выборка результатов с параметром $x0-\Delta/2<x<x0+\Delta/2$ в количестве $\Omega(S_{x0-\Delta/2,x0+\Delta/2})$, #{...} - количество исходов с заданным q):
$\nu_W(q0;x0) = \frac{\sum_{(x_i,q_i) \in S_{(0,1)}}{\delta(q_i=q0)}{W((x_i-x0)/h)}}{\sum_{(x_i,q_i) \in S_{(0,1)}}{W((x_i-x0)/h)}} $, W - ядро.

Хотелось бы понять, справедливо ли в этом случае все то, что обычно справедливо для ядерного сглаживания.

И где можно найти софт для подбора значений "окна" h?

 
 
 
 Re: Ядерное сглаживание диск. распределения
Сообщение03.10.2009, 14:13 
Вообще, народ в книгах ("Smoothing methods in statistics") рекомендует сглаживать абсолютные эмпирические частоты (через регрессию). Хотя это нарушает связь (сумма оценок вероятностей равна 1), но такой способ выглядит вполне разумным.

 
 
 
 Re: Ядерное сглаживание диск. распределения
Сообщение04.10.2009, 23:59 
Андрей1 в сообщении #248057 писал(а):
$\nu_W(q0;x0) = \frac{\sum_{(x_i,q_i) \in S_{(0,1)}}{\delta(q_i=q0)}{W((x_i-x0)/h)}}{\sum_{(x_i,q_i) \in S_{(0,1)}}{W((x_i-x0)/h)}} $

Таки, это сглаживание выглядит более разумным.
1) Параметр h, видимо, можно подбирать из принципа максимального правдоподобия. Правда, как выписать эту функцию в текущей постановке не так очевидно: понятно как это сделать только для интервала по x. Но можно что-нибудь придумать как найти усредненное прадвоподобие, конечно.
2) "Bias-Variance Tradeoff" означает, что нужно выбирать h так, чтобы быть довольным либо Bias, либо Variance. Посему нужно оценивать плотность так, чтобы зажимать либо Bias, либо Variance. Причем, как "зажимать" может следовать из задачи...

 
 
 [ Сообщений: 3 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group