Наставьте меня на путь истинный, пж-ста
...
Ищу литературу (покупаю и готов покупать дальше необходимые книжки на английском), но еще не совсем уверен в точной постановке задачи, которую решаю.
Задача состоит в восстановлении дискретной функции плотности вероятности.
Есть большой набор данных:
{ Real: x, Real: y, X(x,y) },
где X - точка-множество в дискретном вероятностном пространстве (например, {{0,0},{1,2}).
x, y - экспертные оценки на некоторые общие вероятностные характеристики события, реализация которого есть X(x,y) (в первом приближении это можно не учитывать).
Стоит задача для заданных (x0, y0) найти лучшую оценку фпв Pr*{ X(x,y) }(x0, y0) в смысле функционала качества:
, где
- истинные значения вероятностей.
Первое, что приходит в голову - это разбить данные на группы по интервалам для x и y, и построить фпв для каждой группы - частотные функции. Но возникают как минимум две проблемы:
1) Как сглаживать фпв для малых выборок?
2) Как комбинировать функционалы от частотных функции фпв, чтобы результаты оставались в рамках выбранного уровня значимости?