В трехмерном пространстве расположен единичный куб, ребра которого лежат на осях координат, одна вершина находится в начале координат, а противоположная в точке (1,1,1).
В этом кубе задана выборка из ~50 000 точек. Точки внутри куба расположены случайным образом, плотность точек близка к постоянной по всему кубу. В каждой точке произошло испытание с успешным или неудачным исходом. Вероятность успешного исхода зависит только от координат точки, в которой произошло испытание. Известно, что функция вероятности непрерывная, гладкая, и при двух фиксированных координатах (произвольных), функция зависит от третьей таким образом, что внутри области определения имеет не более двух локальных экстремумов и двух перегибов по данной координате.
Необходимо определить функцию вероятности успешного исхода от координат на основании заданной выборки.
Для этого используется метод максимального правдоподобия: отыскивается максимум функционала:
где
- все точки успехов (всего N успехов),
- все точки неудач (всего M неудач),
- зависимость вероятности успеха от координат
Поиск максимума функционала ведется с помощью метода локальных вариаций.
Проблема в том, что вид функции вероятностей успеха заранее не известен, то есть поиск ведется не на каком-то конкретном классе функций, а на всех непрерывных гладких функциях, определенных на вышеупомянутом кубике и с областью значений [0,1].
Ясно, что если не накладывать дополнительных ограничений на функцию вероятности, то процесс поиска в итоге сведется к такой функции, которая будет равна единице во всех "успешных" точках, и нулю во всех "неудачных".
Промежуточный результат оценки в разрезе (с двумя фиксированными координатами): зависимость вероятности от одной координаты
Оценка стремится к единице там, где появляется успешное испытание, и к нулю, там где появляется неуспешное. Но, таких "американских горок" быть не должно: в этом разрезе может быть не более двух экстремумов и перегибов на (0,1).
Вопрос: как правильно сформулировать априорные ограничения, чтобы можно было применить их к методу локальных вариаций?
Есть ли какие-нибудь общепринятые правила для выборка формы вариации? Если, скажем в качестве вариации взять "горбик" с большой дисперсией, выглядящий так:
,
то таких колебаний вокруг точек успеха/неудачи уже не будет, так как пытаясь достичь этим горбиком успеха, метод локальных вариаций будет одновременно отдалять другие части функции вероятности от близлежащих неудач, и наоборот, тем самым сглаживая итоговую функцию вероятности. Таким образом, чем шире мы берем горбик-вариацию, тем итоговая функция более гладкая (в смысле, тем меньше на ней перепадов туда-сюда), но тем больше информации о функции мы теряем за счет этой высокодисперсионной вариации.
Вопрос: как определить оптимальное значение ширины вариации? Есть ли какие-то математические критерии, или это нужно делать "на глаз"?