В трехмерном пространстве расположен единичный куб, ребра которого лежат на осях координат, одна вершина находится в начале координат, а противоположная в точке (1,1,1).
В этом кубе задана выборка из ~50 000 точек. Точки внутри куба расположены случайным образом, плотность точек близка к постоянной по всему кубу. В каждой точке произошло испытание с успешным или неудачным исходом. Вероятность успешного исхода зависит только от координат точки, в которой произошло испытание. Известно, что функция вероятности непрерывная, гладкая, и при двух фиксированных координатах (произвольных), функция зависит от третьей таким образом, что внутри области определения имеет не более двух локальных экстремумов и двух перегибов по данной координате.
Необходимо определить функцию вероятности успешного исхода от координат на основании заданной выборки.
Для этого используется метод максимального правдоподобия: отыскивается максимум функционала:
![$\[F\left(p\right)=\prod^N_{i=1}{{p(s}_{i\ })}\times \prod^M_{i=1}{{(1-p(f}_{i\ }))},\] $ $\[F\left(p\right)=\prod^N_{i=1}{{p(s}_{i\ })}\times \prod^M_{i=1}{{(1-p(f}_{i\ }))},\] $](https://dxdy-03.korotkov.co.uk/f/a/c/c/acc508166a6d8462da474556b06c9d7b82.png)
где

- все точки успехов (всего N успехов),

- все точки неудач (всего M неудач),

- зависимость вероятности успеха от координат
Поиск максимума функционала ведется с помощью метода локальных вариаций.
Проблема в том, что вид функции вероятностей успеха заранее не известен, то есть поиск ведется не на каком-то конкретном классе функций, а на всех непрерывных гладких функциях, определенных на вышеупомянутом кубике и с областью значений [0,1].
Ясно, что если не накладывать дополнительных ограничений на функцию вероятности, то процесс поиска в итоге сведется к такой функции, которая будет равна единице во всех "успешных" точках, и нулю во всех "неудачных".
Промежуточный результат оценки в разрезе (с двумя фиксированными координатами): зависимость вероятности от одной координаты

Оценка стремится к единице там, где появляется успешное испытание, и к нулю, там где появляется неуспешное. Но, таких "американских горок" быть не должно: в этом разрезе может быть не более двух экстремумов и перегибов на (0,1).
Вопрос: как правильно сформулировать априорные ограничения, чтобы можно было применить их к методу локальных вариаций?
Есть ли какие-нибудь общепринятые правила для выборка формы вариации? Если, скажем в качестве вариации взять "горбик" с большой дисперсией, выглядящий так:

,
то таких колебаний вокруг точек успеха/неудачи уже не будет, так как пытаясь достичь этим горбиком успеха, метод локальных вариаций будет одновременно отдалять другие части функции вероятности от близлежащих неудач, и наоборот, тем самым сглаживая итоговую функцию вероятности. Таким образом, чем шире мы берем горбик-вариацию, тем итоговая функция более гладкая (в смысле, тем меньше на ней перепадов туда-сюда), но тем больше информации о функции мы теряем за счет этой высокодисперсионной вариации.
Вопрос: как определить оптимальное значение ширины вариации? Есть ли какие-то математические критерии, или это нужно делать "на глаз"?