Поиск функции вероятности от координат

KonstantinR · 08.07.2013, 09:47

В трехмерном пространстве расположен единичный куб, ребра которого лежат на осях координат, одна вершина находится в начале координат, а противоположная в точке (1,1,1).

В этом кубе задана выборка из ~50 000 точек. Точки внутри куба расположены случайным образом, плотность точек близка к постоянной по всему кубу. В каждой точке произошло испытание с успешным или неудачным исходом. Вероятность успешного исхода зависит только от координат точки, в которой произошло испытание. Известно, что функция вероятности непрерывная, гладкая, и при двух фиксированных координатах (произвольных), функция зависит от третьей таким образом, что внутри области определения имеет не более двух локальных экстремумов и двух перегибов по данной координате.

Необходимо определить функцию вероятности успешного исхода от координат на основании заданной выборки.

Для этого используется метод максимального правдоподобия: отыскивается максимум функционала:

$\[F\left(p\right)=\prod^N_{i=1}{{p(s}_{i\ })}\times \prod^M_{i=1}{{(1-p(f}_{i\ }))},\]$

где $s_i$ - все точки успехов (всего N успехов),
$f_i$ - все точки неудач (всего M неудач),
$p$ - зависимость вероятности успеха от координат

Поиск максимума функционала ведется с помощью метода локальных вариаций.

Проблема в том, что вид функции вероятностей успеха заранее не известен, то есть поиск ведется не на каком-то конкретном классе функций, а на всех непрерывных гладких функциях, определенных на вышеупомянутом кубике и с областью значений [0,1].

Ясно, что если не накладывать дополнительных ограничений на функцию вероятности, то процесс поиска в итоге сведется к такой функции, которая будет равна единице во всех "успешных" точках, и нулю во всех "неудачных".

Промежуточный результат оценки в разрезе (с двумя фиксированными координатами): зависимость вероятности от одной координаты

Оценка стремится к единице там, где появляется успешное испытание, и к нулю, там где появляется неуспешное. Но, таких "американских горок" быть не должно: в этом разрезе может быть не более двух экстремумов и перегибов на (0,1).

Вопрос: как правильно сформулировать априорные ограничения, чтобы можно было применить их к методу локальных вариаций?

Есть ли какие-нибудь общепринятые правила для выборка формы вариации? Если, скажем в качестве вариации взять "горбик" с большой дисперсией, выглядящий так:

,
то таких колебаний вокруг точек успеха/неудачи уже не будет, так как пытаясь достичь этим горбиком успеха, метод локальных вариаций будет одновременно отдалять другие части функции вероятности от близлежащих неудач, и наоборот, тем самым сглаживая итоговую функцию вероятности. Таким образом, чем шире мы берем горбик-вариацию, тем итоговая функция более гладкая (в смысле, тем меньше на ней перепадов туда-сюда), но тем больше информации о функции мы теряем за счет этой высокодисперсионной вариации.

Вопрос: как определить оптимальное значение ширины вариации? Есть ли какие-то математические критерии, или это нужно делать "на глаз"?

KonstantinR · 09.07.2013, 15:13

Более не актуально.

Научный форум dxdy

Поиск функции вероятности от координат