Смотрите сюда. Пусть есть случайная величина
и какая-то сигма-алгебра
. Случайная величина
называется условным м.о. величины
относительно
(т.е.
), если
измерима относительно
и для любого множества
выполняется равенство
. Смысл заключается в том, что если какая-то с.в. интегрируется по какому-то событию, то ее можно заменить на условное м.о. относительно любой сигма-алгебры, содержащей это событие.
Когда говорят об условном м.о. относительно некоторой другой с.в.:
, то имеют в виду условное м.о. относительно сигма-алгебры
, порожденной величиной
. Так как
должна быть измерима относительно этой сигма-алгебры, то отсюда несложно вывести, что
должна быть некоторой измеримой функцией от
:
. Когда говорят про
, то под этим понимается число, равное
.
Когда говорят про условную вероятность некоторого события
, то это означает условное м.о. случайной величины, равной индикатору этого события.
В Вашем случае дано, что
(*)
Теперь мы хотим найти совместную вероятность
, где
- любое борелевское множество. Выражаем через индикаторы и интеграл по всему пространству
:
Теперь смотрим: интеграл берется по множеству, принадлежащему сигма-алгебре
, порожденной величиной
. Значит, можно заменить случайную величину под интегралом заменить на условное м.о. относительно этой случайной величины, которое известно (*):
где использована замена переменных под интегралом Лебега. Теперь если взять в качестве
множество
, то получится ровно та формула, которую я привел.
Добавлено спустя 1 час 19 минут 17 секунд:
Впрочем, можно получить результат и "инженерными" методами. Для этого применяется следующий подход, довольно полезный и наглядный. Во всех случаях, когда работаете с плотностью вероятности
, умножайте ее на бесконечно малый элемент длины
и интерпретируйте выражение
как вероятность попасть в окрестность точки
размера
. На самом деле это и есть эта вероятность, только с точностью до слагаемых большего порядка малости (строго говоря, если плотность обладает достаточной степенью гладкости в этой точке).
Тогда вы уже работаете с обычными ненулевыми вероятностями событий. Та формула, которую здесь нужно получить - это просто формула Байеса для обычных событий.
Обычно этот подход хорошо работает. Использовать его для доказательств я бы не стал (тогда в любом случае это нужно делать аккуратнее), но понимать и интерпретировать уже готовые формулы он очень хорошо помогает.