В Вашем выводе присутствуют такое слова:
До этого соображения легко додуматься, если предположить, что распределение для величины
должно быть пропорционально вероятности получить полученный результат с этой величиной
.
Я сейчас попробую убедить Вас, что эти слова верны тогда и только тогда, когда до опыта предполагается, что неизвестная вероятность
(она же тут -
) равномерно распределена на
.
Рассмотрим пример с монеткой, выбранной перед опытом наугад из двух вариантов - монета с вероятностью единицы
и монета симметричная. В этом случае заранее известно, что
и никаких иных значений
принимать не может. Какое бы количество единиц (
) и двоек (
) мы ни получили,
Но зато по формуле условной вероятности
Здесь
- вероятность получить данную выборку при
, а
- вероятность получить данную выборку при неизвестно каком
, которое с равными шансами любое из двух значений.
Окончательно,
Аналогично,
В каком-то смысле полученные два ответа тоже удовлетворяют процитированной выше фразе: вероятность иметь данное значение
после опыта пропорциональна вероятности получить при данном
этот результат опыта. Но ответ получился совсем иным! А почему? А потому, что мы знали, что
никаких иных значений, кроме этих двух, принимать не может! Видите, что делает априорное распределение? Правда, пока оно хоть и дискретное, но всё же равномерное.
А теперь перекосим априорное распределение
: пусть вероятности значений
и
будут
и
. Например, дядя изготовил три симметричных монеты и одну косую, а потом дал нам одну из этих четырёх монет наугад. Тогда ответ переменится:
и
Теперь вероятность получить данное значение
уже не пропорциональна вероятности иметь
единиц при этом
.
Если до опыта распределение
имеет плотность
, то условная плотность
при выборке с
единицами и
двойками будет
Математическое ожидание этого распределения называется байесовской оценкой для
. При разных
и условная плотность, и байесовская оценка будут разными.
Посоветовать почитать что-то не смогу.