Чему равна вероятность того, что распределение -- данное?

epros · 22.09.2010, 09:24

Dims в сообщении #354779 писал(а):

epros в сообщении #354756 писал(а):

Я бы даже сказал, что нужна вероятность $P(\vec{p} | a_1, \dots , a_N)$ , где $a_1, \dots , a_N$ - последовательность выпавших символов. В смысле, если выпали два "А", а потом одно "Б", то это не то же самое, что выпало "А", потом "Б", а потом "А" (хотя вероятности и одинаковые).

В моём случае это неразличимые ситуации -- то есть, вывод должен быть сделан один и тот же.

Вы не сказали, что Вам сообщаются только количества выпавших символов, но не их порядок. Впрочем, в данном случае это действительно неважно.

Dims в сообщении #354779 писал(а):

epros в сообщении #354314 писал(а):

Здесь $P(\alpha)$ (функция без индекса) - некое априорное распределение параметра $\alpha$ , которое тоже должно быть задано.

То есть, фактически, это вероятности того, что мы столкнёмся с тем или иным распределением, которое нужно распознать. Так?

Априорные вероятности.

Dims в сообщении #354779 писал(а):

А что такое величина с буквой бета?

Бета - это просто связанная переменная в формуле. Функция та же, что и для альфы.

Dims в сообщении #354779 писал(а):

По формуле Байеса

$P(p|H) = \frac{P(H|p) \cdot P(p)}{P(H)}$

Здесь $P(p)$ совпадает с Вашей величиной с альфа.

Точнее, определённая Вами величина $\vec{p} = (p(1), \dots , p(M))$ совпадает с определённой мной величиной $\vec{\alpha} = (\alpha_1, \dots , \alpha_M)$

Dims в сообщении #354779 писал(а):

А $P(H)$ , наверное, с бета?

Зачем тут нужно априорное распределение $\vec{H}$ ? Забудьте о нём. Если Вас беспокоит, что эта величина стоит в знаменателе формулы Байеса, так это просто нормировочный коэффициент.

Dims в сообщении #354779 писал(а):

Если у нас выпала определённая гистограмма, то наша задача -- сравнить между собой все вероятности $P(p|H)$ для каждого из распознаваемых распределений $p$ и выбрать из них максимальное.

Вы ставили задачу не так, чтобы "выбрать максимальное". Вы спрашивали о "распределении распределения". Вот это оно и есть: апостериорные вероятности для вектора $\vec{p}$ . Если хотите выбрать конкретное распределение, то по максимуму вероятности это будет:

$p(i) = \frac{H_i}{N}$ (выше я писал об этом),

а оценка по среднему даст:

$p(i) = \frac{H_i + 1}{N + M}$ .

Dims в сообщении #354779 писал(а):

А вот величина $P(p)$ желательна.

Однако, возможно, что разумного предположения о ней сделать нельзя, поэтому нужно будет положить это распределение равномерным, то есть, $P(p) = const$ . В этом случае задача сведётся к изначальной, то есть, к выбору согласно величине $P(H|p)$ .

Величина $P(\vec{H}|\vec{p})$ называется функцией правдоподобия. Поэтому выбор по её максимуму называется оценкой по максимуму правдоподобия. Как видите, он соответствует случаю априорной равновероятности.

Dims в сообщении #354779 писал(а):

Однако, если статистики достаточно много, то величина $P(H|p)$ будет сильно дифференцирована для разных p и, в этом случае, дополнительный учёт $P(p)$ вообще ничего не даст.

Статистика, как известно, это худшая разновидность лжи. :wink:

Это можно воотчию наблюдать на примерах, когда даже при "достаточно большой выборке" мы, основываясь на ошибочных исходных предположениях, приходим к неверным оценкам. Это относится и к правильности выбора априорного распределения.

Dims · 22.09.2010, 09:56

Ок, спасибо за разъяснения! :)

В теоретическом плане мне тут, как говорится, ещё учиться и учиться, а в практическом, я думаю, уже получу нужный мне результат...

Научный форум dxdy

Чему равна вероятность того, что распределение -- данное?