2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 Re: Чему равна вероятность того, что распределение -- данное?
Сообщение22.09.2010, 09:24 
Аватара пользователя
Dims в сообщении #354779 писал(а):
epros в сообщении #354756 писал(а):
Я бы даже сказал, что нужна вероятность $P(\vec{p} | a_1, \dots , a_N)$, где $a_1, \dots , a_N$ - последовательность выпавших символов. В смысле, если выпали два "А", а потом одно "Б", то это не то же самое, что выпало "А", потом "Б", а потом "А" (хотя вероятности и одинаковые).
В моём случае это неразличимые ситуации -- то есть, вывод должен быть сделан один и тот же.
Вы не сказали, что Вам сообщаются только количества выпавших символов, но не их порядок. Впрочем, в данном случае это действительно неважно.

Dims в сообщении #354779 писал(а):
epros в сообщении #354314 писал(а):
Здесь $P(\alpha)$ (функция без индекса) - некое априорное распределение параметра $\alpha$, которое тоже должно быть задано.
То есть, фактически, это вероятности того, что мы столкнёмся с тем или иным распределением, которое нужно распознать. Так?
Априорные вероятности.

Dims в сообщении #354779 писал(а):
А что такое величина с буквой бета?
Бета - это просто связанная переменная в формуле. Функция та же, что и для альфы.

Dims в сообщении #354779 писал(а):
По формуле Байеса

$P(p|H) = \frac{P(H|p) \cdot P(p)}{P(H)}$

Здесь $P(p)$ совпадает с Вашей величиной с альфа.
Точнее, определённая Вами величина $\vec{p} = (p(1), \dots , p(M))$ совпадает с определённой мной величиной $\vec{\alpha} = (\alpha_1, \dots , \alpha_M)$

Dims в сообщении #354779 писал(а):
А $P(H)$, наверное, с бета?
Зачем тут нужно априорное распределение $\vec{H}$? Забудьте о нём. Если Вас беспокоит, что эта величина стоит в знаменателе формулы Байеса, так это просто нормировочный коэффициент.

Dims в сообщении #354779 писал(а):
Если у нас выпала определённая гистограмма, то наша задача -- сравнить между собой все вероятности $P(p|H)$ для каждого из распознаваемых распределений $p$ и выбрать из них максимальное.
Вы ставили задачу не так, чтобы "выбрать максимальное". Вы спрашивали о "распределении распределения". Вот это оно и есть: апостериорные вероятности для вектора $\vec{p}$. Если хотите выбрать конкретное распределение, то по максимуму вероятности это будет:

$p(i) = \frac{H_i}{N}$ (выше я писал об этом),

а оценка по среднему даст:

$p(i) = \frac{H_i + 1}{N + M}$.

Dims в сообщении #354779 писал(а):
А вот величина $P(p)$ желательна.

Однако, возможно, что разумного предположения о ней сделать нельзя, поэтому нужно будет положить это распределение равномерным, то есть, $P(p) = const$. В этом случае задача сведётся к изначальной, то есть, к выбору согласно величине $P(H|p)$.
Величина $P(\vec{H}|\vec{p})$ называется функцией правдоподобия. Поэтому выбор по её максимуму называется оценкой по максимуму правдоподобия. Как видите, он соответствует случаю априорной равновероятности.

Dims в сообщении #354779 писал(а):
Однако, если статистики достаточно много, то величина $P(H|p)$ будет сильно дифференцирована для разных p и, в этом случае, дополнительный учёт $P(p)$ вообще ничего не даст.
Статистика, как известно, это худшая разновидность лжи. :wink: Это можно воотчию наблюдать на примерах, когда даже при "достаточно большой выборке" мы, основываясь на ошибочных исходных предположениях, приходим к неверным оценкам. Это относится и к правильности выбора априорного распределения.

 
 
 
 Re: Чему равна вероятность того, что распределение -- данное?
Сообщение22.09.2010, 09:56 
Аватара пользователя
Ок, спасибо за разъяснения! :)

В теоретическом плане мне тут, как говорится, ещё учиться и учиться, а в практическом, я думаю, уже получу нужный мне результат...

 
 
 [ Сообщений: 17 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group