подбрасываем монетку. что раньше ОО или ОР

realeugene · 27/08/16 11953

Win probability: $w = (E - P)^{-1} q$
Mean winning length: $\overline L = \left(E - \operatorname{diag}(w)^{-1}\cdot P \cdot \operatorname{diag}(w)\right)^{-1} \cdot 1_n$

gris · 13/08/08 14496

Да, посмотрите ролик. Я не дотерпел до конца, но не прочь был бы почитать хороший правильный пост на тему.

realeugene · 27/08/16 11953

realeugene в сообщении #1620647 писал(а):

Mean winning length: $\overline L = \left(E - \operatorname{diag}(w)^{-1}\cdot P \cdot \operatorname{diag}(w)\right)^{-1} \cdot 1_n$

Можно ещё упростить: $\overline L = \left(\left(E - P\right)^{-1}w \right)\oslash w$

Vadim32 · 30/11/23 30

Цитата:

P0=P2/2 - единственный способ попасть в состояние P0 это выйти из P2 с орлом.
P1=P2/2 - единственный способ попасть в состояние P1 это выйти из P2 с решкой.
P2=P1/2+P3/2 - два способа попасть в P2, из P1 и P3 выйти с орлом.
P3=P0+P1/2+P3/2 - три способа попасть сюда: из состояния выигрыш, а также из P1 и P3 выйти решкой.
Ещё добавляем сумму всех вероятностей
P0+P1+P2+P3=1

решаем, получаем
P0=1/7
P1=1/7
P2=2/7
P3=3/7

Ответ: 7 бросков в среднем надо делать чтобы в игре с заменой получить [Орёл Орёл]

Ой, кажется ошибка.
P0+P1+P2+P3=1+P0 - вот так правильно, потому что в течение одного хода система была в двух состояниях сразу P0 и P3 без совершения хода.
Отсюда
P0=1/6
P1=1/6
P2=1/3
P3=1/2
Ответ: 6 бросков

realeugene · 27/08/16 11953

gris в сообщении #1620649 писал(а):

Да, посмотрите ролик.

Авторы там решают задачку с одной монеткой.

В общем случае идея простая. Есть конечный автомат, стартуя из некоторого состояния $i$ можно за один шаг или перейти в другое состояние $j$ с вероятностью $P_{ij}$ , или на этом шаге выиграть с вероятностью $q_i$ , или проиграть, три этих события несовместны и их вероятность в сумме равна единице, выигрыш или проигрыш останавливают игру.

Пусть $w_i$ - вероятность того, что стартуя из состояния $i$ мы в конце концов выиграем, а $\overline {L_i}$ - матожидание длины выигрышной последовательности начиная из состояния $i$ (при условии, что мы выиграли). Так как на каждом шаге выигрыш, проигрыш и переход в определённое другой состояни - несовместные события, мы эти матожидания можем по ним разложить в сумму по несовместным альтернативам. Мы или выигрываем за один шаг с вероятностью $q_i$ , или выигрываем начиная с перехода в одно из состояний $j$ с ожидаемой длиной выигрыша $\overline {L_j} + 1$ . Суммируем, учитываем, что матожидания условные при условии выигрыша, получаем рекуррентные уравнения:

$w_i = q_i + P_{ij} w_j$
$\overline {L_i} = \frac {1 \cdot q_i + \left(\overline {L_j} + 1\right) \cdot P_{ij} w_j} {q_i + P_{ij} w_j}$
Записываем в матричной форме, решаем, получаем:
$w = (E - P)^{-1} q$
$\overline L = \left(\left(E - P\right)^{-1}w \right)\oslash w$

TOTAL · 23/08/07 5525 Нов-ск

realeugene в сообщении #1620738 писал(а):

В общем случае идея простая. Есть конечный автомат, стартуя из некоторого состояния $i$ можно за один шаг или перейти в другое состояние $j$ с вероятностью $P_{ij}$ , или на этом шаге выиграть с вероятностью $q_i$ , или проиграть, три этих события несовместны и их вероятность в сумме равна единице, выигрыш или проигрыш останавливают игру.

Останавливает игру только выигрыш. Проигрыша там нет, есть лишь плата за каждый бросок.

realeugene · 27/08/16 11953

TOTAL в сообщении #1620741 писал(а):

Останавливает игру только выигрыш. Проигрыша там нет, есть лишь плата за каждый бросок.

Это в исходной задаче. Тем проще. Тогда $w = 1_n$ и $\overline L = \left(E - P\right)^{-1}\cdot 1_n$ . Нужна история на один ход, в матрице вероятностей переходов для бросков монетки (2 состояния) достаточно обнулить выигрышную комбинацию. Потом вычесть из единичной, вычислить обратную матрицу и просуммировать ряд, соответствующий стартовому состоянию (после орла).

Amw · 22/07/11 932

Vadim32 в сообщении #1620702 писал(а):

Ответ: 6 бросков

Это единственное, что требуется знать, чтобы изначально принять решение - НЕ ИГРАТЬ!

Научный форум dxdy

Правила форума

подбрасываем монетку. что раньше ОО или ОР

Кто сейчас на конференции