2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение01.12.2023, 20:06 


27/08/16
9426
Win probability: $$w = (E - P)^{-1} q$$
Mean winning length: $$\overline L = \left(E - \operatorname{diag}(w)^{-1}\cdot P \cdot \operatorname{diag}(w)\right)^{-1} \cdot 1_n$$

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение01.12.2023, 20:13 
Заслуженный участник
Аватара пользователя


13/08/08
14454
Да, посмотрите ролик. Я не дотерпел до конца, но не прочь был бы почитать хороший правильный пост на тему.

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение01.12.2023, 21:21 


27/08/16
9426
realeugene в сообщении #1620647 писал(а):
Mean winning length: $$\overline L = \left(E - \operatorname{diag}(w)^{-1}\cdot P \cdot \operatorname{diag}(w)\right)^{-1} \cdot 1_n$$
Можно ещё упростить: $$\overline L = \left(\left(E - P\right)^{-1}w \right)\oslash w$$

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 07:37 


30/11/23
14
Цитата:
P0=P2/2 - единственный способ попасть в состояние P0 это выйти из P2 с орлом.
P1=P2/2 - единственный способ попасть в состояние P1 это выйти из P2 с решкой.
P2=P1/2+P3/2 - два способа попасть в P2, из P1 и P3 выйти с орлом.
P3=P0+P1/2+P3/2 - три способа попасть сюда: из состояния выигрыш, а также из P1 и P3 выйти решкой.
Ещё добавляем сумму всех вероятностей
P0+P1+P2+P3=1

решаем, получаем
P0=1/7
P1=1/7
P2=2/7
P3=3/7

Ответ: 7 бросков в среднем надо делать чтобы в игре с заменой получить [Орёл Орёл]


Ой, кажется ошибка.
P0+P1+P2+P3=1+P0 - вот так правильно, потому что в течение одного хода система была в двух состояниях сразу P0 и P3 без совершения хода.
Отсюда
P0=1/6
P1=1/6
P2=1/3
P3=1/2
Ответ: 6 бросков

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 16:05 


27/08/16
9426
gris в сообщении #1620649 писал(а):
Да, посмотрите ролик.
Авторы там решают задачку с одной монеткой.

В общем случае идея простая. Есть конечный автомат, стартуя из некоторого состояния $i$ можно за один шаг или перейти в другое состояние $j$ с вероятностью $P_{ij}$, или на этом шаге выиграть с вероятностью $q_i$, или проиграть, три этих события несовместны и их вероятность в сумме равна единице, выигрыш или проигрыш останавливают игру.

Пусть $w_i$ - вероятность того, что стартуя из состояния $i$ мы в конце концов выиграем, а $\overline {L_i}$ - матожидание длины выигрышной последовательности начиная из состояния $i$ (при условии, что мы выиграли). Так как на каждом шаге выигрыш, проигрыш и переход в определённое другой состояни - несовместные события, мы эти матожидания можем по ним разложить в сумму по несовместным альтернативам. Мы или выигрываем за один шаг с вероятностью $q_i$, или выигрываем начиная с перехода в одно из состояний $j$ с ожидаемой длиной выигрыша $\overline {L_j} + 1$. Суммируем, учитываем, что матожидания условные при условии выигрыша, получаем рекуррентные уравнения:

$$w_i = q_i + P_{ij} w_j$$
$$\overline {L_i} = \frac {1 \cdot q_i + \left(\overline {L_j} + 1\right) \cdot P_{ij} w_j} {q_i + P_{ij} w_j}$$
Записываем в матричной форме, решаем, получаем:
$$w = (E - P)^{-1} q$$
$$\overline L = \left(\left(E - P\right)^{-1}w \right)\oslash w$$

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 16:41 
Заслуженный участник
Аватара пользователя


23/08/07
5420
Нов-ск
realeugene в сообщении #1620738 писал(а):
В общем случае идея простая. Есть конечный автомат, стартуя из некоторого состояния $i$ можно за один шаг или перейти в другое состояние $j$ с вероятностью $P_{ij}$, или на этом шаге выиграть с вероятностью $q_i$, или проиграть, три этих события несовместны и их вероятность в сумме равна единице, выигрыш или проигрыш останавливают игру.
Останавливает игру только выигрыш. Проигрыша там нет, есть лишь плата за каждый бросок.

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 17:15 


27/08/16
9426
TOTAL в сообщении #1620741 писал(а):
Останавливает игру только выигрыш. Проигрыша там нет, есть лишь плата за каждый бросок.
Это в исходной задаче. Тем проще. Тогда $w = 1_n$ и $\overline L = \left(E - P\right)^{-1}\cdot 1_n$. Нужна история на один ход, в матрице вероятностей переходов для бросков монетки (2 состояния) достаточно обнулить выигрышную комбинацию. Потом вычесть из единичной, вычислить обратную матрицу и просуммировать ряд, соответствующий стартовому состоянию (после орла).

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение03.12.2023, 14:17 
Аватара пользователя


22/07/11
838
Vadim32 в сообщении #1620702 писал(а):
Ответ: 6 бросков

Это единственное, что требуется знать, чтобы изначально принять решение - НЕ ИГРАТЬ! :D

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 53 ]  На страницу Пред.  1, 2, 3, 4

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group