2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение01.12.2023, 20:06 


27/08/16
9426
Win probability: $$w = (E - P)^{-1} q$$
Mean winning length: $$\overline L = \left(E - \operatorname{diag}(w)^{-1}\cdot P \cdot \operatorname{diag}(w)\right)^{-1} \cdot 1_n$$

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение01.12.2023, 20:13 
Заслуженный участник
Аватара пользователя


13/08/08
14470
Да, посмотрите ролик. Я не дотерпел до конца, но не прочь был бы почитать хороший правильный пост на тему.

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение01.12.2023, 21:21 


27/08/16
9426
realeugene в сообщении #1620647 писал(а):
Mean winning length: $$\overline L = \left(E - \operatorname{diag}(w)^{-1}\cdot P \cdot \operatorname{diag}(w)\right)^{-1} \cdot 1_n$$
Можно ещё упростить: $$\overline L = \left(\left(E - P\right)^{-1}w \right)\oslash w$$

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 07:37 


30/11/23
22
Цитата:
P0=P2/2 - единственный способ попасть в состояние P0 это выйти из P2 с орлом.
P1=P2/2 - единственный способ попасть в состояние P1 это выйти из P2 с решкой.
P2=P1/2+P3/2 - два способа попасть в P2, из P1 и P3 выйти с орлом.
P3=P0+P1/2+P3/2 - три способа попасть сюда: из состояния выигрыш, а также из P1 и P3 выйти решкой.
Ещё добавляем сумму всех вероятностей
P0+P1+P2+P3=1

решаем, получаем
P0=1/7
P1=1/7
P2=2/7
P3=3/7

Ответ: 7 бросков в среднем надо делать чтобы в игре с заменой получить [Орёл Орёл]


Ой, кажется ошибка.
P0+P1+P2+P3=1+P0 - вот так правильно, потому что в течение одного хода система была в двух состояниях сразу P0 и P3 без совершения хода.
Отсюда
P0=1/6
P1=1/6
P2=1/3
P3=1/2
Ответ: 6 бросков

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 16:05 


27/08/16
9426
gris в сообщении #1620649 писал(а):
Да, посмотрите ролик.
Авторы там решают задачку с одной монеткой.

В общем случае идея простая. Есть конечный автомат, стартуя из некоторого состояния $i$ можно за один шаг или перейти в другое состояние $j$ с вероятностью $P_{ij}$, или на этом шаге выиграть с вероятностью $q_i$, или проиграть, три этих события несовместны и их вероятность в сумме равна единице, выигрыш или проигрыш останавливают игру.

Пусть $w_i$ - вероятность того, что стартуя из состояния $i$ мы в конце концов выиграем, а $\overline {L_i}$ - матожидание длины выигрышной последовательности начиная из состояния $i$ (при условии, что мы выиграли). Так как на каждом шаге выигрыш, проигрыш и переход в определённое другой состояни - несовместные события, мы эти матожидания можем по ним разложить в сумму по несовместным альтернативам. Мы или выигрываем за один шаг с вероятностью $q_i$, или выигрываем начиная с перехода в одно из состояний $j$ с ожидаемой длиной выигрыша $\overline {L_j} + 1$. Суммируем, учитываем, что матожидания условные при условии выигрыша, получаем рекуррентные уравнения:

$$w_i = q_i + P_{ij} w_j$$
$$\overline {L_i} = \frac {1 \cdot q_i + \left(\overline {L_j} + 1\right) \cdot P_{ij} w_j} {q_i + P_{ij} w_j}$$
Записываем в матричной форме, решаем, получаем:
$$w = (E - P)^{-1} q$$
$$\overline L = \left(\left(E - P\right)^{-1}w \right)\oslash w$$

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 16:41 
Заслуженный участник
Аватара пользователя


23/08/07
5423
Нов-ск
realeugene в сообщении #1620738 писал(а):
В общем случае идея простая. Есть конечный автомат, стартуя из некоторого состояния $i$ можно за один шаг или перейти в другое состояние $j$ с вероятностью $P_{ij}$, или на этом шаге выиграть с вероятностью $q_i$, или проиграть, три этих события несовместны и их вероятность в сумме равна единице, выигрыш или проигрыш останавливают игру.
Останавливает игру только выигрыш. Проигрыша там нет, есть лишь плата за каждый бросок.

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение02.12.2023, 17:15 


27/08/16
9426
TOTAL в сообщении #1620741 писал(а):
Останавливает игру только выигрыш. Проигрыша там нет, есть лишь плата за каждый бросок.
Это в исходной задаче. Тем проще. Тогда $w = 1_n$ и $\overline L = \left(E - P\right)^{-1}\cdot 1_n$. Нужна история на один ход, в матрице вероятностей переходов для бросков монетки (2 состояния) достаточно обнулить выигрышную комбинацию. Потом вычесть из единичной, вычислить обратную матрицу и просуммировать ряд, соответствующий стартовому состоянию (после орла).

 Профиль  
                  
 
 Re: подбрасываем монетку. что раньше ОО или ОР
Сообщение03.12.2023, 14:17 
Аватара пользователя


22/07/11
839
Vadim32 в сообщении #1620702 писал(а):
Ответ: 6 бросков

Это единственное, что требуется знать, чтобы изначально принять решение - НЕ ИГРАТЬ! :D

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 53 ]  На страницу Пред.  1, 2, 3, 4

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Solaris86


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group