У нас есть правильный 6-гранный кубик. Наша цель – при броске получить максимальное кол-во очков. Разрешается перебросить кубик 1 раз. Чем больше очков выпало, тем больше наша прибыль.
Вопрос 1: Какой стратегии мы должны придерживаться, чтобы максимизировать нашу прибыль?
Вопрос 2: Чему равно математическое ожидание кол-ва очков при оптимальной стратегии?
Сперва я рассуждал по-житейски.
Математическое ожидание кол-ва очков при однократном бросании –
.
Если при первом бросании выпадает меньше
, то есть смысл перебросить, в противном случае не перебрасываем.
На этапе первого бросания выделяем полную группу попарно несовместных событий: "выпало менее
очков" и "выпало более
очков".
Математическое ожидание кол-ва выпавших очков при такой стратеги равно
.
5 в этой формуле – это математическое ожидание выпавших очков, когда кол-во выпавших очков больше
.
Интуиция подсказывает, что данная формула верна. Но почему – не ясно. Она похожа на формулу полной вероятности, но это не она.
Решил проверить решение более строгим подходом.
Давайте построим случайную величину
выпавших очков, зависящую от параметра
. Если при первом бросании выпадает кол-во очков меньше или равно
, то перебрасываем. В противном случае не перебрасываем.
– вероятность выпадения
очков при условии, что мы перебрасываем кубик, если при первом броске выпало очков меньше или равно
(
).
Математическое ожидание этой случайной величины равно:
,
,
.
То есть, оптимальная стратегия достигается при
, а математическое ожидание выпавших очков при этой стратегии равно
.
Ответы совпали.
Но вопрос в другом. Мне кажется, что эта задача решается куда проще. Как обычно решаются такие задачи и как более правильно обосновать первый подход?