2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Проверка равновероятности
Сообщение29.01.2018, 22:24 
Уважаемые софорумники, столкнулся с проблемой и предлагаю свое решение.

Проводил эксперименты с бросанием монеты. Решил автоматизировать процесс при помощи компьютера.
Нашел соответствующую программу и вдруг она выдала сразу 17 единичек. У меня закралось сомнение,
что появление 0 и 1 равновероятное. Но как это проверить? Когда бросаешь монетку, то наличие
только двух сторон и симметрия монетки дают хоть какую-то гарантию равной вероятности появления сторон монетки.
Компьютер декларирует вероятность появления 0 и 1 равную 0.5, а по какому закону они появляются в самом деле неизвестно.

Попытался ответить на возникший вопрос методами математической статистики.
Для этого использовал форму для подтверждения идентичности двух последовательностей.

$\mid M_i-N_i\mid<\frac{t_{st}\cdot\sigma}{\sqrt{N}}$

где $M_i, N_i$ - сравниваемые последовательности
$N$ - количество испытаний
$\sigma$ - среднеквадратичное отклонение
$t_{st}$ - соответствующий коеффициент Стьюдента

Применительно к задаче:
$N_i$ - ожидаемая вероятность появления 0 или 1 равная 0.5 (константа)
$M_i=\frac{i}{N}, \frac{N}2\leqslant i \leqslant N$ - частота появления значения, которое чаще выпадает.

Гипотеза $Н0$ - последовательности $M_i$ и 0,5 не различимы.
Альтернативная гипотеза $H_1$ - последовательности $M_i$ и 0,5 существенно различимы.
Для задачи формула приобретает вид

$\mid\frac{i}{N}-0.5\mid<\frac{t_{st}\cdot\sigma}{\sqrt{N}}$

Модуль отбрасываем, так как частота заведомо больше $0.5$

Среднеквадратичное отклонение $\sigma=\sqrt{\frac{N(0.5)^2}{N-1}}$

Когда подставим, получим

$\frac{i}{N}-0.5<\frac{t_{st}}{2\sqrt{N-1}}$

Найдем критическое количество выпадений, для которых выполнима гипотеза $H_0$

$i<\frac{N}2+\frac{N}2\cdot\frac{t_{st}}{\sqrt{N-1}}$

Из моего опыта меньше 17 испытаний бессмысленно делать какой-либо вывод.
Пусть $N=26, t_{st}=2,78$, тогда $i< 20,2$ и нулевая гипотеза выполняется с вероятностью 0,99 .
Другими словами, в серии из 26 испытаний должно появляться не более 20 орлов или решек. Если 21 и более, то скорее всего нарушено равенство вероятности появления орлов или решек.
Если $N=50, t_{st}=2,68$, тогда $i< 34,5$
Если $N=100, t_{st}=2,62$, тогда $i< 63,1$
Если $N=1000, t_{st}=2,58$, тогда $i< 40,8$

 
 
 
 Re: Проверка равновероятности
Сообщение30.01.2018, 00:43 
Аватара пользователя
Побережный Александр в сообщении #1288362 писал(а):
Нашел соответствующую программу и вдруг она выдала сразу 17 единичек.
Она с самoго начала их выдала или после того как немного поработала?

Не помню где-то читал что человек подсознательно пытается держать баланс между "орлами" и "решками", поэтому у сгенерированных человеком последовательностей не встречается "длинных" нулей или единиц.

 
 
 
 Re: Проверка равновероятности
Сообщение30.01.2018, 00:47 
Побережный Александр в сообщении #1288362 писал(а):
Решил автоматизировать процесс при помощи компьютера.
Нашел соответствующую программу
Если код той программы открыт, можно узнать, что там за генератор и как она его инициализирует. Если нет, можно, в принципе, написать свою и со своим генератором. А ещё есть random.org.

-- Вт янв 30, 2018 02:57:45 --

Например, по ссылке https://www.random.org/integers/?num=100&min=0&max=1&col=10&base=10&format=html&rnd=new выдадутся 100 чисел из $\{0,1\}$, выложенные в десять столбцов (остальные три параметра можно игнорировать).

-- Вт янв 30, 2018 03:18:47 --

Главное не генерировать сразу миллион бит, а то квота (временно) исчерпается, сервер-то общий.

 
 
 
 Re: Проверка равновероятности
Сообщение30.01.2018, 09:10 
Аватара пользователя
0. Генератор, который никогда не выдаст 17 единиц подряд - не может быть генератором, выдающим независимые равновероятные случайные числа 1 и 0. Если он выдал 16 единиц, и при этом заведомо не выдаст семнадцатую - он выдаст 0, то есть результат семнадцатого испытания будет определяться предыдущими 16ю. Вероятность такой выдачи мала, получить в первых же 17 опытах 17 единиц при равновероятности их - менее одной стотысячной, но в очень большой серии опытов вполне возможно.
1. Нестатистическая проверка должна состоять в анализе алгоритма расчёта. При использовании чужой программы исходный текст может быть недоступен, в этом случае можно дизассемблировать её, но это крайне трудоёмкий путь. Если программа общедоступна - можно попробовать обратиться к автору.
2. Статистические тесты для ГСЧ разнообразны, и я бы рекомендовал сходить в веломагазин почитать 2 том Кнута, там много приведено.
3. Есть ещё возможность того, что программа правильна, но неправильно её использование. Скажем, обычно используемые ГСЧ, строго говоря, генерируют псевдослучайные числа, и для придания им действительной случайности задаётся начальная установка (seed), скажем, исходя из младших разрядов часов на момент первого запуска ГСЧ, а в ответственных случаях и из настоящего генератора случайных чисел, скажем, на тепловом шуме или радиоактивном распаде. Но если при повторных запусках задавать тот же seed, то будем получать строго одно и то же. Как бы ни казалась такая ошибка невозможной - и такое случается, "глаз замылен".

 
 
 
 Re: Проверка равновероятности
Сообщение30.01.2018, 11:16 
Аватара пользователя
Dan B-Yallay в сообщении #1288413 писал(а):
Не помню где-то читал что человек подсознательно пытается держать баланс между "орлами" и "решками", поэтому у сгенерированных человеком последовательностей не встречается "длинных" нулей или единиц.

На этом даже основан способ выигрывания в "честные" лотереи: Поскольку большинство игроков стараются ставить на "максимально беспорядочные" комбинации, особо хитрый игрок, который ставит на "упорядоченные" комбинации, в среднем выигрывает. Хотя и немного.

 
 
 
 Re: Проверка равновероятности
Сообщение31.01.2018, 01:40 
Dan B-Yallay в сообщении #1288413 писал(а):
Она с самoго начала их выдала или после того как немного поработала?

Программа сразу выдала 17 единичек. Я сначала удивился и решил проверить выпадение максимальных "единичек" и "нулей" на реальной монетке. После 150 бросков у меня выпало подряд 10 орлов. Я понял, что "длинные" последовательности не такое и редкое событие. Даже когда воспользовался ссылкой на генератор случайных чисел от arseniiv в первой же сотне была последовательность из 11 нулей.

 
 
 
 Re: Проверка равновероятности
Сообщение31.01.2018, 02:18 
Нули и единицы, возможно, будут равновероятны при большом числе симуляций, но генератор, наверное, дает автокоррелируемые числа, поэтому и случаются такие повторы.

 
 
 
 Re: Проверка равновероятности
Сообщение31.01.2018, 02:56 
Аватара пользователя
epros в сообщении #1288474 писал(а):
На этом даже основан способ выигрывания в "честные" лотереи: Поскольку большинство игроков стараются ставить на "максимально беспорядочные" комбинации, особо хитрый игрок, который ставит на "упорядоченные" комбинации, в среднем выигрывает. Хотя и немного.

Да ладно, там же по любому мат ожидание выигрыша будет 0, разве нет?

 
 
 
 Re: Проверка равновероятности
Сообщение31.01.2018, 04:49 
Sicker в сообщении #1288722 писал(а):
epros в сообщении #1288474 писал(а):
На этом даже основан способ выигрывания в "честные" лотереи: Поскольку большинство игроков стараются ставить на "максимально беспорядочные" комбинации, особо хитрый игрок, который ставит на "упорядоченные" комбинации, в среднем выигрывает. Хотя и немного.

Да ладно, там же по любому мат ожидание выигрыша будет 0, разве нет?

В смысле, в честной?
Нет, конечно. Секрет в том, что матожидание выигрыша зависит не только от его вероятности, но и от его суммы, а epros имеет ввиду лотереи, в которых сумма (каждому) зависит от числа выигравших

 
 
 
 Re: Проверка равновероятности
Сообщение31.01.2018, 10:08 
Аватара пользователя
ET в сообщении #1288727 писал(а):
В смысле, в честной?
Нет, конечно. Секрет в том, что матожидание выигрыша зависит не только от его вероятности, но и от его суммы, а epros имеет ввиду лотереи, в которых сумма (каждому) зависит от числа выигравших

"В честной" - это значит:
1. Все комбинации равновероятны, корреляций нет.
2. Суммарный выигрыш равен суммарной стоимости билетов, т.е. никакой "комиссии организаторам" не предусмотрено.
3. Между угадавшими выигрыш делится поровну, т.е. никаких "льготных участников" не предусмотрено.

 
 
 
 Re: Проверка равновероятности
Сообщение31.01.2018, 10:21 
Аватара пользователя
На практике это работает, если часть фонда выигрыша может быть невостребована и перейдёт в следующий тур, образуя "джек-пот". В этом случае матожидание выигрыша при нескольких таких событиях способно оказаться положительным.

 
 
 
 Re: Проверка равновероятности
Сообщение31.01.2018, 12:13 
Аватара пользователя
Евгений Машеров в сообщении #1288752 писал(а):
На практике это работает, если часть фонда выигрыша может быть невостребована и перейдёт в следующий тур, образуя "джек-пот". В этом случае матожидание выигрыша при нескольких таких событиях способно оказаться положительным.

Да. При этом достаточно того, чтобы на следующий тур передавались сборы за тот тур, в котором не угадал никто.

 
 
 
 Re: Проверка равновероятности
Сообщение05.02.2018, 12:31 
Побережный Александр в сообщении #1288362 писал(а):
Найдем критическое количество выпадений, для которых выполнима гипотеза $H_0$

$i<\frac{N}2+\frac{N}2\cdot\frac{t_{st}}{\sqrt{N-1}}$


Интересно, если $N=12$ и $p-0.01$, $t_{st}=3,106$, то $i<11.6$
Получается, что если подряд выпало 11 "единичек", то двенадцатым с вероятностью $p=0.99$ выпадет "нолик". Иначе нарушается равновероятность выпадения "единичек" и "ноликов". А также напрашивается вывод, что при многократном выпадении "единички", вероятность выпадения "нолика" повышается, а не равна $p=0.5$
Другими словами, если в азартных играх многократно выпадает одна и та же величина, есть смысл делать ставку на альтернативную.

 
 
 
 Re: Проверка равновероятности
Сообщение05.02.2018, 12:39 
Аватара пользователя
Побережный Александр в сообщении #1288712 писал(а):
Я понял, что "длинные" последовательности не такое и редкое событие.
Я тут недавно интересовался подобным вопросом. Более конкретно, меня интересовало среднее время ожидания до выпадения заданной последовательности равновероятных символов (не обязательно только одних орлов, или только одних решек, а так же не обязательно, что алфавит состоит только из двух символов: "О"рёл и "Р"ешка). Так вот там оказалось, что не смотря на то, что вероятность выпадения последовательностей одинаковой длины равны, среднее время ожидания сильно зависит от того, как много в последовательности повторений. С этой точки зрения один орлы и одни решки самые "трудно выпадающие" последовательности.

 
 
 
 Re: Проверка равновероятности
Сообщение05.02.2018, 14:26 
Аватара пользователя
Побережный Александр в сообщении #1290233 писал(а):
Получается, что если подряд выпало 11 "единичек", то двенадцатым с вероятностью $p=0.99$ выпадет "нолик". Иначе нарушается равновероятность выпадения "единичек" и "ноликов". А также напрашивается вывод, что при многократном выпадении "единички", вероятность выпадения "нолика" повышается, а не равна $p=0.5$
Другими словами, если в азартных играх многократно выпадает одна и та же величина, есть смысл делать ставку на альтернативную.


Это ложное рассуждение. Ошибка в нём основана на том, что спутаны понятия "матожидание" и "обязательное количество". В случае честной монеты выпадание 11 (111, 1111 и т.п) "единичек"на вероятность выпадения "нолика" не влияет. Эта сверхценная идея уже разорила немало игроков.

 
 
 [ Сообщений: 26 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group