Э-э-э.. Мои познания в математике точно такие же, как у топикстартера, то есть на уровне лабрадора.
Но на практике мне попадалась задача, дающая нормальное распределение, и я ее решал без всяких знаний, чисто эмпирически.
Задача такая. Генератор случайных чисел выдает поток с равномерным распределением, для каждого бита вероятность быть единицей или нулем ровно
, значит, каждый байт с вероятностью
может быть любым из
возможных. Каждый байт из потока помещается в строку по такому правилу: если этого байта в строке еще нет, помещаем, если такой уже есть, отбрасываем. Сколько байт надо перебрать, чтобы строка заполнилась до конца, получилась перестановка, где каждый байт встречается ровно один раз?
Это я сумел вычислить без множества испытаний, чем очень гордился. Должно получиться число
-- это число
умноженное на
-ое гармоническое число:
Проверил на множестве испытаний, действительно, в среднем получается
. Но это только среднее, а вообще значения распределены нормально. То есть распределение должно быть биномиальным, но здесь хорошо совпадает с нормальным. Минимум есть -- очевидно, что для заполнения
вакансий в строке нужно сгенерировать не меньше
байт, но на практике этот минимум недостижим, на практике минимум где-то около
. Максимум на практике около
, редко больше,
видел только один раз, для меня этого результата достаточно, но в теории, сколько я понимаю, максимума нет -- случайность есть случайность, можно вообразить себе случай, когда генератор выдал миллион байт, и среди них нет ни одного с десятичным кодом
. Нету, долго не попадается, не везет... Почему бы и нет, монетка может лечь орлом двадцать пять раз подряд, а решки все нету и нету. Уже игрока зарезали за фармазонство, а решки все равно нету...
Я удовлетворился эмпирическими результатами испытаний, но хороший математик, думаю, может с точностью оценить вероятности -- как часто наступает случай, когда нужна серия в
байт, в
байт, и так далее. Наверное, можно, потому что параметры распределения из задачи как-то вычисляются. Это для меня слова
среднеквадратичное отклонение пустой звук, а есть такие люди, которые эти слова понимают, даже пользоваться ими умеют.
Но вот задача с рыбами по моему дилетантскому ощущению хороших решений не имеет. Сделал ведущий передачи какую-то выборку, причем небольшую, у него все на бумажке уместилось, после чего прикинул, сколько рыб поймано за три года, и заявил, что среди 384 тыщ не было ни одной тяжелее трех с половиной фунтов. Это с чего он взял? Откуда здесь максимум? Отметил на графике два десятка точек, провел по ним кривую, убедился, что она имеет форму колокола, нормальное распределение, это все мило, но откуда максимум? Правый хвост этой кривой где-то спускается до нуля? Ой, не математик я, но что-то сомневаюсь...