Вот я тоже не понимаю. Речь то о числе шаров, то об отдельных шарах. И еще вероятностное пространство меняется.
Про вероятностное пространство я ничего не знаю. Если оно идентично пространству/множеству возможных исходов - дело другое.
Давайте я попробую по аналогии пояснить.
Вот есть вероятность произвольно взятому натуральному числу

быть простым,

. Вроде бы пока никаких сложностей не возникает, хоть простые числа и не случайные и для любого натурального числа вероятность или 1 или 0, строго. Или возникает?
Если я всё правильно понял, то первая гипотеза Харди-Литтвуда (далее везде ХЛ1, надоело полностью именовать) утверждает что для некоего кортежа из чисел начиная с числа

(т.е. последовательность чисел с заданными свойствами, не суть какими именно) данная вероятность равна

(и

(смысл слова "равна" обсуждать не хотелось бы, ведь расчёты хорошо совпадают с практикой) и

вычисляются известно как по конкретному кортежу в зависимости от его свойств). Т.е. ткнув в произвольное натуральное число

мы с вот этой вероятностью обнаружим что оно нам подходит (является белым шаром, искомым кортежем). Пока всё тоже вроде корректно?
Если же хотим узнать сколько таких чисел на интервале длиной

чисел, то берём интеграл от этой вероятности по интервалу (почему вместо дискретной суммы не вполне ясно, но такое часто в теории чисел, так что верю). Как и для простых чисел. И получаем то что выше называю мат.ожиданием количества подходящих чисел (белых шаров) на интервале

.
Точным значением вместо мат.ожидания оно никак быть не может, мы же складываем/интегрируем вероятности. И должны получить или вероятность оказаться на взятом интервале подходящих чисел, или их количеству (не точному, а в смысле мат.ожидания). Вычисления дают цифры больше 1, значит это точно не вероятность. Значит мат.ожидание количества.
Значит само количество на интервале является случайной величиной в каком-то смысле ... Наверное.
Где тут вероятностное пространство или пространство исходов неясно.
Однако вычисления показывают что число посчитанное по ХЛ1 хорошо совпадает с реальным количеством кортежей в интервале, для разных кортежей и интервалов. Не идеально, но хорошо. И чем больше интервал и количество кортежей, тем лучше совпадает. Выходит если где и ошибаюсь с терминами, то расчёт происходит всё равно более-менее верный. По крайней мере про количество кортежей на любом интервале по ХЛ1.
А теперь хотим оценить какой интервал надо взять чтобы обнаружить заданный кортеж. Но раз не знаем их точное количество ни на одном интервале (знаем только где их точно нет), то и о точном интервале речи не идёт. Тогда видимо речь может идти лишь о вероятности нахождения кортежа в интервале. И соответственно об интервале на котором эта вероятность выше заданного порога. Для этого можем посчитать его мат.ожидание по ХЛ1 для любого интервала, из него можем получить СКО (если верим
vicvolf-у и о нормальности чего-то там и об вычислении СКО, проверить это мне/нам нереально), а вот как из этого получить интервал или вероятность нахождения в заданном интервале - непонятно, это и вопрос темы.
Разные пространства снова неясно где тут искать.

Хотя нет, и урна, и кубик, и вон та модель с кучей

вроде как задают пространство исходов, его найти легче вероятностного (конечно если они разные).
Поэтому по неравенству Чебышева можно подсчитать вероятность попадания случайной величины количества кортежей -

в интервал:

по формуле

.
Прекрасно, это уже 5-й вариант вычисления вероятности. Для

если я правильно понимаю Ваши обозначения, как подсчитать вероятность для интервала

(т.е. что будет найден хотя бы один)? Такая вероятность пока ещё (несколько недель) точно больше нуля, так что вопрос правомерен.
-- 13.11.2024, 19:43 --А когда количество кортежей на интервале мало, например Вы говорили - 14 кортежей, то нельзя говорить о близости к предельному распределению.
Это тоже непонятно, что значит мало или велико, ведь для множества других кортежей и интервалов совпадение реального количества с количеством (мат.ожиданием количества) по ХЛ1 достаточно хорошее, хотя кортежей тоже мало в вашем смысле. Вы вообще отказывали ХЛ1 в применении пока количество кортежей не превысит сильно начального выброса в полтора миллиарда кортежей. Повторяется та же история что ли?

Но нас не интересуют числа далеко за горизонтом и тем более на бесконечности, мы не теорему доказываем, а пытаемся оценить потребное время работы компов. Как можем.
-- 13.11.2024, 20:01 --Для

если я правильно понимаю Ваши обозначения, как подсчитать вероятность для интервала

(т.е. что будет найден хотя бы один)?
Впрочем дайте догадаюсь: раз интересует лишь одна граница, то посчитаем вероятность что

(т.е. что она ближе к мат.ожиданию чем правая граница), вычтем её из 1 (получим вероятность что значение дальше границы в любую сторону) и поделим пополам чтобы взять только правый хвост. ОК, считаем:

, тогда

. Вероятность больше

(более точное значение

)?! А вероятность обоих хвостов больше

?!

Вместо десятка процентов? Поясняйте плиз.