1) Во-первых, приношу извинения. Лето, мозги сушатся на веревочке после купания…

А я на форуме…
2) Существует некоторая неоднозначность условия задачи. А именно, что выбирается случайно: строка, подстрока или обе сразу. (Мы предполагаем равную вероятность всех выбираеммых случайно объектов).
Очевидно, что приведенный мной результат имеет заметно меньший интерес, если подстрока выбирается случайно. Поскольку он отвечает на вопрос о встречаемости конкретной подстроки (а вероятность ее появления может быть очень мала).
3) Связь тем не менее есть: приведенная формула (

) позволяют ответить на вопрос о вероятности появления двух конкретных подстрок,

нулей и

единиц. А именно, для того, чтобы была подстрока длинной

необходимо и достаточно, чтобы максимальное количество 0 подряд было больше или равно

. То есть,

, очевидно, монотонно возрастающая с уменьшением

. Последнее — очевидный тест; если мы нашли

нулей, то всяко найдем

. Эта вероятность асимптотически корректна для больших

и

, и хорошо согласуется с тестами методом Монте-Карло (выражению «оценка снизу» я придавал смысл, несколько отличный от Вас. Беда в том, что мой смысл смысла не имеет вовсе).
4)
Все остальные выкладки в моем предыдущем сообщении — чушь, за которую я повторно извиняюсь

. Хотя некоторые идеи остаются верными: например, квинтили

растут как

. Собственно, она и вычислена для

. И при малых, и при больших

ее точность ограничена, но значения мало отличаются от 0 или 1.