Это поиск цепочки

.
Процесс такой:
1. Проверяется огромное количество кандидатов, удовлетворяющих паттерну.
2. Для каждого кандидата проводятся некие проверки.
3. Если эти проверки проходят, то пишем кандидата в лог. Если не проходят - выкидываем молча.
4. Паттерн предполагает, что на двух (из 19) местах ожидается простое число. И проверки гарантируют, что у кандидатов там - простое число.
5. На остальных местах ожидается либо произведение двух простых, либо произведение трех простых (что-то одно в зависимости от позиции).
6. Для кандидата, записанного в лог, считается количество мест, где попали в ожидаемое. Обозначается valids.
График: частота кандидатов в зависимости от значения valids.
Гистограмма: частота успеха в конкретной позиции цепочки. Там у двух мест единица - это как раз тут ожидаются простые, и они гарантируются проверками перед записью в лог.[/off]
Определение случайных величин
Для каждой из 19 позиций в цепочке определим случайную величину Бернулли:

Величины Бернулли РАЗЛИЧНЫЕ, так как:
1. Разные вероятности успеха
Для каждой позиции

вероятность успеха

разная и зависит от:
- Типа ожидаемой структуры (

)
- Фиксированной части числа в паттерне
- Арифметических ограничений для данной позиции.
2. Гарантированные простые числа
Для 2 позиций, где ожидаются простые числа:

Это вырожденный случай Бернулли.
3. Остальные позиции
Для позиций с ожидаемой структурой

или

:

Математическая модель
Сумма Valids:

где:
-

-

— различные вероятности
Распределение не является биномиальным, так как:
Биномиальное распределение предполагает:
-

одинаковых испытаний Бернулли
- С одинаковой вероятностью успеха

Распределение Valids — это сумма неодинаковых бернуллиевских случайных величин.
Это дискретное распределение с длинным правым хвостом — большинство кандидатов имеют 15-17 совпадений, но настоящая цепочка

требует 19, что при определенных условиях аппроксимируется распределением Пуассона.
Его характеристики:
- Математическое ожидание:
![$ E[\text{Valids}] = \sum_{i=1}^{19} p_i $ $ E[\text{Valids}] = \sum_{i=1}^{19} p_i $](https://dxdy-03.korotkov.co.uk/f/2/e/8/2e8c77b7ac58816ac3b912489530a82a82.png)
- Может аппроксимироваться нормальным распределением при большом количестве слагаемых.