На длинной дистанции происходит сглаживание. Если решать задачу поиска одного кортежа тысячи раз, то больше кортежей в среднем за единицу времени будет находить тот, кто придерживается более оптимальной стратегии. Несмотря на флуктуации в единичных кортежах.
Вот поэтому я и говорю что оценки по HL1 хороши лишь для сотен и тысяч кортежей, но не для нескольких первых. Первые, как и каждый отдельный последующие - слишком случайны. И усреднение происходит лишь на серии.
Если бы случайный разброс был бы маленьким, меньше разницы между паттернами - вот тогда можно было бы пользоваться HL1 для сравнения паттернов между собой
в задаче поиска первого. Но по факту случайный разброс на порядок превышает разницу между паттернами и именно случайностью диктуется место нахождения первого, не разницей между паттернами. Это как сравнивать между собой несколько гор высотой от 100м до 8км и искать между ними различия рельефа в единицы метров - такие различия тоже есть, но разница высот диктуется не ими.
Но пока такая точная формула ни для каких других кортежей не найдена, приходится ориентироваться на лучшее что есть — HL1.
Она лучшая, и для серий кортежей хороша, но вот
для первого - нет, она не даёт адекватной оценки. Вообще.
Сами проверьте на известных кортежах, вот скажем оценка сверху (лишь по главной константе, без учёта загрязнений, это ожидаемое количество всех, и грязных и чистых, т.е. чистых ещё строго меньше) для 19-600, найденного в боинке до 1e19:
19-600: 0.035286954707344104462764745828064165368 +- 0.18784821669456299422722614625952084965
Видите ожидаемое количество 0.035? А он найден! И вероятность этого менее 0.000015%. А он найден!! Ну и про какую адекватность оценки по HL1 тут говорить?!
Другие кортежи не лучше:
19-588: 0.013361852120587098910017604731288008524 +- 0.11559347648671139031740691111129218669, вероятность меньше 7e-18 ! А он найден первым! Раньше более ожидаемого 19-600.
19-492: 0.0045493925077237027241250416108909171880 +- 0.067449184363403588769080647542731325500, вероятность меньше 1.4e-49 ! А этот найден вторым, тоже раньше в 8 раз более ожидаемого 19-600!
26-538: 0.000014232110454751016863301170758464870624 +- 0.0037725469178452020710527305160713325983, вероятность меньше 3e-15281 !!
26-568: 0.0000070223195333969272339741288177843664282 +- 0.0026499659399513119849803755093190681094, вероятность меньше 7e-30925 !!
26-628: 0.0000072709045187258790745441885511176860117 +- 0.0026964614710009769487329528785385853544, вероятность меньше 3e-29790 !!
28-652: 0.0000032072150721069852499865479598277059838 +- 0.0017908699171342449729538615284244685106, вероятность меньше 2e-67699 !!! Вы вообще представляете такую вероятность нахождения этого кортежа в
560 сигм (что не будет найден)?
И все они были найдены, несмотря на вот такие оценки и вероятности.
Ну и какой к лешему смысл сравнивать эти ожидаемые количества между собой если они отличаются аж на 4 порядка, но всё равно были найдены по одной штуке?!
4 порядка разницы это как раз искать и найти холм высотой в метр среди гор высотой до 8км. Не гор с разницей высот в метр (как Вы упорно хотите представить сравнение паттернов между собой), а метровый холм среди таких вот гор.
Я не хочу сказать что любые оценки по HL1 не нужны, вовсе нет, если они дают хорошую вероятность нахождения кортежа - можно искать. Но единичные кортежи могут найтись и при очень и очень малых оценках (и не найтись при столь же больших). И потому сравнивать паттерны между собой по HL1
в задаче поиска первого (а не сотен и тысяч и миллионов штук) - смысла не имеет, случайность перекрывает эти сравнения
на порядки!