|
Последний раз редактировалось wrest 18.04.2026, 13:32, всего редактировалось 3 раз(а).
Я посмотрел что даёт расчёт по паттерну [98, 75, 44, 3757, 18, 10051] А именно: сколько чисел получилось с нужным количеством делителей на каких местах, сколько получилось цепочек с 0..6 valids и т.п. В результате я вижу, что valids в диапазоне 0..5 в точности соответсвует тому как если бы вероятности иметь нужное количество делителей по местам были независимы. То есть корреляции между местами нет. По мере увеличения количества цепочек вероятности по местам медленно падают, а с ними и valids=0..5, как и должно быть. Но вот valids=6 ведёт себя совершенно иначе. В начале (на первом десятке тысяч цепочек) реальный valids превышает ожидаемый в 1,86 раза, а по мере накопления, накопленным этот коэффициент падает до 0,9
Вы на это тоже натыкались?
=== Финальная статистика по 300 000 цепочек === Частоты: [95719, 89716, 54442, 102771, 73682, 108596] Вероятности: [0.319, 0.299, 0.181, 0.343, 0.246, 0.362] Совпадения: [36725, 94226, 97649, 52973, 15796, 2487, 144] Ожидаемые (незав.): [37087, 93865, 97454, 53030, 15915, 2491, 158] Ожидаемые valids=0..5 тютелька в тютельку совпадают с реальными. А вот valids=6 ожидается 158 при реальном 144.
А вот статистика на первых десятках тысяч: Модули: [98, 75, 44, 3757, 18, 10051] k = 10000 s: [1080, 3036, 3209, 1953, 617, 91, 13] p: [0.326, 0.318, 0.190, 0.368, 0.252, 0.379] exp: [1095, 2969, 3298, 1916, 613, 102, 7] k = 20000 s: [2254, 6024, 6514, 3779, 1210, 197, 21] p: [0.328, 0.315, 0.188, 0.362, 0.250, 0.374] exp: [2239, 5996, 6579, 3780, 1196, 197, 13] k = 30000 s: [3388, 9081, 9822, 5635, 1766, 280, 27] p: [0.328, 0.310, 0.187, 0.359, 0.252, 0.372] exp: [3402, 9043, 9854, 5623, 1768, 290, 19] k = 40000 s: [4546, 12144, 13159, 7426, 2311, 379, 34] p: [0.329, 0.310, 0.186, 0.356, 0.250, 0.371] exp: [4579, 12109, 13126, 7451, 2330, 380, 25] k = 50000 s: [5763, 15239, 16417, 9192, 2882, 471, 35] p: [0.327, 0.307, 0.186, 0.355, 0.249, 0.370] exp: [5785, 15207, 16388, 9248, 2876, 466, 31] k = 60000 s: [6988, 18377, 19672, 10955, 3410, 558, 39] p: [0.326, 0.306, 0.184, 0.353, 0.248, 0.370] exp: [7016, 18335, 19641, 11019, 3406, 548, 36] k = 70000 s: [8172, 21470, 22973, 12727, 3954, 661, 42] p: [0.326, 0.306, 0.185, 0.352, 0.248, 0.369] exp: [8214, 21420, 22902, 12826, 3959, 637, 42] Видно что до 70 тыс. реально находится больше чем ожидается в предположении независимости по местам. На 70 тыс сравнивается и потом уже находится valids=6 меньше ожидаемого. Выше s это сколько было valids, p вероятность по каждому месту (количество совпавших на этом месте к общему количеству) exp - ожидаемое количество совпавших, по Бернулли в предположении независимости мест.
|