2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 26, 27, 28, 29, 30, 31, 32 ... 215  След.
 
 Re: Пентадекатлон мечты
Сообщение03.04.2022, 12:58 
Заслуженный участник


20/08/14
11766
Россия, Москва
Yadryara в сообщении #1551701 писал(а):
Вам захочется обозначить $D_1$, мне - $Y_1$. Поэтому $P_1$ - компромиссный вариант. Договориться об обозначениях это важно.
Мне не захочется: $D_1=P_1$, если под $P_1$ понимать строго теоретическую (истинную) вероятность. С $D_2=P_2$ аналогично. Потому дальше буду пользоваться $P_1,P_2$ в смысле истинных вероятностей.

Yadryara в сообщении #1551701 писал(а):
А я вижу. См. выше.
Yadryara в сообщении #1551701 писал(а):
Ну вот, чтоб путаница не возникла, предлагаю остановиться на $P_1,P_2$ для общего случая и именных буквах(Y и D) для конкретных значений, вычисленных разными способами. Именная буква как раз и будет указанием на способ вычисления $P_1$ или $P_2$.
Мне не важно каким способом вычислена (оценена) $P_1$, мне важно лишь её значение, потому буду пользоваться именно $P_1$ и брать для неё разные оценки величины. Потому что $D_2$ я оценил уже тремя разными методами и одной буквы тогда не хватит, надо три, а дальше возможно и ещё больше.
Ровно как и $\pi$ никто не обозначает разными буквами в зависимости от точности округлённого значения при использовании или метода расчёта.

Но тогда во первых я не понимаю есть ли отличие между $P(15)$ и $p_{15}$ и $MO(15)$ — первая это истинная или эмпирическая? А вторая? А третья? По аналогии с $P_1$ и $p_1$ первая должна быть истинной, а $p_{15}$ эмпирической, или нет? Аналогичный вопрос и про $p_{all}$, истинная или эмпирическая? Я их все использовал в истинном смысле. И тогда предлагаю далее все $P_x$ (т.е. с большой $P$) считать истинными, независимо от индекса $x$. Я далее буду придерживаться этого правила.
Во вторых, тогда неизвестно будут ли и вообще должны ли выполняться формулы типа $p_{14}/p_{13}$ для эмпирических значений, даже приближённо (и с заменой знака $=$ на $\approx$). Для истинных же они выполняются строго.
В третьих, насколько я понимаю Ваши обозначения, Вам придётся все формулы записывать в нескольких вариантах, например для эмпирической $p_{14}=a^{11}b^3(1-b)$ нужны будут все 3 варианта с подстановкой на места $a$ и $b$ либо эмпирических вероятностей, либо истинных (обе истинные ставить нельзя, тогда придётся слева $p_{14}$ менять на $P_{14}$). И придётся придумать способ их различать по обозначению слева, т.е. одним $p_{15}$ уже не обойтись, они же все три будут разными, а Вы очень хотите разные разные величины обозначать разными буквами. И это если каждая эмпирическая всего лишь одна, а если их несколько разных ... :facepalm: А для отношений вероятностей типа $p_{14}/p_{13}$ будут три варианта слева (обе истинные пока не беру) и 9 вариантов справа (3 варианта для числителя и 3 независимых варианта для знаменателя). :facepalm: Меня такой непрерывно разрастающийся зоопарк категорически не устраивает и я далее буду продолжать пользоваться исключительно истинными вероятностями (как и делал везде выше), для которых не надо плодить множество формул для одного и того же понятия.

(Ни к чему не обязывающее замечание в сторону.)

Что будете делать Вы не представляю и надеюсь Вы чётко опишете систему обозначений в своих формулах и далее будете её придерживаться. Выше с формулами полный бардак (пример: в формулу $p_{all}=p_1^{11}$ оказывается надо подставлять не $p_1$ (которую в принципе несложно подсчитать если этого ещё не сделано), а $Y_1\ne p_1$ или $P_1\ne p_1$ или $D_1\ne Y_1$). :facepalm: И очень желательно чтобы не приходилось каждый раз догадываться какую из имеющего набора вероятностей использовать в каждом конкретном месте формул (аналогия: в формуле $S=\pi R^2$ брать ли вместо $\pi$ число $3.14$ или $\sqrt{23}$ или $\ln23$ или $22/7$ если есть именно такие оценки величины $\pi$ разными методами). Подбирать что именно подставить в формулу методом "лучшего совпадения" с истинной вероятностью или чем угодно другим я и называл подгонкой под ответ, предлагаю им не пользоваться, ИМХО должно быть прямо из символьной записи формулы чётко понятно какая именно вероятность в неё входит.


Итог.
1. Вводить обозначения $D_1,D_2$ не нужно, они строго равны $P_1,P_2$ (истинным) соответственно. Но их оценки могут отличаться от истинных численной величиной (как например $3.14159$ отличается от $\pi$ хотя везде в формулах используется вместо него).
2. Я далее всегда под обозначениями с большой буквой подразумеваю истинные вероятности.
3. Во всех моих формулах выше придётся понимать все вероятности в истинном смысле в соответствии с: $D_1\to P_1, p_1 \to P_1, D_2 \to P_2, p_2 \to P_2, p_{15} \to P_{15}, p_{all} \to P_{all}$ и т.д.
4. Своё заявление выше $Y_1=D_1$ отзываю, на данный момент слева стоит истинная вероятность (как всегда и было), а справа похоже эмпирическая (во всяком случае до уточнения буду в целях безопасности считать именно так), равны они быть не могут (приближённо $D_1\approx Y_1$ могут). С $Y_2=D_2$ аналогично, отзываю. Выражения $D_1=P_1$ и $D_2=P_2$ остаются в силе.
5. $P_1,P_2$ и все остальные истинные очевидно не зависят от метода их подсчёта и любые оценки по хорошему должны к ним стремиться, потому мне нет нужды обозначать разные оценки величин $P_1,P_2$ по разному. И с каждым новым методом выдумывать новые буквы.
6. Буду вместо более правильного $P_1\approx0.1845$ продолжать писать $P_1=0.1845$ даже без слов "приближённо", подразумевая что число является приближённым, надеюсь это для всех очевидно. Впрочем если это принципиально, дайте знать.

Yadryara
Перечитал предыдущее своё сообщение, и в нём и в этом я не выдвигаю к Вам никаких требований (максимум пожелания), лишь беру обязательства на себя, пытаясь подстроиться под Ваши вероятности, обозначения, формулы, в соответствии со своим их пониманием. Которое снова оказывается неверным (ну это моя вина). Потому что не хочется иметь две параллельные системы обозначений одних и тех же понятий.

-- 03.04.2022, 13:09 --

Мне не кажется правильным складывать количество попыток в низинах по всем паттернам и количество попыток в горах по нескольким выделенным паттернам. Мы вроде бы пока не доказали что распределение (вероятностей) между паттернами одинаково, более того, практика (набранная статистика) это прямо опровергает (лишь 306 паттернов из 46080 дали хотя бы одну ALL цепочку). Потому все попытки по выделенным паттернам могли попасть на "неудобные" паттерны и там вероятность найти пятнашку в разы (или на порядки) меньше. И неизвестно насколько именно меньше (вроде тестов по конкретно тем паттернам для оценки $P_1,P_2$ для них не проводили). И складывать более-менее усреднённую величину с непонятно какой смысла мало.

-- 03.04.2022, 13:27 --

Дополнение.
Yadryara в сообщении #1551701 писал(а):
Dmitriy40 в сообщении #1551690 писал(а):
Для любого из 11-ти проверяемых мест: обозначим вероятность обнаружения в нём ровно 12 делителей символом $Y_1$.
Возражений не имею.
Прошу разъяснить в каком именно смысле Вы понимаете $Y_1$ в определении выше, в истинном или в эмпирическом. Я подразумевал в истинном (как собственно и любую вероятность в ТВ, в отличие от частоты встречаемости, которую мы и определяем эмпирически). Ваше точное равенство
Yadryara в сообщении #1551715 писал(а):
$Y_1 = 1-\sqrt[11]{\dfrac{3016}{17016}}$
подразумевает что $Y_1$ это эмпирическая вероятность (раз Вы хотите их различать), так ли это?

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение03.04.2022, 14:31 
Аватара пользователя


29/04/13
8111
Богородский
Dmitriy40 в сообщении #1551716 писал(а):
Но тогда во первых я не понимаю есть ли отличие между $P(15)$ и $p_{15}$ и $MO(15)$

Ну, МО это вообще МатОжидание :-)

А отличия между $P(15)$ и $p_{15}$ я не подразумевал. Просто вроде бы принято с помощью строчной переменной с нижним индексом(как $p_{15}$) обозначать простое число, например с номером 15. А вероятность - заглавной со скобками. Но я об этом сразу не вспомнил, но когда вспомнил решил всё-таки писать согласно традиции.

Dmitriy40 в сообщении #1551716 писал(а):
подразумевает что $Y_1$ это эмпирическая вероятность (раз Вы хотите их различать), так ли это?

Да, и не только я. Тогда и чуть выше, в последнее определение надо добавить слово "эмпирическая".

Dmitriy40 в сообщении #1551716 писал(а):
Мы вроде бы пока не доказали что распределение (вероятностей) между паттернами одинаково, более того, практика (набранная статистика) это прямо опровергает (лишь 306 паттернов из 46080 дали хотя бы одну ALL цепочку).

Нет же. Не "прямо опровергает", а пока не подтверждает.

В целом по обозначениям согласен. Слишком много букв, это тоже, конечно, плохо.

Dmitriy40 в сообщении #1551716 писал(а):
Буду вместо более правильного $P_1\approx0.1845$ продолжать писать $P_1=0.1845$ даже без слов "приближённо", подразумевая что число является приближённым, надеюсь это для всех очевидно.

Да, пожалуйста. Вы и раньше так делали и я не ворчал.

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение03.04.2022, 15:51 
Заслуженный участник


20/08/14
11766
Россия, Москва
Yadryara в сообщении #1551720 писал(а):
Dmitriy40 в сообщении #1551716 писал(а):
подразумевает что $Y_1$ это эмпирическая вероятность (раз Вы хотите их различать), так ли это?
Да, и не только я. Тогда и чуть выше, в последнее определение надо добавить слово "эмпирическая".
Понятно, что же, тогда предлагаю изменить определение на следующее:
Для любого места из 11-ти проверяемых: обозначим эмпирическую вероятность обнаружения в нём ровно 12-ти делителей как $Y_1$, а истинную вероятность как $P_1$.
Для $Y_2,P_2$ аналогично про 4 непроверяемых места.
Пояснения, не включенные в определение ради упрощения (считаю нужным их проговорить чтобы не было разночтений):
1. Под эмпирической понимается наблюдаемая, полученная из реальной статистики, из конкретных наборов данных, из конкретных (или наборов) паттернов, в конкретных диапазонах и/или интервалах. Фактически это частота встречаемости, но удобнее называть вероятностью (в смысле приблизительной оценки истинной вероятности).
2. Под истинной понимается реально существующая, теоретическая, точная, расчётная из теоретических соображений, при том по всем паттернам.
3. Подразумевается что истинные вероятности по всем 11-ти проверяемым местам идентичны (равны друг другу), как и по всем паттернам. Это очевидно неверно, но в смысле усреднения всех $11\times46080$ разных вероятностей вполне можно пользоваться ради упрощения формул. С непроверяемыми $4\times46080$ местами аналогично. Про эмпирические это тоже подразумевается, но в отдельных случаях придётся оговаривать особо.
4. Вопрос о зависимости вероятностей от величины чисел (диапазона) определением не оговаривается и требует уточнения. Для близких диапазонов можно считать вероятности независящими от диапазона.

Вроде бы это полностью совпадает с Вашим пониманием, как и с моим в части $P_x$.

(Пока не подтверждает или опровергает)

Yadryara в сообщении #1551720 писал(а):
Нет же. Не "прямо опровергает", а пока не подтверждает.
Тут видимо надо бы оценить степень доверия гипотезе что опровергает (или что подтверждает), выразить в сигмах и посмотреть на величину, но я не умею. Если набранная статистика с достоверностью в 3 (а вдруг 5? ;-) ) сигмы опровергает равенство, то "пока не подтверждает" уже не котируется ...
Впрочем до появления такой оценки я соглашусь с Вами что выразился слишком категорично без достаточных на то оснований.


-- 03.04.2022, 16:20 --

Yadryara
Чего ещё хотел добавить про программы.
Инверсией условия z[]>0 является условие z[]==0.
Если хочется инверсию иметь сразу в массиве z[], то достаточно убрать знак "!" перед issquare() при формировании z[], знак "!" как раз и меняет логическое значение на противоположное.

Кроме того, две вероятности $Y_1,Y_2$ можно считать и одновременно, например так (всё кроме последней строки внутрь цикла перебора цепочек вместо того большого if):
Код:
qq=0;
if(numdiv(n+0)==12, if(z[1]>0, qq=1, n4++));
...
if(numdiv(n+14)==12, if(z[15]>0, qq=1, n4++));
if(qq==0, n11++);
...
Y1=1-(n11/q)^(1/11); Y2=n4/4/q;
Тут $Y_1$ считается ровно по Вашему, "от противного", n11 увеличивается только если ни одного раза не нашли 12 делителей, а $Y_2$ как $P_1$ в моей тестовой программе, ведь в идеале $Y_2=P_2$. Оценивать $Y_1$ так же как $Y_2$ при использовании фильтрации нельзя, все 11 вероятностей будут не независимы, потому можно использовать лишь общее условие на все 11 мест (или все равны, или все не равны). Приведу и другой вариант, на "все равны":
Код:
qq=0;
if(numdiv(n+0)==12, if(z[1]>0, qq++, n4++));
...
if(numdiv(n+14)==12, if(z[15]>0, qq++, n4++));
if(qq==11, n11++);
...
Y1=(n11/q)^(1/11); Y2=n4/4/q;
В данном случае в n11 фактически подсчитывается количество цепочек ALL.

Только оба этих варианта будут сильно медленнее нашего обычного поиска так как всегда выполняется 15 numdiv.
Тогда лучше сделать по другому: из нашего обычного поиска пятнашки убрать все комментарии перед ispseudoprimes чтобы обязательно проверялись все цепочки и тот большой if проходили только цепочки ALL, а перед большим if добавить расчёт n4 примерно так:
Код:
zz=Vec(select(x->(x==0),z,1)); \\Индексы только непроверяемых мест, разместить сразу за расчётом z[]
...
foreach(zz,k, if(numdiv(n+k-1)==12, n4++)); \\Y2=n4/4/q
if( \\Тот самый большой if для выделения только цепочек ALL
$Y_1$ легко получить из количества цепочек ALL $Y_1=\sqrt[11]{N_{all}/q}$. Вычислять valids и k после большого if нет нужды (для определения лишь $Y_1,Y_2$).
Плата — 4 лишних numdiv для всех q цепочек. Но хотя бы не 15.

Третий способ, получить $Y_1,Y_2$ из обычной насчитанной статистики из чисел количества ALL цепочек с любым valids $N_{all}$ и количества ALL цепочек с valids=11 $N_{11}$ по формулам $Y_1=\sqrt[11]{N_{all}/q}, Y_2=1-\sqrt[4]{N_{11}/N_{all}}$, которые выводятся из $P_{all}=P_1^{11}, P_{11}=P_1^{11}(1-P_2)^4$.

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение03.04.2022, 17:06 
Аватара пользователя


29/04/13
8111
Богородский
$Y_1 = 1-\sqrt[11]{\dfrac{3016}
{17016}}\approx0.146$

$Y_2 = 1-\sqrt[4]{\dfrac{4500}
{11388}}\approx0.207$

$\dfrac1{0.146^{11}\cdot0.207^4}\approx8.48\cdot10^{11}$

Ну то бишь, по этой оценке, при подъёме на 8 порядков вероятность искомой 15-шки упала раз в 20. И для 46-значных составляет примерно 1 раз на 848 миллиардов попыток.

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение03.04.2022, 17:21 
Заслуженный участник


27/06/08
4062
Волгоград
EUgeneUS в сообщении #1551704 писал(а):
Тут бы здОрово помогли мощности уважаемого VAL...
VAL, Вы не хотите начать расчет с использованием "ускорителей" от уважаемого Dmitriy40?
Не то, чтобы не хочу.
Но я безнадежно отстал от развития событий :-(

-- 03 апр 2022, 17:34 --

Yadryara в сообщении #1551708 писал(а):
Плюс ещё сколько-то проверил VAL, но конкретных данных до сих пор нет.

На моем компе (и некоторых других) крутятся старые программки, проверяющие следующие паттерны:
(После каждого шаблона указаны проверяемые варианты списка PP.)
Код:
5*3^2, 2*PP[1]^2, 13^2, 3*2^2, 7^2, 2*5^2, 3*PP[2]^2, 2^5, 11^2, 2*3^2, 5*PP[3]^2, 7*2^2, 3*PP[4]^2, 2*PP[5]^2, PP[6]^2;

[17, 29, 31, 37, 19, 23]
[17, 29, 31, 37, 23, 19]
[17, 29, 37, 19, 23, 31]
[17, 29, 37, 19, 31, 23]
[17, 29, 37, 23, 19, 31]
[17, 29, 37, 23, 31, 19]
[17, 29, 37, 31, 19, 23]
[17, 29, 37, 31, 23, 19]
[17, 31, 19, 23, 29, 37]
[17, 31, 19, 23, 37, 29]
[17, 31, 19, 29, 23, 37]
[17, 31, 19, 29, 37, 23]

[37, 17, 19, 23, 29, 31]
[37, 17, 19, 23, 31, 29]
[37, 17, 19, 29, 23, 31]
[37, 17, 19, 29, 31, 23]
[37, 17, 19, 31, 23, 29]
[37, 17, 19, 31, 29, 23]

[37, 31, 17, 19, 23, 29]
[37, 31, 17, 19, 29, 23]
[37, 31, 17, 23, 19, 29]
[37, 31, 17, 23, 29, 19]
[37, 31, 17, 29, 19, 23]
[37, 31, 17, 29, 23, 19]
[37, 31, 19, 17, 23, 29]
[37, 31, 19, 17, 29, 23]
[37, 31, 19, 23, 17, 29]
[37, 31, 19, 23, 29, 17]
[37, 31, 19, 29, 17, 23]
[37, 31, 19, 29, 23, 17]
[37, 31, 23, 17, 19, 29]
[37, 31, 23, 17, 29, 19]
[37, 31, 23, 19, 17, 29]
[37, 31, 23, 19, 29, 17]
[37, 31, 23, 29, 17, 19]
[37, 31, 23, 29, 19, 17]
[37, 31, 29, 17, 19, 23]
[37, 31, 29, 17, 23, 19]
[37, 31, 29, 19, 17, 23]
[37, 31, 29, 19, 23, 17]
[37, 31, 29, 23, 17, 19]
[37, 31, 29, 23, 19, 17]

PP[1]^2, 2*PP[2]^2, 3*PP[3]^2, 2^2, 5*PP[4]^2, 2*3^2, 7*11^2, 2^5, 3*PP[5]^2, 2*5^2, PP[6]^2, 3*2^2, 13^2, 2*7^2, 5*3^2;

[17, 19, 23, 29, 31, 37]
[17, 19, 23, 29, 37, 31]
[17, 19, 23, 31, 29, 37]
[17, 19, 23, 31, 37, 29]
[17, 19, 23, 37, 29, 31]

[17, 19, 31, 29, 37, 23]
[17, 19, 31, 37, 23, 29]
[17, 19, 31, 37, 29, 23]
[17, 19, 37, 23, 29, 31]
[17, 19, 37, 23, 31, 29]
[17, 19, 37, 29, 23, 31]
[17, 19, 37, 29, 31, 23]
[17, 19, 37, 31, 23, 29]
[17, 19, 37, 31, 29, 23]
[17, 23, 19, 29, 31, 37]
[17, 23, 19, 29, 37, 31]
[17, 23, 19, 31, 29, 37]
[17, 23, 19, 31, 37, 29]
[17, 23, 19, 37, 29, 31]
[17, 23, 19, 37, 31, 29]
[17, 23, 29, 19, 31, 37]
[17, 23, 29, 19, 37, 31]
[17, 23, 29, 31, 19, 37]
[17, 23, 29, 31, 37, 19]
[17, 23, 29, 37, 19, 31]
[17, 23, 29, 37, 31, 19]
[17, 23, 31, 19, 29, 37]
[17, 23, 31, 19, 37, 29]

PP[1]^2, 2*PP[2]^2, 3*PP[3]^2, 2^2, 5*PP[4]^2, 2*3^2, 7*13^2, 2^5, 3*11^2, 2*5^2, PP[5]^2, 3*2^2, PP[6]^2, 2*7^2, 5*3^2;

[31, 37, 17, 19, 23, 29]
[31, 37, 17, 19, 29, 23]
[31, 37, 17, 23, 19, 29]
[31, 37, 17, 23, 29, 19]
[31, 37, 17, 29, 19, 23]
[31, 37, 17, 29, 23, 19]

PP[1]^2, 2*PP[2]^2, 3*PP[3]^2, 7*2^2, 5*PP[4]^2, 2*3^2, 11^2, 2^5, 3*PP[5]^2, 2*5^2, 7^2, 3*2^2, 13^2, 2*PP[6]^2, 5*3^2;

[19, 37, 17, 23, 29, 31]
[19, 37, 17, 23, 31, 29]
[19, 37, 17, 29, 23, 31]
[19, 37, 17, 29, 31, 23]
[19, 37, 17, 31, 23, 29]
[19, 37, 17, 31, 29, 23]

Наиболее далеко продвинуты вычисления по первому шаблону (порядка 5*10^39)

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение03.04.2022, 19:03 
Заслуженный участник


20/08/14
11766
Россия, Москва
Вы понимаете, что потратив пусть даже целый день на разбирательство как запустить мои программы (хотя достаточно пары часов, я же даю всё практически готовое), Вы за второй день просчитали бы все эти 82 паттерна в 22 потока с нуля до 1e40? А за 5-6 дней в 20-22 потока просчитали бы все 46080 паттернов до 1e38? При том что по всем нашим прикидкам пятнашка должна быть где-то не сильно дальше 1-2e38, т.е. всего на неделю-две Вам счёта. День потерять и плюс неделю-две подождать — и золотой ключик в кармане ... С 21 марта, как я сделал последнюю версию программ и запустил счёт по всем паттернам в низинах (с нуля), уже прошло две недели ...

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение04.04.2022, 12:01 
Аватара пользователя


29/04/13
8111
Богородский
Извините, пока только по цифрам. Подробнее - позже.

Yadryara в сообщении #1551731 писал(а):
при подъёме на 8 порядков вероятность искомой 15-шки упала раз в 20. И для 46-значных составляет примерно 1 раз на 848 миллиардов попыток.

А при подъёме ровно на 1 порядок(с 4е37 до 4е38) средняя частотность искомой 15-шки упала менее чем в полтора раза. И для 39-значных чисел составляет примерно 1 раз на 63 миллиарда попыток.
То есть как раз в том диапазоне, который сейчас проверяется, она движется так:

1 к 43-м $\to$ 1 к 63-м ярдам.

$Y_1 = 1-\sqrt[11]{\dfrac{2693}
{22746}}\approx0.176$

$Y_2 = 1-\sqrt[4]{\dfrac{7699}
{22746}}\approx0.237$

$\dfrac1{0.176^{11}\cdot0.237^4}\approx6.3\cdot10^{10}$

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение04.04.2022, 15:34 
Аватара пользователя


11/12/16
13850
уездный город Н
Становится интересно: а сойдется ли к единице вероятность найти пятнашку когда-нибудь.

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение04.04.2022, 16:16 
Аватара пользователя


29/04/13
8111
Богородский
VAL в сообщении #1551732 писал(а):
я безнадежно отстал от развития событий

Надёжно отстал :-) Подключайтесь уже.

Ведь потом на основе подобных программ можно будет побиться не только за 15-шку, но и за другие мировые рекорды. 19-ку найти, например.

Dmitriy40 в сообщении #1551727 писал(а):
Если хочется инверсию иметь сразу в массиве z[], то достаточно убрать знак "!" перед issquare() при формировании z[], знак "!" как раз и меняет логическое значение на противоположное.

Благодарю, именно об этом спрашивал.

Dmitriy40 в сообщении #1551727 писал(а):
Кроме того, две вероятности $Y_1,Y_2$ можно считать и одновременно,

Будет время, попробую.

Насчитанные нами $Y_2\approx0.24$ и $D_2\approx0.24$ уж очень хорошо совпали с $V_2\approx0.24$:

VAL в сообщении #1548563 писал(а):
Поэтому достаточно, чтобы частное было произведением двух простых. Эмпирическая вероятность этого события (для 40-значных чисел) примерно 0.24.

Хотя и диапазоны разные.

В связи с этим меня уже давно снова заинтересовал вопрос, а стоит ли проверять 4 куаровских(непроверяемых) числа на делимость на простые до $37$ включительно. Разве шаг, даже в 6 раз более короткий, не гарантирует, что если одно из чисел цепочки гарантированно делится на $37^2$, то никакие другие числа из цепочки делиться на $37$ никак не могут? То же и насчёт многих других малых простых.

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение04.04.2022, 17:43 
Заслуженный участник


20/08/14
11766
Россия, Москва
Yadryara в сообщении #1551838 писал(а):
В связи с этим меня уже давно снова заинтересовал вопрос, а стоит ли проверять 4 куаровских(непроверяемых) числа на делимость на простые до $37$ включительно. Разве шаг, даже в 6 раз более короткий, не гарантирует, что если одно из чисел цепочки гарантированно делится на $37^2$, то никакие другие числа из цепочки делиться на $37$ никак не могут?
Тоже интересовал этот вопрос, когда речь шла добавлять ли проверку по индексам (это именно она и есть). И когда её всё же добавил оказались три вещи:
1. Индексы можно проверить заметно быстрее проверки самих чисел.
2. После проверки индексов остаётся примерно половина кандидатов (т.е. дальше надо проверять цепочку лишь в половине попыток).
3. Некоторые ранее найденные цепочки перестали находиться — оказалось у них на непроверяемых местах стояли кубы малых простых (например вместо требуемого $37^2$ стояло $37^3$).
Потому проверка индексов полезна.
Но называть её проверкой делимости на простые до 40 не совсем точно, 4 непроверяемых числа гарантированно не делятся лишь на другие малые простые до 40 (кроме своего под квадратом), но могут делиться на высшие степени своего простого (в 4-й степени и выше). Просто таких цепочек исключительно мало и специально их проверять нет смысла, они будут отброшены уже в PARI по условию на делители. Как их найти: если там 4-я степень, то количество делителей будет кратно 5-ти, но среди 17714 найденных по низинам цепочек таковых нет. Высшие степени должны встречаться ещё реже.
А 11 проверяемых мест вообще не проверяются на делимость на простые до 40 — это гарантируется паттерном и проверкой по индексу (без последней — проверялись).
Более того, после реализации расчёта таблиц "на лету" уже не проверяется и делимость 11-ти проверяемых мест на 41 и 43 — это гарантируется методом генерации таблиц. И проверка 5-ти из 6-ти вариантов по модулю 6 отбрасывается тоже этим же методом генерации таблиц (они просто сразу автоматически получаются вшестеро меньше).

Фактически "индекс" это на каком месте в цепочке стоит простое (например 37), но паттерн гарантирует что оно может стоять лишь ровно на одном месте и не менее чем в квадрате. Но не гарантирует что оно там будет именно в квадрате, кубы и выше паттерн точно допускает. И проверка по индексу сверяет не попало ли простое (то же 37) в позицию где должен быть его же квадрат и не получился ли там куб. Высшие степени не проверяются из-за исключительной редкости.

-- 04.04.2022, 18:12 --

Проверил, ни одна из 17714 цепочек не содержит простых 3..37 в степени выше второй или двойки в степени выше 5-й. Программа проверки:
Код:
pat=readstr("Result.up4e37.txt");
{for(i=1,#pat,
   n=eval(strsplit(pat[i],":")[2]);
   for(j=0,15,
      if(j>14, next(2));
      if((n+j)%(2^6)==0, break);
      if((n+j)%(3^3)==0, break);
      if((n+j)%(5^3)==0, break);
      if((n+j)%(7^3)==0, break);
      if((n+j)%(11^3)==0, break);
      if((n+j)%(13^3)==0, break);
      if((n+j)%(17^3)==0, break);
      if((n+j)%(19^3)==0, break);
      if((n+j)%(23^3)==0, break);
      if((n+j)%(29^3)==0, break);
      if((n+j)%(31^3)==0, break);
      if((n+j)%(37^3)==0, break);
   );
   print(pat[i]);
)}

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение04.04.2022, 23:08 
Заслуженный участник


20/08/14
11766
Россия, Москва
Досчиталось до 5e37, выложил в облако по прежней ссылке под именем Result.4e37.txt, из интересного:
N9-42-465213: 40091657985911885388950250587022432345: 12, 12, 24, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=14, maxlen=12, ALL
N9-24-143256: 42320530232877980329967865363517997145: 12, 12,192, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=14, maxlen=12, ALL
S9-54-654132: 42588642020465470003798188545370638041: 12, 48, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=14, maxlen=13
S9-21-264351: 43225850494045802866766001297116966041: 12, 24, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=14, maxlen=13
S9-45-642531: 43365746600090157323134592909957452441: 12, 12, 24, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=14, maxlen=12
N2-56-132645: 44416340208902508551750340093368285145: 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 24, 24, valids=13, maxlen=13
S9-31-423615: 45571488882151717724759713247496196441: 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 24, 24, valids=13, maxlen=13
S9-41-156342: 45782910333427788710849906692249886041: 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 24, 48, valids=13, maxlen=13
N9-54-146253: 46197850529752941582275241258388939545: 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 24, valids=14, maxlen=14, ALL
N9-53-635412: 47167723026546545016515453097993461145: 48, 24, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=13, maxlen=13
S9-53-423165: 47642810297329495831210150091478210841: 24, 48, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=13, maxlen=13
S2-43-421653: 48270960363985043728937089531764460441: 24, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 24, valids=13, maxlen=13
N2-31-425163: 48505123050166190439007950553119369945: 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 24, 12, valids=14, maxlen=13
N9-23-451362: 48909684707766225889702377697768344345: 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 24, 12, valids=14, maxlen=13
S9-45-315246: 48988433668435541107160718734025743641: 12, 12, 48, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=14, maxlen=12
N2-45-624315: 49444105735974982924046136738983568345: 24, 24, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, 12, valids=13, maxlen=13
Всего нашлось 75 цепочек ALL.

Оценка вероятностей по всей статистике за 0-5e37: $P_1\approx0.1844 (0.0006420), P_2\approx0.2247, 1/P_{15}\approx5.13\cdot10^{37}$ (в скобках - в расчёте на диапазон, перед ними на попытки), или одна пятнашка на 392 цепочки ALL (которых всего найдено 382).

Кроме того там же заменил файл M12-all.gp на чуть обновлённый, с исправленной ошибкой при запуске из папок с пробелами и прочими спецсимволами в путях (спасибо EUgeneUS за обнаружение проблемы).
И туда же выложил новый файл M12-all-17.gp, в котором разбитие по параллельным потокам можно производить не раскладкой паттернов по папкам, а дублированием всего лишь самого .gp файла в количестве потоков и указании в каждом из них номера потока. А паттерны и .exe можно класть все в кучу в подпапки в любом порядке. Также лог формируется не индивидуально по каждому паттерну, а общий для каждого потока и сохраняется рядом с .gp (тоже идея EUgeneUS). В примере файл настроен на 17-й поток из всего 22-х. Плюс максимум инициализации вынесено в начало, за циклы, платой стало большее потребление памяти (при запуске под gp32 возможно придётся увеличить parisize, хотя бы до 10-20 мегабайт), скорость практически не изменилась.

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение05.04.2022, 04:46 
Аватара пользователя


29/04/13
8111
Богородский
Dmitriy40 в сообщении #1551871 писал(а):
Оценка вероятностей по всей статистике за 0-5e37: $P_1\approx0.1844 (0.0006420), P_2\approx0.2247, 1/P_{15}\approx5.13\cdot10^{37}$ (в скобках - в расчёте на диапазон, перед ними на попытки), или одна пятнашка на 392 цепочки ALL (которых всего найдено 382).

Ну первые два числа, видимо, получены так:

$\sqrt[11]{\dfrac{382}
{45.5\cdot10^{9}}}\approx0.1844$

$\sqrt[11]{\dfrac{382}
{5\cdot10^{37}}}\approx0.0006420$

А третье ?

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение05.04.2022, 08:15 
Аватара пользователя


11/12/16
13850
уездный город Н
Dmitriy40 в сообщении #1551871 писал(а):
Досчиталось до 5e37, выложил в облако по прежней ссылке
под именем


1. В этот раз 14-к было больше, чем в среднем, а 13-к меньше, чем в среднем. В результате оценку $a_{14}$ опять мотануло, но уже в другую сторону.
2. Нижняя оценка $a_{15}$ по суммарным данным, на основе гипотезы о вогнутости ломаной $(a_{12},a_{13},a_{14},a_{15})$ вернулась из тумана и составляет $0.014$. Но то, такое...
3. Интересное происходит с количеством цепочек "ALL". Таких 11-к стало меньше, чем таких 12-к. Гистограмма $N_i$ (только по цепочкам "ALL") намекает на какое-нибудь одномодальное распределение с максимумом между "11" и "12". $N_{15}$ по цепочкам "ALL" попадает в хвост распределения и оценить его не получается.

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение05.04.2022, 10:39 
Заслуженный участник


20/08/14
11766
Россия, Москва
Yadryara в сообщении #1551875 писал(а):
А третье ?
Первые два да, именно так. Не понял про какое третье, отвечу про все.
$P_{11}=P_1^{11}(1-P_2)^4, P_{all}=P_1^{11} \to P_2=1-\sqrt[4]{P_{11}/P_{all}}$ ($P_{all}$ - вероятность цепочки ALL с любым valids, $P_{11}$ - вероятность цепочки ALL с valids=11) (почему и говорил что для оценки обеих вероятностей достаточно знать всего два числа: число любых цепочек ALL и их же только с valids=11 или любым другим)
$P_{15}=P_1^{11}P_2^4=P_{all}P_2^4 \to P_{15}/P_{all}=P_2^4$

-- 05.04.2022, 11:11 --

Yadryara, EUgeneUS
Если это не является секретом, ответьте пожалуйста есть у вас дискретная видеокарта и если да, то поддерживает ли она CUDA и OpenCL и сколько потоковых юнита имеет (хорошо бы ещё и объём памяти и её пропускную способность в GB/s знать)? Или лучше скажите точную модель, я сам посмотрю точные параметры. Или можно просто запустить GPU-Z и показать скрин. Если видюх несколько, то достаточно лишь про самую дорогую/последнюю/производительную. Не возражаю если ответите в ЛС.

Почему спрашиваю. Есть у меня мысль переделать счёт под GPU, потому что сейчас моя программа фактически выполняет следующие операции (немного упрощая):
Код:
for(k=0,oo, \\Индекс проверяемого числа из формулы n=n0+k*m
   for(i=1,11*pi(4096),
      x[i]=(x[i]+d[i])%p[i]; \\Изменяем все остатки по модулям для соответствия новому k
   );
   for(i=1,11*pi(4096), \\Проверка всех простых для каждого из 11-ти проверяемых чисел
      if(x[i]==0, next(2)); \\Разделилось, не подходит, берём следующее k
   );
   print("Нашли кандидата: k=",k);
);
Как прекрасно видно содержимое обоих внутренних циклов можно выполнять параллельно, хоть в тысячи потоков.
Плюс никто не мешает и внешний цикл по k выполнять параллельно (надо только завести разные массивы x[] и d[] для каждого потока и всё).
И такие простые операции должны по идее прекрасно ложиться в GPU ... Но у меня видюхи нет, лишь встроенная в проц (но с поддержкой OpenCL), потому большого выигрыша в скорости не получу, надо бы не 20 потоков на 1ГГц как у меня, а сотни, и обязательно быструю память к ним. Но если не найдём пятнашку до 1-2e38, то возможно задумаюсь о переписывании под GPU ... Но если у Вас тоже видюхи не ахти, то незачем и париться (а париться много, к сожалению я плохо разбираюсь в тонкостях вычислений на GPU, да ещё и ассемблера там нет в принципе, только C, качество компиляции с которого вызывает сомнения).

 Профиль  
                  
 
 Re: Пентадекатлон мечты
Сообщение05.04.2022, 17:42 
Заслуженный участник


27/06/08
4062
Волгоград
Dmitriy40 в сообщении #1551737 писал(а):
Вы понимаете, что потратив пусть даже целый день на разбирательство как запустить мои программы (хотя достаточно пары часов, я же даю всё практически готовое), Вы за второй день просчитали бы все эти 82 паттерна в 22 потока с нуля до 1e40? А за 5-6 дней в 20-22 потока просчитали бы все 46080 паттернов до 1e38? При том что по всем нашим прикидкам пятнашка должна быть где-то не сильно дальше 1-2e38, т.е. всего на неделю-две Вам счёта. День потерять и плюс неделю-две подождать — и золотой ключик в кармане ... С 21 марта, как я сделал последнюю версию программ и запустил счёт по всем паттернам в низинах (с нуля), уже прошло две недели ...

Внутренний голос подсказывает мне, что вы раньше досчитаете, чем я разберусь... :wink:

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 3218 ]  На страницу Пред.  1 ... 26, 27, 28, 29, 30, 31, 32 ... 215  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group