2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4  След.
 
 Re: Отрезки из повторяющихся исходов
Сообщение18.09.2021, 20:30 
Аватара пользователя


29/04/13
8118
Богородский
provincialka в сообщении #1532012 писал(а):
$$\begin{matrix}
 1& 2 & 3 & 4 & 5 & 6  \\
 31441& 374866 & 343248 & 156832 & 62197 & 31416 
 \end{matrix}$$

Для первого и последнего чисел точное значение $1000000\cdot 2^{-5}=31250$, так как в этих случаях состав последовательности вполне определяется первой выпавшей буквой.

Конечно. Значит, ни у меня, ни у Вас для 6-ти бросков ошибки нет. Матожидания:

$$\begin{matrix}
 1& 2 & 3 & 4 & 5 & 6  \\
 31250& 375000 & 343750 & 156250 & 62500 & 31250 
 \end{matrix}$$

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение18.09.2021, 20:32 
Заслуженный участник
Аватара пользователя


16/07/14
9149
Цюрих
venco в сообщении #1532014 писал(а):
уже для 10000 бросков вероятность получить максимум 6 повторов $1.66722\cdot10^{-36}$
Где-то лишняя двойка, должно быть в два раза меньше (в варианте, когда мы требуем чтобы ни нуль ни единица не повторялись больше 6 раз).

(точное значение)

16630839093886493318310206208188770135256932429697303508167572537892964490039810715739361410004224654319481067279590832171408485303141421420892126780495269036609028984281135905443030145695727065427793524431023062354495358754347494992636385416444367188556731610943177417016551507278045737629888991190599963035873845566689771383516911822609650593260212095818581983576648438707306960900589152565606100975675363922447378694205850060836688412254084677083635006612124532259202724247038629570907108111112711060533959001108985186506640756356127401710731353717109019758771780803972330352326400329351586487828503612636631505676111650917991958456512752101032151511783372866008708205347828627191994064748228530505452890836286883795170156174721262893960362788411772729946597504234967442266175150921379567699712311153014868787033261371551434091851272771956360840530459739654304489663144129947683224331367257471131219180444091957729274659072291019327135619687161466523529523323434461008223870871515097771105635688244181769374294352781853561418666765843419670271598052619327377549927214529421195199588975297168279007232092301523408247963981623511802531370377300757971284567455524332980543542768148901835359277917542913191931513862006133299681362511814317325368462060239395200995944657569636935435272868894040306141513949756345267195441472089683928625587724846167621815908912793642010615868351589703943960879021966270329356771857168759434914424756407003328464390326897693095884894777882653866133324444137345218913285000704256106067177824124684745355654878932532407265602981870348981800719845324317575710922726719722612288622660679515904981660163320022291123314722623326423423309514707771334341817220045097051646882410238020122645513136906489173508040229103593103241969338561665505028813627451971161996595607985073911148194560940337739799559292094638247850504427367485608025599564609433990112481961939432240273161627181225567311262452872951921281479984905110764088310695012812853740050106045154659239080174474486895733857574231745047843440483014894832174146763114219735906809360555115143662512499703442730690119490367112422716761484021002605986658855830395875288556932029325847835793255904528416484271629170840148636773666378780356818537659572461613065365118946227192059120296322629119573026306933943227211890099354874142305156619442414771723778949466441193311439871971850959162165437525734014638577720044375401222910301107519630266461407773955361004785202171577606383040749888126917035093654465463668056410591553876230441760568544669510769390119267680139870047510396810794266563580000296881044903798826487369500549195777376473684491405902096264694236572299707735581848081925979763030053204968973173346161009102893107172245580492823875218732389702334905128573587877941224479045403788389447517978107057930197882089635666804907725067905734459593884018142296030839873223151853655774229552938891442346336301390734004488600957911570173781524150980826756450117247790146084492575041839979426080046280 / 19950631168807583848837421626835850838234968318861924548520089498529438830221946631919961684036194597899331129423209124271556491349413781117593785932096323957855730046793794526765246551266059895520550086918193311542508608460618104685509074866089624888090489894838009253941633257850621568309473902556912388065225096643874441046759871626985453222868538161694315775629640762836880760732228535091641476183956381458969463899410840960536267821064621427333394036525565649530603142680234969400335934316651459297773279665775606172582031407994198179607378245683762280037302885487251900834464581454650557929601414833921615734588139257095379769119277800826957735674444123062018757836325502728323789270710373802866393031428133241401624195671690574061419654342324638801248856147305207431992259611796250130992860241708340807605932320161268492288496255841312844061536738951487114256315111089745514203313820202931640957596464756010405845841566072044962867016515061920631004186422275908670900574606417856951911456055068251250406007519842261898059237118054444788072906395242548339221982707404473162376760846613033778706039803413197133493654622700563169937455508241780972810983291314403571877524768509857276937926433221599399876886660808368837838027643282775172273657572744784112294389733810861607423253291974813120197604178281965697475898164531258434135959862784130128185406283476649088690521047580882615823961985770122407044330583075869039319604603404973156583208672105913300903752823415539745394397715257455290510212310947321610753474825740775273986348298498340756937955646638621874569499279016572103701364433135817214311791398222983845847334440270964182851005072927748364550578634501100852987812389473928699540834346158807043959118985815145779177143619698728131459483783202081474982171858011389071228250905826817436220577475921417653715687725614904582904992461028630081535583308130101987675856234343538955409175623400844887526162643568648833519463720377293240094456246923254350400678027273837755376406726898636241037491410966718557050759098100246789880178271925953381282421954028302759408448955014676668389697996886241636313376393903373455801407636741877711055384225739499110186468219696581651485130494222369947714763069155468217682876200362777257723781365331611196811280792669481887201298643660768551639860534602297871557517947385246369446923087894265948217008051120322365496288169035739121368338393591756418733850510970271613915439590991598154654417336311656936031122249937969999226781732358023111862644575299135758175008199839236284615249881088960232244362173771618086357015468484058622329792853875623486556440536962622018963571028812361567512543338303270029097668650568557157505516727518899194129711337690149916181315171544007728650573189557450920330185304847113818315407324053319038462084036421763703911550639789000742853672196280903477974533320468368795868580237952218629120080742819551317948157624448298518461509704888027274721574688131594750409732115080498190455803416826949787141316063210686391511681774304792596709376

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение18.09.2021, 20:36 
Аватара пользователя


29/04/13
8118
Богородский
venco, ну а что насчёт 6-ти бросков скажете? Ваш треугольник только до 5 доходит.

-- 18.09.2021, 20:48 --

Dmitriy40

Если вот так подправить код, то почему-то выдаёт $247$. А разве должна не $236$?

Код:
nn=9; kk=6;
T=matrix(nn, kk); T[1,1]=1;
{rT(n,k)=
   if(k<0 || k>n, return(0));
   if(k==0 || k==n || n==0, return(1));
  2*rT(n-1,k)+rT(n-1,k-1)-2*rT(n-2,k-1)+rT(n-k-1,k-1)-rT(n-k-2,k);}
for(n=2,kk+2, for(k=1,min(n,kk), T[n,k]=rT(n,k)););
for(n=kk+3,nn, T[n,1]=2*T[n-1,1]+1-2*1+1-T[n-1-2,1];
for(k=2,kk, T[n,k]=2*T[n-1,k]+T[n-1,k-1]-2*T[n-2,k-1]+T[n-k-1,k-1]-T[n-k-2,k]););
print(vecsum(T[nn-1,1..5]));

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение18.09.2021, 21:09 
Заслуженный участник


04/05/09
4587
Yadryara в сообщении #1532017 писал(а):
venco, ну а что насчёт 6-ти бросков скажете? Ваш треугольник только до 5 доходит.
Да нет, всё сошлось.
Для произвольных повторов количество вариантов длины $n$ с повтором длины $k$ очевидно равно удвоенному количеству разбиений числа $n$ на слагаемые с максимальным слагаемым $k$.
Для повторов единицы - допишем в конце $0$ и поделим последовательность после каждого нуля. Получится разбиение $n+1$ на слагаемые с максимальным $k+1$.

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение18.09.2021, 21:26 
Аватара пользователя


29/04/13
8118
Богородский
venco, хорошо. А я тем временем, видимо, ошибку нашёл у Dmitriy40. Суммирование надо начинать с первого числителя, а программа начинает со второго. При $n=6$ полное совпадение, а затем, начиная с $n=7$ погрешность начинает расти и к $n=600$ становится космической. При $n=9$ она, как я уже отметил, равна $11$.

То есть суммируются не $1 + 54 + 94 + 59 + 28$, а $54 + 94 + 59 + 28 + 12$

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение18.09.2021, 22:21 
Заслуженный участник


20/08/14
11775
Россия, Москва
Yadryara
Да, в том коде значения оказались с нулевого смещения, правильный код вот:
Код:
nn=600;kk=6;
T=matrix(nn,kk);
{rT(n,k)=
   if(k<0 || k>n, return(0));
   if(k==0 || k==n || n==0, return(1));
   2*rT(n-1,k)+rT(n-1,k-1)-2*rT(n-2,k-1)+rT(n-k-1,k-1)-rT(n-k-2,k);
}
for(n=1,kk+1, T[n,1]=1; for(k=2,min(n,kk), T[n,k]=rT(n-1,k-1)); );
for(n=kk+2,nn, T[n,1]=1; for(k=2,kk, T[n,k]=2*T[n-1,k] + T[n-1,k-1] - 2*T[n-2,k-1] + T[n-k,k-1] - T[n-k-1,k]); );
print(vecsum(2.0*T[nn,1..5])/2^nn);
Теперь выдаёт и всю матрицу правильно, и вероятность стала не 0.7%, а 36ppm, как и у venco и в прогонах у provincialka. Так что да, считал неправильно (точнее для $m=7$ вместо $m=6$ и не учитывал первую $2$).

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 06:45 
Аватара пользователя


29/04/13
8118
Богородский
Ну вот, чего ж бежать впереди паровоза. Говорил же надо сначала с маленькими значениями разобраться. Перепроверил последнюю версию программы и настроил её для проверки стат. результатов Уважаемой provincialka. Прекрасно получилось.

provincialka в сообщении #1532000 писал(а):
$$\begin{matrix}
 5& 6 & 7 & 8 & 9 & 10 & 11 &12 &13&14 & \\
 22& 7585 & 83872 & 216251 & 250036 & 189880 & 117287& 65298 &34544 &17466 & 
 \end{matrix}$$

Мат. ожидания:
$$\begin{matrix}
 5& 6 & 7 & 8 & 9 & 10 & 11 &12 &13&14 & \\
 36& 7389 & 84113 & 216422 & 249970 & 190294 & 117278 & 65021 & 34196 & 17519 & 
 \end{matrix}$$

А вот и код. За основу по-прежнему берётся A048004.

Код:
nn=600;kk=14;
T=matrix(nn,kk);
{rT(n,k)=
   if(k<0 || k>n, return(0));
   if(k==0 || k==n || n==0, return(1));
   2*rT(n-1,k)+rT(n-1,k-1)-2*rT(n-2,k-1)+rT(n-k-1,k-1)-rT(n-k-2,k);}
for(n=1,kk+1, T[n,1]=1; for(k=2,min(n,kk), T[n,k]=rT(n-1,k-1)); );
for(n=kk+2,nn, T[n,1]=1;for(k=2,kk,T[n,k]=2*T[n-1,k]+T[n-1,k-1]-2*T[n-2,k-1]+T[n-k,k-1]-T[n-k-1,k]););
print();print("   ",2.*T[nn,5..14]/2^nn*10^6);print();

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 08:14 
Аватара пользователя


29/04/13
8118
Богородский
venco в сообщении #1532011 писал(а):
Для $n=600$ вероятности получить максимальный повтор $1..6$ равны:
$4.8198\cdot 10^{-181},	8.6123\cdot 10^{-56},	1.83646\cdot 10^{-22},	2.76136\cdot 10^{-10},	3.60578\cdot 10^{-05},	0.00738934$

Да, и с этими значениями полное совпадение. Добавил по 4-5 значащих цифр справа, чтобы было понятно, что именно это тоже посчитано:

$1. \qquad    4.819839730\cdot 10^{-181}$,

$2.  \qquad	8.612304675\cdot 10^{-56}$,

$3.  \qquad	1.836462902\cdot 10^{-22}$,

$4.  \qquad	2.761355662\cdot 10^{-10}$,

$5.  \qquad	3.605779071\cdot 10^{-05}$,

$6.  \qquad    7.389340284\cdot 10^{-03}$


Код:
nn=600;kk=14;
T=matrix(nn,kk);
{rT(n,k)=
   if(k<0 || k>n, return(0));
   if(k==0 || k==n || n==0, return(1));
   2*rT(n-1,k)+rT(n-1,k-1)-2*rT(n-2,k-1)+rT(n-k-1,k-1)-rT(n-k-2,k);}
for(n=1,kk+1, T[n,1]=1; for(k=2,min(n,kk), T[n,k]=rT(n-1,k-1)); );
for(n=kk+2,nn, T[n,1]=1;for(k=2,kk,T[n,k]=2*T[n-1,k]+T[n-1,k-1]-2*T[n-2,k-1]+T[n-k,k-1]-T[n-k-1,k]););
print();print("   ",2.*T[nn,1..6]/2^nn);print();


mihaild в сообщении #1531978 писал(а):
Вероятность того, что из $600$ бросков максимальная серия из орлов будет иметь длину ровно $n$ - на картинке.
Изображение

Если, не трогая рисунок, сдвинуть нижнюю шкалу на $1$ влево, получим те самые вероятности, что участвуют и в предыдущем посте и в нынешнем. Потому что программа на PARI не считает именно орлы.

venco в сообщении #1532014 писал(а):
Я оценил ассимптотику и получил, что уже для 10000 бросков вероятность получить максимум 6 повторов $1.66722\cdot10^{-36}$


У меня очень близкий результат прямым подсчётом:

$6.  \qquad    1.667199293\cdot 10^{-36}$

Код:
nn=10000;kk=14;
T=matrix(nn,kk);
{rT(n,k)=
   if(k<0 || k>n, return(0));
   if(k==0 || k==n || n==0, return(1));
   2*rT(n-1,k)+rT(n-1,k-1)-2*rT(n-2,k-1)+rT(n-k-1,k-1)-rT(n-k-2,k);}
for(n=1,kk+1, T[n,1]=1; for(k=2,min(n,kk), T[n,k]=rT(n-1,k-1)); );
for(n=kk+2,nn, T[n,1]=1;for(k=2,kk,T[n,k]=2*T[n-1,k]+T[n-1,k-1]-2*T[n-2,k-1]+T[n-k,k-1]-T[n-k-1,k]););
print();print("   ",2.*T[nn,6]/2^nn);print();

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 15:24 
Заслуженный участник


20/08/14
11775
Россия, Москва
Yadryara в сообщении #1532068 писал(а):
У меня очень близкий результат прямым подсчётом:
Хочу обратить Ваше внимание что Вы иногда указываете не совсем ту вероятность, о которой утверждаете: в матрице $T[n,k]$ сидят частоты выпадения длин не максимум $k$, а ровно $k$, потому если хотите частоту длин максимум $k$, надо сложить её со всеми меньшими $k$ (как у меня в коде и было vecsum). Поправка для больших $n$ исчезающе мала (десяток и более порядков), однако для малых $n$ будет заметна.

Например $P(600,6)=0.007389340284124275425954794433$, но $\sum_{k=0}^6 P(600,k) = 0.007425398350972517534375923643$, разница составляет $0.00003605806684824210842112921$ или почти $0.5\%$ погрешности, почти точно (4 одинаковых знака) значение $P(600,5)=0.00003605779071267586675086922$. Т.е. для погрешности менее 1% $n=600$ уже следует считать малым.

(Улучшение программы)

Если попытаться считать очень большие $n$, типа миллионов или миллиардов, то не хватит памяти под матрицу $T[]$. Тогда можно заметить что для расчёта $T[n,\ldots]$ требуются элементы не менее чем $T[n-k-1,\ldots]$, что позволяет хранить лишь их, в количестве $k+2$ строк. Модификация кода не слишком сложна, но или замедлит расчёты (если делать сдвигом матрицы) или потребует аккуратности (если реализовать кольцевую структуру) или нужно найти в PARI готовую удобную структуру (типа хэш дерева).

При расчёте больших $k$ первый цикл быстро становится непрактичным из-за глубокой рекурсии в $rT()$, часто не нужной. Например $k=15$ считается пару секунд, а $k=20$ требует уже 3 минуты. Тогда можно подправить код $rT()$ чтобы она не вызывалась рекурсивно если индексы гарантированно не уходят меньше единицы, например вот так:
Код:
{rT(n,k)=
   if(k<0 || k>n || n<0, return(0));
   if(k==0 || k==n || n==0, return(1));
   2*T[n,k+1] + T[n,k] - 2*T[n-1,k] + if(n>k, T[n-k,k], rT(n-k-1,k-1)) - if(n-1>k, T[n-k-1,k+1], rT(n-k-2,k));
}
for(n=1,nn, for(k=1,min(n,kk), T[n,k]=rT(n-1,k-1); ); );
Тут добавлены проверки, заменяющие длинные рекурсии на обращение к матрице. В результате время вычисления $k=20$ уменьшилось с трёх минут до 0.15 секунды и даже для $k=10000$ составляет чуть более секунды.
И это же позволило вообще отказаться от деления на два цикла и всё заполнение матрицы делать простым первым, разница в вызове функции и четвёрке условных операторов несущественна (вычисления $n=600,k=100$ занимают в любом случае менее секунды, $n=10000,k=100$ занимают 5.2 секунды против 4.3 с двумя циклами).

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 15:51 
Аватара пользователя


29/04/13
8118
Богородский
Dmitriy40 в сообщении #1532098 писал(а):
Хочу обратить Ваше внимание что Вы иногда указываете не совсем ту вероятность, о которой утверждаете:

:shock: А можно хоть один пример?

Dmitriy40 в сообщении #1532098 писал(а):
в матрице $T[n,k]$ сидят частоты выпадения длин не максимум $k$, а ровно $k$, потому если хотите частоту длин максимум $k$, надо сложить её со всеми меньшими $k$ (как у меня в коде и было vecsum).

Я в курсе. Я поэтому довольно часто и убирал vecsum. Потому что мне часто нужны были именно эти числа, а не их сумма. Я за этим внимательно следил.

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 16:21 
Заслуженный участник


20/08/14
11775
Россия, Москва
Yadryara в сообщении #1532104 писал(а):
А можно хоть один пример?
Например вот здесь:
Yadryara в сообщении #1532068 писал(а):
venco в сообщении #1532011 писал(а):
Для $n=600$ вероятности получить максимальный повтор $1..6$ равны:
$4.8198\cdot 10^{-181},	8.6123\cdot 10^{-56},	1.83646\cdot 10^{-22},	2.76136\cdot 10^{-10},	3.60578\cdot 10^{-05},	0.00738934$
Да, и с этими значениями полное совпадение. Добавил по 4-5 значащих цифр справа, чтобы было понятно, что именно это тоже посчитано:
$1. \qquad    4.819839730\cdot 10^{-181}$,
$2.  \qquad	8.612304675\cdot 10^{-56}$,
$3.  \qquad	1.836462902\cdot 10^{-22}$,
$4.  \qquad	2.761355662\cdot 10^{-10}$,
$5.  \qquad	3.605779071\cdot 10^{-05}$,
$6.  \qquad    7.389340284\cdot 10^{-03}$
Вы оба указали не сумму всех меньших вероятностей, а сами вероятности, (да, и venco тоже, хотя прямо сказал про максимальный повтор), сравните числа для $k>4$ со своими выше:
Код:
P(600,1)=4.819839730205768 e-181 vs Sum(P(600,1...1))=4.819839730205768 e-181
P(600,2)=8.612304675229292 e-56 vs Sum(P(600,1...2))=8.612304675229292 e-56
P(600,3)=1.836462902103414 e-22 vs Sum(P(600,1...3))=1.836462902103414 e-22
P(600,4)=2.761355662414866 e-10 vs Sum(P(600,1...4))=2.761355662416703 e-10
P(600,5)=3.605779071267587 e-5 vs Sum(P(600,1...5))=3.605806684824211 e-5
P(600,6)=7.389340284124275 e-3 vs Sum(P(600,1...6))=7.425398350972518 e-3

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 16:29 
Аватара пользователя


29/04/13
8118
Богородский
Dmitriy40 в сообщении #1532107 писал(а):
Вы оба указали не сумму всех меньших вероятностей, а сами вероятности,

Совершенно верно, мы сравнивали одно и то же. Не сумму. Где же пример?

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 16:38 
Заслуженный участник


20/08/14
11775
Россия, Москва
Yadryara
Вы сравнили друг с другом, всё сошлось, но назвали величины неправильно, это не максимум $k$, а ровно $k$. Ошибся venco, Вы с ним согласились, не поправили.
Ладно, раз понимаете, то считайте моё напоминание неактуальным или придиркой.

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 16:54 
Заслуженный участник
Аватара пользователя


16/07/14
9149
Цюрих
Dmitriy40 в сообщении #1532098 писал(а):
Если попытаться считать очень большие $n$, типа миллионов или миллиардов, то не хватит памяти под матрицу $T[]$
Да и считать её целиком не нужно. Следующая строка получается из предыдущих линейно, поэтому задача сводится к вычислению $n$-й степени матрицы $k \times k$.

Вообще я перестал понимать, что в точности обсуждается?

 Профиль  
                  
 
 Re: Отрезки из повторяющихся исходов
Сообщение19.09.2021, 17:14 
Заслуженный участник


20/08/14
11775
Россия, Москва
Да уже ничего, все разногласия в цифрах устранены, что задача не для решения "на бумажке" давно стало понятно.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 56 ]  На страницу Пред.  1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group