2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Как посчитать вероятности выпадения количества событий
Сообщение19.10.2022, 22:32 


24/03/09
573
Минск
Я сгенерировал 105 разных карт для компьютерной игры, цель - найти такую рандомную карту, чтобы побольше ДеревьевЗнаний было.
Подвёл статистику, в среднем вроде, около $11$ ДеревьевЗнаний выпадает. Минимум была карта где выпало только $3$ дереваЗнаний, а максимум вышла одна карта с $22$ древамиЗнаний.

Вот полная выборка по 105 сгенерированным картам.

15 ; 13 ; 11 ; 10; 05; 11; 06; 09; 16; 11; 08; 12; 10; 19; 12; 09; 04; 10; 13; 12; 10; 07; 16; 13; 09; 19;11;11; 14; 12; 15; 13; 20; 10; 10; 07; 13; 08; 16; 12; 14; 09; 12; 16; 11; 13; 11; 10; 18; 06; 05; 09; 07; 17; 14; 19; 08; 03 ; 07; 17; 13; 13; 07; 09; 06; 13; 07; 18; 09; 09; 19; 09; 11; 06; 07; 06; 13; 12; 09; 11; 12; 05; 06; 13; 08; 11; 10; 08; 22 ; 08; 08; 08; 09; 17; 06; 09; 13; 11; 08; 08; 03; 13; 13; 05; 04,

Вопрос - как посчитать вероятности.
Сколько надо нагенерить карт, чтобы с большой вероятностю, скажем $50$ процентов, встретилась хотя бы одна такая карта, с количеством древЗнаний -

1) более или равное $26$-ти ?
2) более или равное $30$-ти ?

Всего объектов на карте много, более $10 $тысяч, и я так понял, сильно на вероятности влияет их точное количество для "вырожденных" случаев, например если нам нужно посчитать вероятности что вообще не выпадет ни одного древаЗнаний. А для больших чисел, типа $26$, $30$, это общее количество объектов на карте, не должно особо влиять на вероятности.

функция - для нас чёрный ящик , но принцип как он работает, понятен . Генератор карт пихает разные объекты на карту. Некоторые из них - становятся ДеревьямиЗнаний. Поскольку в среднем на карте выходит (среднее арифметическое) - 11 деревьевЗнаний, а также видим выборку (минимум $3$, максимум $22$, из $105$-ти карт) значит можно как то посчитать и вероятность что выпадет $26$ или больше, $30$ или больше и т.д.,

эвристически (по мат.статистике) - то что выпадает $22$ или более деревьевЗнаний, в районе $1/100$, так как одна такая карта и выпала из чуть более сотни сгенерированных. Но сколько нужно, чтобы найти с $26$-ю или более, с $30$-ю или более и т.д. ?

Мне в первую очередь, нужно $26$ или больше. Если для этого достаточно среднестатистически нагенерить ещё допустим, $300$ карт, то я бы сделал . но если там нужно $1000$, или $10$ тысяч, и т.п. то смысла нет - слишком много времени на анализ будет. Вот так иногда в практических целях теорвер знать надо. :)

Могут быть возражения типа >> "Ну надо знать сколько всего объектов на карте и сколько типов объектов"
>>

в том то и дело, я думаю , что скорее всего не нужно, и математик решит эту задачу, и с неизвестным точно числом всех объектов (если их достаточно большое количество, скажем более 10 тысяч). Дело в том, что скорее всего, при их достаточном большом количестве, и устремлении этого количества к бесконечности, вероятности выпадения $26$ или более, $30$ или более ДревЗнаний, и т.д. - будет асимптотически стремиться к какой то одной вероятности.

Надеюсь, понятно описал.
Спасибо, если кто подскажет,

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение20.10.2022, 06:27 
Аватара пользователя


22/07/22

897
Я думаю, тут нормальное распределение. Посчитайте среднее (11) и дисперсию. Потом если увеличить выборку в энное число раз, получим снова нормальное распределение с другим (вычисленным) матожиданием и дисперсией. И надо такое найти такое эн, чтобы ваш запрос по деревьям вписывался в столько-то сигм.

-- 20.10.2022, 06:28 --

Skipper в сообщении #1567164 писал(а):
Дело в том, что скорее всего, при их достаточном большом количестве, и устремлении этого количества к бесконечности, вероятности выпадения $26$ или более, $30$ или более ДревЗнаний, и т.д. - будет асимптотически стремиться к какой то одной вероятности.

Да, к единице :mrgreen:

-- 20.10.2022, 06:42 --

Построил вручную гистаграмку по вашим данным, распределение вроде похоже на нормальное (правда есть предпочтения меньших значений, чем симметричных больших), и ни разу не выпало $21$ дерево :-)

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение20.10.2022, 22:46 
Заслуженный участник


10/01/16
2318
Skipper
Ну, это, скорее всего, Пуассоновское распределение (оно - для редких событий, а, судя по Вашему тексту, появление ДЗ среди тысяч объектов - редкое) , с параметром 11.
Ну вот засем нам прямо полная выборка то? Надо бы ее сгруппировать: сколько раз - сколько ДЗ. И тогда можно проверить эту гипотезу (о распределении по Пуассону) по критерию хи-квадрат. И если данные согласуются с гипотезой - то можно и Ваши вероятности посчитать (я прикинул: для не более трех ДЗ ожидаемое кол-во из 105 экспериментов чуть меньше половины...)

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 05:18 
Аватара пользователя


22/07/22

897
DeBill в сообщении #1567236 писал(а):
Пуассоновское распределение

Да, я че-то его сразу приблизил нормальным из-за большого лямбда, а потом удивляюсь смещению влево :mrgreen: Правда все сказанное выше остается в силе

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 14:18 


24/03/09
573
Минск
Правильно ли я понимаю, что если распределение Пуассоновское, то вот, глядя на предельные значения - от 3 до 22-х, вероятность найти с 2-мя деревьямиЗнаний карту - менее вероятно, чем с 23-мя ?

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 14:42 
Аватара пользователя


22/07/22

897
Skipper
Наоборот

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 15:04 
Аватара пользователя


11/12/16
13857
уездный город Н
Skipper
Если это распределение Пуассона с $\lambda = 11$, то получить значения вероятностей можно в любом мат. или стат. пакете. Да, хотя бы в Excel.

Вероятность, что будет ровно 2 ДЗ: $P_2 \approx 0.00101$
Вероятность, что будет 2 или менее ДЗ: $P_{\le 2} \approx 0.00121$
Вероятность, что будет ровно 23 ДЗ: $P_{23} \approx 0.000578$
Вероятность, что будет 23 или больше ДЗ: $P_{\ge 23} \approx 0.00104$

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 11:34 


24/03/09
573
Минск
Doctor Boom в сообщении #1567270 писал(а):
Skipper
Наоборот


EUgeneUS в сообщении #1567271 писал(а):
Skipper
Если это распределение Пуассона с $\lambda = 11$, то получить значения вероятностей можно в любом мат. или стат. пакете. Да, хотя бы в Excel.

Вероятность, что будет ровно 2 ДЗ: $P_2 \approx 0.00101$
Вероятность, что будет 2 или менее ДЗ: $P_{\le 2} \approx 0.00121$
Вероятность, что будет ровно 23 ДЗ: $P_{23} \approx 0.000578$
Вероятность, что будет 23 или больше ДЗ: $P_{\ge 23} \approx 0.00104$


Вот что то и не совпадает. Я сгенерировал теперь 600 карт и их проанализировал, вышло так что до сих пор не выпало ни одной карты с 2 или менее деревьямиЗнаний, ну допустим, так и могло быть, если вероятность как вы написали, чуть более 1/900, но вот с 23 или больше деревьямиЗнаний - вероятность похоже, явно выше. Из тех 600 карт, выпали и с 24 ДЗ, и с 25 ДЗ, и с 26 ДЗ, и одна с 27 ДЗ - это рекорд на множестве из 600 карт.

Значит, в сторону увеличения возможного количества ДЗ, вероятность явно не так быстро падает, как в сторону уменьшения. Т.е. я хочу сказать, что похоже на то, что даже если принять вероятности с "2 ДЗ или менее", такой же как и с "27 ДЗ или больше", то на следующем этапе окажется,
что вероятность карты с $M \leqslant 1$ ДЗ, будет также меньше, чем вероятность выпадения карты с $M \geqslant 28$ ДЗ.

Потому, хочу переспросить, действительно ли здесь распределение Пуассона ?

На всякий случай, привожу данные по 600 картам, разбитые на подмножества - 1-я сотня, 2-я сотня, ... 6-я сотня -

(Оффтоп)

1-я сотня ------>
15, 13, 11, 10, 05, 11, 06, 09, 16 , 11, 08, 12, 10, 19, 12, 09, 04, 10, 13, 12, 10, 07, 16, 13, 09, 19, 11,
11, 14, 12, 15, 13, 20, 10, 10, 07, 13, 08, 16, 12, 14, 09, 12, 16, 11, 13, 11, 10, 18, 06, 05, 09, 07, 17,
14, 19, 08, 03, 07, 17, 13, 13, 07, 09, 06, 13, 07, 18, 09, 09, 19, 09, 11, 06, 07, 06, 13, 12, 09, 11, 12,
05, 06, 13, 08, 11, 10, 08, 22, 08, 08, 08, 09, 17, 06, 09, 13, 11, 08, 08,


2-я сотня ------>
03, 13, 13, 05, 04, 07, 12, 09, 03, 14, 08, 07, 11, 14, 19, 09, 13, 21, 08, 10, 08, 15, 06, 07, 12, 07, 09,
09, 16, 11, 18, 08, 14, 11, 05, 08, 07, 08, 18, 13, 13, 09, 15, 12, 08, 11, 17, 14, 13, 07, 08, 06, 13, 15,
14, 08, 10, 07, 13, 11, 13, 05, 09, 11, 07, 17, 07, 12, 16, 17, 06, 08, 11, 18, 10, 10, 06, 17, 12, 14, 13,
14, 17, 07, 05, 17, 16, 05, 09, 12, 13, 12, 13, 10, 15, 16, 14, 06, 09, 13,

3-я сотня ------>
10, 10, 10, 07, 11, 11, 10, 08, 10, 08, 11, 10, 13, 06, 07, 15, 10, 13, 06, 09, 06, 07, 10, 07, 12, 13, 09,
10, 05, 12, 09, 17, 13, 08, 09, 08, 06 , 16, 07, 15, 16, 08, 07, 13, 11, 15, 12, 06, 11, 08, 11, 07, 08,
12, 08, 13, 07, 12, 11, 09, 06, 17, 06, 14, 11, 07, 10, 14, 13, 13, 06, 09, 10, 08, 09, 06, 08, 15, 14,
14, 07, 15, 17, 12, 11, 13, 13, 08, 08, 12, 04, 05, 10, 15, 08, 10, 21, 09, 10, 07,

4-я сотня ------>
15, 06, 13, 07, 12, 08, 11, 10, 13, 14, 16, 07, 19, 27, 10 , 16, 17, 12, 08, 05, 08, 19, 17, 15, 08, 09,
06, 16, 07, 17, 10, 09, 07, 09, 10, 11, 11, 16, 11, 03, 12, 21, 09, 14, 12, 09, 07, 03, 12, 10, 09, 09,
09, 07, 08, 08, 21, 11, 07, 15, 11, 07, 09, 11, 09, 08, 09, 14, 11, 10, 16, 09, 11, 10, 15, 07, 09, 14,
13, 10, 09, 11, 09, 08, 10, 07, 09, 09, 12, 08, 13, 13, 15, 16, 11, 09, 11, 10, 08, 09,

5-я сотня ------>
14, 11, 10, 10, 14, 06, 14, 15, 07, 15, 07, 08, 13, 09, 16, 08, 08, 10, 07, 08, 14, 08, 15, 11, 05, 05,
04, 04, 17, 15, 11, 09, 14, 11, 09, 15, 15, 06, 13, 25, 07, 14, 10, 13, 07, 09, 06, 13, 06, 15, 09, 15,
09, 06, 08, 21, 06, 19, 15, 20, 08, 11, 14, 04, 04, 11, 12, 13, 08, 08, 08, 05, 13, 08, 07, 11, 19, 05,
19, 09, 09, 10, 11, 11, 18, 15, 18, 12, 10, 05, 15, 08, 17, 15, 12, 14, 12, 16, 06, 12,

6-я сотня ------>
06, 07, 13, 06, 10, 15, 08, 05, 10, 12, 09, 13, 07, 15, 11, 13, 13, 06, 12, 03, 10, 09, 12, 06, 14, 08,
14, 07, 11, 10, 09, 12, 08, 09, 09, 14, 12, 05, 13, 06, 10, 26, 19, 12, 03, 14, 10, 18, 08, 06, 16, 12,
07, 06, 17, 12, 11, 08, 05, 11, 13, 15, 10, 11, 05, 06, 11, 10, 10, 08, 12, 06, 03, 09, 15, 16, 11, 08,
08, 13, 13, 05, 10, 15, 13, 05, 11, 11, 14, 04, 11, 09, 08, 07, 06, 24, 11, 11, 07, 05,


Сейчас ещё, приведу статистику, по каждому количеству - сколько карт выпало с 3-мя деревьямиЗнаний, с 4-мя, ... и т.д., до - сколько карт выпало с 27 ДЗ. (с 27,26,25,24 - выпало по одной карте, это по счастливой случайности оказались номера из 1...600 - вот такие -

314-я карта - 27 ДЗ,
542-я карта - 26 ДЗ,
440-я карта - 25 ДЗ,
596-я карта - 24 ДЗ,
нету карт - с 23 ДЗ - вообще ни одной не выпало,
089-я карта - 22 ДЗ,
118, 297, 342, 357, 456 - карты - с 21 ДЗ,
)..

Вот что по статистике получилось -

Количество карт (из 600) где выпало деревьев знаний ровно
---->


ДЗ= 0 --> количество карт = 0
ДЗ= 1 --> количество карт = 0
ДЗ= 2 --> количество карт = 0
ДЗ= 3 --> количество карт = 8
ДЗ= 4 --> количество карт = 8
ДЗ= 5 --> количество карт = 23
ДЗ= 6 --> количество карт = 40
ДЗ= 7 --> количество карт = 50
ДЗ= 8 --> количество карт = 64
ДЗ= 9 --> количество карт = 62
ДЗ= 10 --> количество карт = 53
ДЗ= 11 --> количество карт = 60
ДЗ= 12 --> количество карт = 42
ДЗ= 13 --> количество карт = 55
ДЗ= 14 --> количество карт = 32
ДЗ= 15 --> количество карт = 34
ДЗ= 16 --> количество карт = 20
ДЗ= 17 --> количество карт = 18
ДЗ= 18 --> количество карт = 8
ДЗ= 19 --> количество карт = 11
ДЗ= 20 --> количество карт = 2
ДЗ= 21 --> количество карт = 5
ДЗ= 22 --> количество карт = 1
ДЗ= 23 --> количество карт = 0
ДЗ= 24 --> количество карт = 1
ДЗ= 25 --> количество карт = 1
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
ДЗ= 28 --> количество карт = 0
...

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 12:16 
Аватара пользователя


11/12/16
13857
уездный город Н
Skipper в сообщении #1567404 писал(а):
Потому, хочу переспросить, действительно ли здесь распределение Пуассона ?


Как это проверить писал выше уважаемый DeBill
DeBill в сообщении #1567236 писал(а):
И тогда можно проверить эту гипотезу (о распределении по Пуассону) по критерию хи-квадрат.


Но вначале, скажите, а какое среднее количество ДЗ получилось на этой выборке из $600$ карт.

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 12:32 


24/03/09
573
Минск
EUgeneUS в сообщении #1567405 писал(а):
Но вначале, скажите, а какое среднее количество ДЗ получилось на этой выборке из $600$ карт.


Сумма всех деревьев Знаний на $600 $ картах - равна $6446$.
Разделим это число на $600 $ карт, тогда получим что в среднем (по среднему арифметическому) - на одной карте выпадает $10.743$ дереваЗнаний.
Вы это имели в виду?

Но, если бы было ровно $11$ - это видимо, не значит, что на вопрос - "с какой вероятностью следующая сгенерированная карта - будет иметь \geqslant $11$ деревьевЗнаний" - правильный ответ будет $50  $ %. Тут у меня есть предположения свои по этому поводу, сейчас обдумываю..

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 16:01 


24/03/09
573
Минск
Пытаюсь построить теорию, как можно аргументировать переход от более вероятных выпадений к менее вероятным, т.е. построить формулу, по которой можно считать вероятности выпадения карт с 22, и более ДЗ.

Разобьём все наши исходы, на изучаемые ПАРТИИ-СОТНИ, выпавших карт.
Для удобства и округления расчётов - немного подкорректируем статистику - будем одну карту из 600, считать выпавшей с 22-мя ДЗ там где выпало 21, например это 342-я карта. Для расчёта вероятностей это почти ничего не изменит, но лучше можно будет описать вероятности по партиям-сотням.

Тогда видим рекордные карты в каждой сотне -

1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний,
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний,
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний,
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний,
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний,
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний,

---

-1-) Назовём сотню-партию ПЛОХОЙ, если она входит в подмножество партий-сотен, таких что - они являются примерно худшей $1/3$ частью всех сотен, а точнее - имеют свою рекордную карту, с меньшим количеством ДЗ, чем у остальных $(1 - 1/e) = 0.632$ части множества вообще всех сотен.
(Откуда и почему берётся именно $(1 - 1/e)$ , поясню ниже.)
(если партия-сотня - не является плохой, то это ещё не значит, что она является хорошей. Просто так и можно сказать-
сотня или плохая, таких всего около $36.8$ % , или сотня "не являющаяся плохой" - таких всего
около $63.2$ % от всех сотен).
Так вот, мне очевидно, что если рассматриваем партии-сотни, т.е. подвыборки из $ N = 100$ карт, то число деревьевЗнаний, отделяющее ПЛОХУЮ партию-сотню от тех которые не являются плохими,
равно таким, которые (или большее их количество) - выпадают в среднем на $1/100$ части всех карт!
У нас, всего 600 карт, и лучшие 6 из них - имеют количество ДЗ =
--нижняя часть ->
ДЗ= 22 --> количество карт = 2
ДЗ= 23 --> количество карт = 0
ДЗ= 24 --> количество карт = 1
ДЗ= 25 --> количество карт = 1
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
ДЗ= 28 --> количество карт = 0
...
Значит число-разделитель $22$, т.е. - именно с $\geqslant22$ деревьямиЗнаний, у нас каждая карта генерируется с вероятностью $1/100$ .
Т.е. вероятность того что сгенерируется ненужная карта, равна $(1 - 1/100)$, а т.к. события не пересекаются, то вероятность того в таком случае, что и все $100 $ карт в партии не будут иметь $22$ или более ДЗ, будет
$(1 - 1/100)^{100}$ = $0.36...$ = $1/e$, а значит, вероятность что сотня-партия будет иметь карту с $22$ или более ДЗ, т.е. не будет ПЛОХОЙ, равна $1 - 1/e = 0.632$ .
->
Вывод - если у нас рассматриваемые партии-сотни с $N=100$ картами, то взяв количество дверейЗнаний
$\geqslant 22$, которые выпадают с вероятностью $1/N = 1/100$ , мы получим "разделитель" между плохими сотнями-партиями, и не являющимися плохими.
Плохих должно быть примерно $1/3$ часть, а остальные - $2/3$ - не являются плохими.
Посмотрим на реальную выборку -
->
1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний,
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний, --- ПЛОХАЯ СОТНЯ,
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний, --- ПЛОХАЯ СОТНЯ,
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний,
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний,
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний,
->
$2$ из $6$-ти сотен , т.е. $1/3$ часть примерно и оказались ПЛОХИМИ. Т.е. результат эксперимента согласуется с теорией.

---

-2-) Назовём сотню-партию УДАЧНОЙ, если она входит в подмножество партий-сотен, таких что - они являются примерно лучшей половиной всех сотен, а точнее - имеют свою рекордную карту, с большим количеством ДЗ, чем у остальной половины множества вообще всех сотен. Все остальные сотни-партии, назовём НЕУДАЧНЫМИ.
Найдём ,
число-разделитель $A$, такое что - именно с $\geqslant A$ деревьямиЗнаний, у нас каждая карта генерируется с вероятностью $1/B $ , такой что - половина сотен-партий, будут иметь карты с требуемыми $\geqslant A$ деревьямиЗнаний, а другая половина не будет иметь карт с таким количеством ДЗ.
Для этого проведём вычисления, аналогичные тем которые выше провели выше в пункте 1-м, формула изменится.
...
вероятность того в таком случае, что и все $100 $ карт в партии не будут иметь $A$ или более ДЗ, будет
$(1 - 1/B)^{100} = 0.5 $ ,
и по формуле находим $B$ , оно оказывается равным примерно $145$, а вероятность равна $1/145 = 0.0069$... Это вероятность, для поиска наших $A$. Всего было сгенерировано $600 $ карт, разделим на $145$, получим - одна из $4.1$, округлим до целого -
одна из $4$ лучших карт, содержит искомое количество $\geqslant  A $ наших ДЗ. А становится разделителем.
У нас, всего 600 карт, и лучшие 4 из них - имеют количество ДЗ =
--нижняя часть ->
ДЗ= 24 --> количество карт = 1
ДЗ= 25 --> количество карт = 1
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
...
Значит, во-первых нашли искомый разделитель $A = 24$ , и генерируя очередную партию-сотню карт, мы можем утверждать, что примерно с $50$ % вероятностью в сотне окажется карта с $\geqslant 24$ деревьямиЗнаний.
Теперь смотрим на реальную выборку -
->
1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний, - (НЕУДАЧНАЯ СОТНЯ)
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний, - (НЕУДАЧНАЯ СОТНЯ)
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний, - (НЕУДАЧНАЯ СОТНЯ)
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний, - УДАЧНАЯ СОТНЯ
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний, - УДАЧНАЯ СОТНЯ
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний, - УДАЧНАЯ СОТНЯ
->
Опять всё совпадает - ожидали половину удачных, половину неудачных, так и вышло 3 сотни удачные, 3 сотни неудачные, и наш разделитель это искомые карты с $A \geqslant 24$ деревьямиЗнаний для удачных и $A \leqslant  24$ деревьямиЗнаний для НЕудачных,

---

-3-) Назовём сотню-партию ХОРОШЕЙ, если она входит в подмножество партий-сотен, таких что - они являются примерно лучшей $1/3$ частью всех сотен, а точнее - имеют свою рекордную карту, с большим количеством ДЗ, чем у остальной $2/3$ части множества вообще всех сотен. Все остальные сотни-партии, назовём "не являющиеся хорошими". Это это не значит что они являются плохими, об этом выше 1-й пункт.
Найдём ,
число-разделитель $A$, такое что - именно с $\geqslant A$ деревьямиЗнаний, у нас каждая карта генерируется с вероятностью $1/C $ , такой что - треть сотен-партий, будут иметь карты с требуемыми $\geqslant A$ деревьямиЗнаний, а другие две трети не будут иметь карт с таким количеством ДЗ.
Для этого проведём вычисления, аналогичные тем которые выше провели выше в пункте 1-м, формула изменится.
...
вероятность того в таком случае, что и все $100 $ карт в партии не будут иметь $A$ или более ДЗ, будет
$(1 - 1/C)^{100} = 0.66  $ ,
и по формуле находим $C$ , оно оказывается равным примерно $241$, а вероятность равна $1/241 = 0.0041$... Это вероятность, для поиска наших $A$. Всего было сгенерировано $600 $ карт, разделим на $241$, получим - одна из $2.5$, округлим до целого -
одна из $2$ лучших карт (иначе нельзя, т.к. выборка недостаточно репрезентативная чтобы рассуждать о вероятностях с такими малыми количествами. если бы у нас было 6000 карт, тогда делили бы ровно на 2.5), содержит искомое количество $\geqslant  A $ наших ДЗ. $A$ становится разделителем.
У нас, всего 600 карт, и лучшие 2 (точнее для большей выборке 2.5) из них - имеют количество ДЗ =
--нижняя часть ->
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
...
Значит, во-первых нашли искомый разделитель $A = 26$ , и генерируя очередную партию-сотню карт, мы можем утверждать, что примерно с $1/3$ вероятностью в сотне окажется карта с $\geqslant 26$ деревьямиЗнаний.
Теперь смотрим на реальную выборку -
->
1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний, -
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний, -
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний, -
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний, - ХОРОШАЯ СОТНЯ,
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний, -
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний, - ХОРОШАЯ СОТНЯ,
->
Опять всё совпадает - ожидали $1/3$ ХОРОШИХ сотен-партий , так и вышло 2 сотни ХОРОШИЕ , одна треть наших всех, с $A \geqslant 26$ деревьямиЗнаний,

---

Вроде, всё без ошибок здесь посчитал? Эти расчёты необходимы для понимания, что происходит
при разбиение на партии. Я разбивал на сотни. Получил разделители ($22$, $24$, $26$. ).
проведя аналогичные расчёты с разбиением на мЕньшие партии, допустим, на 10-ки, 25-ки, 50-ки партий карт,
можно на той же выборке получить аналогичные свои разделители $A$,
для определения ПЛОХИХ, УДАЧНЫХ-НЕУДАЧНЫХ, и ХОРОШИХ партий карт.
Т.е. для сотен-партий, эти $A$ разделители, оказались равными соответственно,
$22$, $24$, $26$.

Увидев, какие будут для других партий, можно видимо построить функцию-зависимость, и экстраполировать, получить разделители $A$, для определения ПЛОХИХ, УДАЧНЫХ-НЕУДАЧНЫХ, и ХОРОШИХ других партий карт,
например, для партий-тысяч и т.д.

(вот, настолько сложной бывает матстатистика),
А как проще выяснить, какое тут распределение, пуассоновское или ещё какое-нибудь?

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 16:30 
Аватара пользователя


11/12/16
13857
уездный город Н
Skipper в сообщении #1567406 писал(а):
Разделим это число на $600 $ карт, тогда получим что в среднем (по среднему арифметическому) - на одной карте выпадает $10.743$ дереваЗнаний.
Вы это имели в виду?


Да, это. У меня было подозрение, что оценка матожидания ($11$) в предыдущей выборке (более короткой) была занижена, но на бОльшей выборке она скорректировалась наоборот в меньшую сторону.

Что касается всего остального, меня гложут смутные сомнения, что вместо изучения матстатистики, Вы изобретаете велосипед с квадратными колесами.

Skipper в сообщении #1567416 писал(а):
А как проще выяснить, какое тут распределение, пуассоновское или ещё какое-нибудь?

Вам же уже написали, а потому указали, где это написано - как проверить является ли распределение пуассоновским (с заданным параметром $\lambda$), или нет. Но Вы, почему-то, это настойчиво игнорируете.

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 16:38 


24/03/09
573
Минск
EUgeneUS ,
я пока не проверял по вашему параметру $\lambda$, это надо теорию пуассоновских распределений поднимать, что не так быстро.
(для вас может и быстро если вы с высшей математикой работаете регулярно, а я же редко..)
Да и похоже на то, что не пуассоновское (?), если вы посчитали и вышло - по пуассоновскому -
вероятность, что будет 23 или больше ДЗ - около 1/1000, но реально такие аж 4 карты выпали на множестве 600 карт,
причём одна из них оказалась и вовсе с 27 ДЗ.

К тому же, как я писал, оказалось скорее всего, и то что получить карту с 2 ДЗ, менее вероятно, чем не то что с 23 и больше, а возможно даже менее вероятно, чем с 27 и больше.
Я уже получил на множестве 600 карт, одну с 27 ДЗ, а с 2 ДЗ нету по прежнему ни одной, значит делаю вывод, что в меньшую сторону вероятности падают скорее всего - быстрее, при уменьшении количества ДЗ на единицу. (чем при увеличении на единицу от 23 ДЗ. (да и от 27 ДЗ)), как то так примерно -

Изображение

Оно кажется логичным, потому что если генератор пихает объекты на карту, где всего их $N$, и это $N$ большое число, вероятности падают при уменьшении на единицу - быстрее, т.к. от 3, до 0, так сказать "короткая дистанция", а от 27, возможен рост, с большой дистанцией, там 27 не так сильно отличается от 28, и т.д. 40 не так сильно отличается от 41, ... Ну это так, чисто интуитивно, а аргументировать я пока это не могу,

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 17:16 
Аватара пользователя


11/12/16
13857
уездный город Н
Skipper в сообщении #1567419 писал(а):
я пока не проверял по вашему параметру $\lambda$, это надо теорию пуассоновских распределений поднимать, что не так быстро.


Тут "поднимать надо" не "теорию пуассоновских распределений", а метод $\chi^2$

Формально порядок действий должен быть такой:
1. Выдвигаем (нулевую) гипотезу, о том, что распределение имеет какой-то определенный вид.
2. Определяем параметры распределения
2а) В общем виде, пользуемся, например, Методом максимального правдоподобия
2б) Для Пуассоновского чуть проще - это однопараметрическое распределение, где параметр - это мат. ожидание. Которое можно оценить как среднее по выборке.
3. Применяем метод $\chi^2$, чтобы отвергнуть или не отвергнуть нулевую гипотезу.

Если не формально, методом "пристального вглядывания в гистограммы", то да. Пуассон (и биномиальное распределение) как-то не очень подходит. Больше на данные эксперимента ложится отрицательное биномиальное распределение с параметрами где-то около $p=0.6; q=1-p=0.4; r=16$

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 17:22 


24/03/09
573
Минск
EUgeneUS в сообщении #1567422 писал(а):
Если не формально, методом "пристального вглядывания в гистограммы", то да. Пуассон (и биномиальное распределение) как-то не очень подходит. Больше на данные эксперимента ложится отрицательное биномиальное распределение
с параметрами где-то около $p=0.6; q=1-p=0.4; r=16$


Спасибо, буду разбираться, когда в ВУЗе учили ТВ, уже не помню про "отрицательное биномиальное распределение",
Если покажете, что у вас получилось по гистограммам (например какие возможные вероятности для 30 и более ДЗ), буду очень благодарен,

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 20 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Rex2024


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group