2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Как посчитать вероятности выпадения количества событий
Сообщение19.10.2022, 22:32 


24/03/09
573
Минск
Я сгенерировал 105 разных карт для компьютерной игры, цель - найти такую рандомную карту, чтобы побольше ДеревьевЗнаний было.
Подвёл статистику, в среднем вроде, около $11$ ДеревьевЗнаний выпадает. Минимум была карта где выпало только $3$ дереваЗнаний, а максимум вышла одна карта с $22$ древамиЗнаний.

Вот полная выборка по 105 сгенерированным картам.

15 ; 13 ; 11 ; 10; 05; 11; 06; 09; 16; 11; 08; 12; 10; 19; 12; 09; 04; 10; 13; 12; 10; 07; 16; 13; 09; 19;11;11; 14; 12; 15; 13; 20; 10; 10; 07; 13; 08; 16; 12; 14; 09; 12; 16; 11; 13; 11; 10; 18; 06; 05; 09; 07; 17; 14; 19; 08; 03 ; 07; 17; 13; 13; 07; 09; 06; 13; 07; 18; 09; 09; 19; 09; 11; 06; 07; 06; 13; 12; 09; 11; 12; 05; 06; 13; 08; 11; 10; 08; 22 ; 08; 08; 08; 09; 17; 06; 09; 13; 11; 08; 08; 03; 13; 13; 05; 04,

Вопрос - как посчитать вероятности.
Сколько надо нагенерить карт, чтобы с большой вероятностю, скажем $50$ процентов, встретилась хотя бы одна такая карта, с количеством древЗнаний -

1) более или равное $26$-ти ?
2) более или равное $30$-ти ?

Всего объектов на карте много, более $10 $тысяч, и я так понял, сильно на вероятности влияет их точное количество для "вырожденных" случаев, например если нам нужно посчитать вероятности что вообще не выпадет ни одного древаЗнаний. А для больших чисел, типа $26$, $30$, это общее количество объектов на карте, не должно особо влиять на вероятности.

функция - для нас чёрный ящик , но принцип как он работает, понятен . Генератор карт пихает разные объекты на карту. Некоторые из них - становятся ДеревьямиЗнаний. Поскольку в среднем на карте выходит (среднее арифметическое) - 11 деревьевЗнаний, а также видим выборку (минимум $3$, максимум $22$, из $105$-ти карт) значит можно как то посчитать и вероятность что выпадет $26$ или больше, $30$ или больше и т.д.,

эвристически (по мат.статистике) - то что выпадает $22$ или более деревьевЗнаний, в районе $1/100$, так как одна такая карта и выпала из чуть более сотни сгенерированных. Но сколько нужно, чтобы найти с $26$-ю или более, с $30$-ю или более и т.д. ?

Мне в первую очередь, нужно $26$ или больше. Если для этого достаточно среднестатистически нагенерить ещё допустим, $300$ карт, то я бы сделал . но если там нужно $1000$, или $10$ тысяч, и т.п. то смысла нет - слишком много времени на анализ будет. Вот так иногда в практических целях теорвер знать надо. :)

Могут быть возражения типа >> "Ну надо знать сколько всего объектов на карте и сколько типов объектов"
>>

в том то и дело, я думаю , что скорее всего не нужно, и математик решит эту задачу, и с неизвестным точно числом всех объектов (если их достаточно большое количество, скажем более 10 тысяч). Дело в том, что скорее всего, при их достаточном большом количестве, и устремлении этого количества к бесконечности, вероятности выпадения $26$ или более, $30$ или более ДревЗнаний, и т.д. - будет асимптотически стремиться к какой то одной вероятности.

Надеюсь, понятно описал.
Спасибо, если кто подскажет,

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение20.10.2022, 06:27 
Аватара пользователя


22/07/22

897
Я думаю, тут нормальное распределение. Посчитайте среднее (11) и дисперсию. Потом если увеличить выборку в энное число раз, получим снова нормальное распределение с другим (вычисленным) матожиданием и дисперсией. И надо такое найти такое эн, чтобы ваш запрос по деревьям вписывался в столько-то сигм.

-- 20.10.2022, 06:28 --

Skipper в сообщении #1567164 писал(а):
Дело в том, что скорее всего, при их достаточном большом количестве, и устремлении этого количества к бесконечности, вероятности выпадения $26$ или более, $30$ или более ДревЗнаний, и т.д. - будет асимптотически стремиться к какой то одной вероятности.

Да, к единице :mrgreen:

-- 20.10.2022, 06:42 --

Построил вручную гистаграмку по вашим данным, распределение вроде похоже на нормальное (правда есть предпочтения меньших значений, чем симметричных больших), и ни разу не выпало $21$ дерево :-)

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение20.10.2022, 22:46 
Заслуженный участник


10/01/16
2318
Skipper
Ну, это, скорее всего, Пуассоновское распределение (оно - для редких событий, а, судя по Вашему тексту, появление ДЗ среди тысяч объектов - редкое) , с параметром 11.
Ну вот засем нам прямо полная выборка то? Надо бы ее сгруппировать: сколько раз - сколько ДЗ. И тогда можно проверить эту гипотезу (о распределении по Пуассону) по критерию хи-квадрат. И если данные согласуются с гипотезой - то можно и Ваши вероятности посчитать (я прикинул: для не более трех ДЗ ожидаемое кол-во из 105 экспериментов чуть меньше половины...)

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 05:18 
Аватара пользователя


22/07/22

897
DeBill в сообщении #1567236 писал(а):
Пуассоновское распределение

Да, я че-то его сразу приблизил нормальным из-за большого лямбда, а потом удивляюсь смещению влево :mrgreen: Правда все сказанное выше остается в силе

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 14:18 


24/03/09
573
Минск
Правильно ли я понимаю, что если распределение Пуассоновское, то вот, глядя на предельные значения - от 3 до 22-х, вероятность найти с 2-мя деревьямиЗнаний карту - менее вероятно, чем с 23-мя ?

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 14:42 
Аватара пользователя


22/07/22

897
Skipper
Наоборот

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение21.10.2022, 15:04 
Аватара пользователя


11/12/16
13854
уездный город Н
Skipper
Если это распределение Пуассона с $\lambda = 11$, то получить значения вероятностей можно в любом мат. или стат. пакете. Да, хотя бы в Excel.

Вероятность, что будет ровно 2 ДЗ: $P_2 \approx 0.00101$
Вероятность, что будет 2 или менее ДЗ: $P_{\le 2} \approx 0.00121$
Вероятность, что будет ровно 23 ДЗ: $P_{23} \approx 0.000578$
Вероятность, что будет 23 или больше ДЗ: $P_{\ge 23} \approx 0.00104$

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 11:34 


24/03/09
573
Минск
Doctor Boom в сообщении #1567270 писал(а):
Skipper
Наоборот


EUgeneUS в сообщении #1567271 писал(а):
Skipper
Если это распределение Пуассона с $\lambda = 11$, то получить значения вероятностей можно в любом мат. или стат. пакете. Да, хотя бы в Excel.

Вероятность, что будет ровно 2 ДЗ: $P_2 \approx 0.00101$
Вероятность, что будет 2 или менее ДЗ: $P_{\le 2} \approx 0.00121$
Вероятность, что будет ровно 23 ДЗ: $P_{23} \approx 0.000578$
Вероятность, что будет 23 или больше ДЗ: $P_{\ge 23} \approx 0.00104$


Вот что то и не совпадает. Я сгенерировал теперь 600 карт и их проанализировал, вышло так что до сих пор не выпало ни одной карты с 2 или менее деревьямиЗнаний, ну допустим, так и могло быть, если вероятность как вы написали, чуть более 1/900, но вот с 23 или больше деревьямиЗнаний - вероятность похоже, явно выше. Из тех 600 карт, выпали и с 24 ДЗ, и с 25 ДЗ, и с 26 ДЗ, и одна с 27 ДЗ - это рекорд на множестве из 600 карт.

Значит, в сторону увеличения возможного количества ДЗ, вероятность явно не так быстро падает, как в сторону уменьшения. Т.е. я хочу сказать, что похоже на то, что даже если принять вероятности с "2 ДЗ или менее", такой же как и с "27 ДЗ или больше", то на следующем этапе окажется,
что вероятность карты с $M \leqslant 1$ ДЗ, будет также меньше, чем вероятность выпадения карты с $M \geqslant 28$ ДЗ.

Потому, хочу переспросить, действительно ли здесь распределение Пуассона ?

На всякий случай, привожу данные по 600 картам, разбитые на подмножества - 1-я сотня, 2-я сотня, ... 6-я сотня -

(Оффтоп)

1-я сотня ------>
15, 13, 11, 10, 05, 11, 06, 09, 16 , 11, 08, 12, 10, 19, 12, 09, 04, 10, 13, 12, 10, 07, 16, 13, 09, 19, 11,
11, 14, 12, 15, 13, 20, 10, 10, 07, 13, 08, 16, 12, 14, 09, 12, 16, 11, 13, 11, 10, 18, 06, 05, 09, 07, 17,
14, 19, 08, 03, 07, 17, 13, 13, 07, 09, 06, 13, 07, 18, 09, 09, 19, 09, 11, 06, 07, 06, 13, 12, 09, 11, 12,
05, 06, 13, 08, 11, 10, 08, 22, 08, 08, 08, 09, 17, 06, 09, 13, 11, 08, 08,


2-я сотня ------>
03, 13, 13, 05, 04, 07, 12, 09, 03, 14, 08, 07, 11, 14, 19, 09, 13, 21, 08, 10, 08, 15, 06, 07, 12, 07, 09,
09, 16, 11, 18, 08, 14, 11, 05, 08, 07, 08, 18, 13, 13, 09, 15, 12, 08, 11, 17, 14, 13, 07, 08, 06, 13, 15,
14, 08, 10, 07, 13, 11, 13, 05, 09, 11, 07, 17, 07, 12, 16, 17, 06, 08, 11, 18, 10, 10, 06, 17, 12, 14, 13,
14, 17, 07, 05, 17, 16, 05, 09, 12, 13, 12, 13, 10, 15, 16, 14, 06, 09, 13,

3-я сотня ------>
10, 10, 10, 07, 11, 11, 10, 08, 10, 08, 11, 10, 13, 06, 07, 15, 10, 13, 06, 09, 06, 07, 10, 07, 12, 13, 09,
10, 05, 12, 09, 17, 13, 08, 09, 08, 06 , 16, 07, 15, 16, 08, 07, 13, 11, 15, 12, 06, 11, 08, 11, 07, 08,
12, 08, 13, 07, 12, 11, 09, 06, 17, 06, 14, 11, 07, 10, 14, 13, 13, 06, 09, 10, 08, 09, 06, 08, 15, 14,
14, 07, 15, 17, 12, 11, 13, 13, 08, 08, 12, 04, 05, 10, 15, 08, 10, 21, 09, 10, 07,

4-я сотня ------>
15, 06, 13, 07, 12, 08, 11, 10, 13, 14, 16, 07, 19, 27, 10 , 16, 17, 12, 08, 05, 08, 19, 17, 15, 08, 09,
06, 16, 07, 17, 10, 09, 07, 09, 10, 11, 11, 16, 11, 03, 12, 21, 09, 14, 12, 09, 07, 03, 12, 10, 09, 09,
09, 07, 08, 08, 21, 11, 07, 15, 11, 07, 09, 11, 09, 08, 09, 14, 11, 10, 16, 09, 11, 10, 15, 07, 09, 14,
13, 10, 09, 11, 09, 08, 10, 07, 09, 09, 12, 08, 13, 13, 15, 16, 11, 09, 11, 10, 08, 09,

5-я сотня ------>
14, 11, 10, 10, 14, 06, 14, 15, 07, 15, 07, 08, 13, 09, 16, 08, 08, 10, 07, 08, 14, 08, 15, 11, 05, 05,
04, 04, 17, 15, 11, 09, 14, 11, 09, 15, 15, 06, 13, 25, 07, 14, 10, 13, 07, 09, 06, 13, 06, 15, 09, 15,
09, 06, 08, 21, 06, 19, 15, 20, 08, 11, 14, 04, 04, 11, 12, 13, 08, 08, 08, 05, 13, 08, 07, 11, 19, 05,
19, 09, 09, 10, 11, 11, 18, 15, 18, 12, 10, 05, 15, 08, 17, 15, 12, 14, 12, 16, 06, 12,

6-я сотня ------>
06, 07, 13, 06, 10, 15, 08, 05, 10, 12, 09, 13, 07, 15, 11, 13, 13, 06, 12, 03, 10, 09, 12, 06, 14, 08,
14, 07, 11, 10, 09, 12, 08, 09, 09, 14, 12, 05, 13, 06, 10, 26, 19, 12, 03, 14, 10, 18, 08, 06, 16, 12,
07, 06, 17, 12, 11, 08, 05, 11, 13, 15, 10, 11, 05, 06, 11, 10, 10, 08, 12, 06, 03, 09, 15, 16, 11, 08,
08, 13, 13, 05, 10, 15, 13, 05, 11, 11, 14, 04, 11, 09, 08, 07, 06, 24, 11, 11, 07, 05,


Сейчас ещё, приведу статистику, по каждому количеству - сколько карт выпало с 3-мя деревьямиЗнаний, с 4-мя, ... и т.д., до - сколько карт выпало с 27 ДЗ. (с 27,26,25,24 - выпало по одной карте, это по счастливой случайности оказались номера из 1...600 - вот такие -

314-я карта - 27 ДЗ,
542-я карта - 26 ДЗ,
440-я карта - 25 ДЗ,
596-я карта - 24 ДЗ,
нету карт - с 23 ДЗ - вообще ни одной не выпало,
089-я карта - 22 ДЗ,
118, 297, 342, 357, 456 - карты - с 21 ДЗ,
)..

Вот что по статистике получилось -

Количество карт (из 600) где выпало деревьев знаний ровно
---->


ДЗ= 0 --> количество карт = 0
ДЗ= 1 --> количество карт = 0
ДЗ= 2 --> количество карт = 0
ДЗ= 3 --> количество карт = 8
ДЗ= 4 --> количество карт = 8
ДЗ= 5 --> количество карт = 23
ДЗ= 6 --> количество карт = 40
ДЗ= 7 --> количество карт = 50
ДЗ= 8 --> количество карт = 64
ДЗ= 9 --> количество карт = 62
ДЗ= 10 --> количество карт = 53
ДЗ= 11 --> количество карт = 60
ДЗ= 12 --> количество карт = 42
ДЗ= 13 --> количество карт = 55
ДЗ= 14 --> количество карт = 32
ДЗ= 15 --> количество карт = 34
ДЗ= 16 --> количество карт = 20
ДЗ= 17 --> количество карт = 18
ДЗ= 18 --> количество карт = 8
ДЗ= 19 --> количество карт = 11
ДЗ= 20 --> количество карт = 2
ДЗ= 21 --> количество карт = 5
ДЗ= 22 --> количество карт = 1
ДЗ= 23 --> количество карт = 0
ДЗ= 24 --> количество карт = 1
ДЗ= 25 --> количество карт = 1
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
ДЗ= 28 --> количество карт = 0
...

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 12:16 
Аватара пользователя


11/12/16
13854
уездный город Н
Skipper в сообщении #1567404 писал(а):
Потому, хочу переспросить, действительно ли здесь распределение Пуассона ?


Как это проверить писал выше уважаемый DeBill
DeBill в сообщении #1567236 писал(а):
И тогда можно проверить эту гипотезу (о распределении по Пуассону) по критерию хи-квадрат.


Но вначале, скажите, а какое среднее количество ДЗ получилось на этой выборке из $600$ карт.

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 12:32 


24/03/09
573
Минск
EUgeneUS в сообщении #1567405 писал(а):
Но вначале, скажите, а какое среднее количество ДЗ получилось на этой выборке из $600$ карт.


Сумма всех деревьев Знаний на $600 $ картах - равна $6446$.
Разделим это число на $600 $ карт, тогда получим что в среднем (по среднему арифметическому) - на одной карте выпадает $10.743$ дереваЗнаний.
Вы это имели в виду?

Но, если бы было ровно $11$ - это видимо, не значит, что на вопрос - "с какой вероятностью следующая сгенерированная карта - будет иметь \geqslant $11$ деревьевЗнаний" - правильный ответ будет $50  $ %. Тут у меня есть предположения свои по этому поводу, сейчас обдумываю..

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 16:01 


24/03/09
573
Минск
Пытаюсь построить теорию, как можно аргументировать переход от более вероятных выпадений к менее вероятным, т.е. построить формулу, по которой можно считать вероятности выпадения карт с 22, и более ДЗ.

Разобьём все наши исходы, на изучаемые ПАРТИИ-СОТНИ, выпавших карт.
Для удобства и округления расчётов - немного подкорректируем статистику - будем одну карту из 600, считать выпавшей с 22-мя ДЗ там где выпало 21, например это 342-я карта. Для расчёта вероятностей это почти ничего не изменит, но лучше можно будет описать вероятности по партиям-сотням.

Тогда видим рекордные карты в каждой сотне -

1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний,
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний,
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний,
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний,
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний,
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний,

---

-1-) Назовём сотню-партию ПЛОХОЙ, если она входит в подмножество партий-сотен, таких что - они являются примерно худшей $1/3$ частью всех сотен, а точнее - имеют свою рекордную карту, с меньшим количеством ДЗ, чем у остальных $(1 - 1/e) = 0.632$ части множества вообще всех сотен.
(Откуда и почему берётся именно $(1 - 1/e)$ , поясню ниже.)
(если партия-сотня - не является плохой, то это ещё не значит, что она является хорошей. Просто так и можно сказать-
сотня или плохая, таких всего около $36.8$ % , или сотня "не являющаяся плохой" - таких всего
около $63.2$ % от всех сотен).
Так вот, мне очевидно, что если рассматриваем партии-сотни, т.е. подвыборки из $ N = 100$ карт, то число деревьевЗнаний, отделяющее ПЛОХУЮ партию-сотню от тех которые не являются плохими,
равно таким, которые (или большее их количество) - выпадают в среднем на $1/100$ части всех карт!
У нас, всего 600 карт, и лучшие 6 из них - имеют количество ДЗ =
--нижняя часть ->
ДЗ= 22 --> количество карт = 2
ДЗ= 23 --> количество карт = 0
ДЗ= 24 --> количество карт = 1
ДЗ= 25 --> количество карт = 1
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
ДЗ= 28 --> количество карт = 0
...
Значит число-разделитель $22$, т.е. - именно с $\geqslant22$ деревьямиЗнаний, у нас каждая карта генерируется с вероятностью $1/100$ .
Т.е. вероятность того что сгенерируется ненужная карта, равна $(1 - 1/100)$, а т.к. события не пересекаются, то вероятность того в таком случае, что и все $100 $ карт в партии не будут иметь $22$ или более ДЗ, будет
$(1 - 1/100)^{100}$ = $0.36...$ = $1/e$, а значит, вероятность что сотня-партия будет иметь карту с $22$ или более ДЗ, т.е. не будет ПЛОХОЙ, равна $1 - 1/e = 0.632$ .
->
Вывод - если у нас рассматриваемые партии-сотни с $N=100$ картами, то взяв количество дверейЗнаний
$\geqslant 22$, которые выпадают с вероятностью $1/N = 1/100$ , мы получим "разделитель" между плохими сотнями-партиями, и не являющимися плохими.
Плохих должно быть примерно $1/3$ часть, а остальные - $2/3$ - не являются плохими.
Посмотрим на реальную выборку -
->
1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний,
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний, --- ПЛОХАЯ СОТНЯ,
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний, --- ПЛОХАЯ СОТНЯ,
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний,
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний,
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний,
->
$2$ из $6$-ти сотен , т.е. $1/3$ часть примерно и оказались ПЛОХИМИ. Т.е. результат эксперимента согласуется с теорией.

---

-2-) Назовём сотню-партию УДАЧНОЙ, если она входит в подмножество партий-сотен, таких что - они являются примерно лучшей половиной всех сотен, а точнее - имеют свою рекордную карту, с большим количеством ДЗ, чем у остальной половины множества вообще всех сотен. Все остальные сотни-партии, назовём НЕУДАЧНЫМИ.
Найдём ,
число-разделитель $A$, такое что - именно с $\geqslant A$ деревьямиЗнаний, у нас каждая карта генерируется с вероятностью $1/B $ , такой что - половина сотен-партий, будут иметь карты с требуемыми $\geqslant A$ деревьямиЗнаний, а другая половина не будет иметь карт с таким количеством ДЗ.
Для этого проведём вычисления, аналогичные тем которые выше провели выше в пункте 1-м, формула изменится.
...
вероятность того в таком случае, что и все $100 $ карт в партии не будут иметь $A$ или более ДЗ, будет
$(1 - 1/B)^{100} = 0.5 $ ,
и по формуле находим $B$ , оно оказывается равным примерно $145$, а вероятность равна $1/145 = 0.0069$... Это вероятность, для поиска наших $A$. Всего было сгенерировано $600 $ карт, разделим на $145$, получим - одна из $4.1$, округлим до целого -
одна из $4$ лучших карт, содержит искомое количество $\geqslant  A $ наших ДЗ. А становится разделителем.
У нас, всего 600 карт, и лучшие 4 из них - имеют количество ДЗ =
--нижняя часть ->
ДЗ= 24 --> количество карт = 1
ДЗ= 25 --> количество карт = 1
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
...
Значит, во-первых нашли искомый разделитель $A = 24$ , и генерируя очередную партию-сотню карт, мы можем утверждать, что примерно с $50$ % вероятностью в сотне окажется карта с $\geqslant 24$ деревьямиЗнаний.
Теперь смотрим на реальную выборку -
->
1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний, - (НЕУДАЧНАЯ СОТНЯ)
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний, - (НЕУДАЧНАЯ СОТНЯ)
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний, - (НЕУДАЧНАЯ СОТНЯ)
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний, - УДАЧНАЯ СОТНЯ
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний, - УДАЧНАЯ СОТНЯ
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний, - УДАЧНАЯ СОТНЯ
->
Опять всё совпадает - ожидали половину удачных, половину неудачных, так и вышло 3 сотни удачные, 3 сотни неудачные, и наш разделитель это искомые карты с $A \geqslant 24$ деревьямиЗнаний для удачных и $A \leqslant  24$ деревьямиЗнаний для НЕудачных,

---

-3-) Назовём сотню-партию ХОРОШЕЙ, если она входит в подмножество партий-сотен, таких что - они являются примерно лучшей $1/3$ частью всех сотен, а точнее - имеют свою рекордную карту, с большим количеством ДЗ, чем у остальной $2/3$ части множества вообще всех сотен. Все остальные сотни-партии, назовём "не являющиеся хорошими". Это это не значит что они являются плохими, об этом выше 1-й пункт.
Найдём ,
число-разделитель $A$, такое что - именно с $\geqslant A$ деревьямиЗнаний, у нас каждая карта генерируется с вероятностью $1/C $ , такой что - треть сотен-партий, будут иметь карты с требуемыми $\geqslant A$ деревьямиЗнаний, а другие две трети не будут иметь карт с таким количеством ДЗ.
Для этого проведём вычисления, аналогичные тем которые выше провели выше в пункте 1-м, формула изменится.
...
вероятность того в таком случае, что и все $100 $ карт в партии не будут иметь $A$ или более ДЗ, будет
$(1 - 1/C)^{100} = 0.66  $ ,
и по формуле находим $C$ , оно оказывается равным примерно $241$, а вероятность равна $1/241 = 0.0041$... Это вероятность, для поиска наших $A$. Всего было сгенерировано $600 $ карт, разделим на $241$, получим - одна из $2.5$, округлим до целого -
одна из $2$ лучших карт (иначе нельзя, т.к. выборка недостаточно репрезентативная чтобы рассуждать о вероятностях с такими малыми количествами. если бы у нас было 6000 карт, тогда делили бы ровно на 2.5), содержит искомое количество $\geqslant  A $ наших ДЗ. $A$ становится разделителем.
У нас, всего 600 карт, и лучшие 2 (точнее для большей выборке 2.5) из них - имеют количество ДЗ =
--нижняя часть ->
ДЗ= 26 --> количество карт = 1
ДЗ= 27 --> количество карт = 1
...
Значит, во-первых нашли искомый разделитель $A = 26$ , и генерируя очередную партию-сотню карт, мы можем утверждать, что примерно с $1/3$ вероятностью в сотне окажется карта с $\geqslant 26$ деревьямиЗнаний.
Теперь смотрим на реальную выборку -
->
1) в 1-й сотне карт - рекордная с 22 деревьямиЗнаний, -
2) в 2-й сотне карт - рекордная с 21 деревьямиЗнаний, -
3) в 3-й сотне карт - рекордная с 21 деревьямиЗнаний, -
4) в 4-й сотне карт - рекордная с 27 деревьямиЗнаний, - ХОРОШАЯ СОТНЯ,
5) в 5-й сотне карт - рекордная с 25 деревьямиЗнаний, -
6) в 6-й сотне карт - рекордная с 26 деревьямиЗнаний, - ХОРОШАЯ СОТНЯ,
->
Опять всё совпадает - ожидали $1/3$ ХОРОШИХ сотен-партий , так и вышло 2 сотни ХОРОШИЕ , одна треть наших всех, с $A \geqslant 26$ деревьямиЗнаний,

---

Вроде, всё без ошибок здесь посчитал? Эти расчёты необходимы для понимания, что происходит
при разбиение на партии. Я разбивал на сотни. Получил разделители ($22$, $24$, $26$. ).
проведя аналогичные расчёты с разбиением на мЕньшие партии, допустим, на 10-ки, 25-ки, 50-ки партий карт,
можно на той же выборке получить аналогичные свои разделители $A$,
для определения ПЛОХИХ, УДАЧНЫХ-НЕУДАЧНЫХ, и ХОРОШИХ партий карт.
Т.е. для сотен-партий, эти $A$ разделители, оказались равными соответственно,
$22$, $24$, $26$.

Увидев, какие будут для других партий, можно видимо построить функцию-зависимость, и экстраполировать, получить разделители $A$, для определения ПЛОХИХ, УДАЧНЫХ-НЕУДАЧНЫХ, и ХОРОШИХ других партий карт,
например, для партий-тысяч и т.д.

(вот, настолько сложной бывает матстатистика),
А как проще выяснить, какое тут распределение, пуассоновское или ещё какое-нибудь?

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 16:30 
Аватара пользователя


11/12/16
13854
уездный город Н
Skipper в сообщении #1567406 писал(а):
Разделим это число на $600 $ карт, тогда получим что в среднем (по среднему арифметическому) - на одной карте выпадает $10.743$ дереваЗнаний.
Вы это имели в виду?


Да, это. У меня было подозрение, что оценка матожидания ($11$) в предыдущей выборке (более короткой) была занижена, но на бОльшей выборке она скорректировалась наоборот в меньшую сторону.

Что касается всего остального, меня гложут смутные сомнения, что вместо изучения матстатистики, Вы изобретаете велосипед с квадратными колесами.

Skipper в сообщении #1567416 писал(а):
А как проще выяснить, какое тут распределение, пуассоновское или ещё какое-нибудь?

Вам же уже написали, а потому указали, где это написано - как проверить является ли распределение пуассоновским (с заданным параметром $\lambda$), или нет. Но Вы, почему-то, это настойчиво игнорируете.

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 16:38 


24/03/09
573
Минск
EUgeneUS ,
я пока не проверял по вашему параметру $\lambda$, это надо теорию пуассоновских распределений поднимать, что не так быстро.
(для вас может и быстро если вы с высшей математикой работаете регулярно, а я же редко..)
Да и похоже на то, что не пуассоновское (?), если вы посчитали и вышло - по пуассоновскому -
вероятность, что будет 23 или больше ДЗ - около 1/1000, но реально такие аж 4 карты выпали на множестве 600 карт,
причём одна из них оказалась и вовсе с 27 ДЗ.

К тому же, как я писал, оказалось скорее всего, и то что получить карту с 2 ДЗ, менее вероятно, чем не то что с 23 и больше, а возможно даже менее вероятно, чем с 27 и больше.
Я уже получил на множестве 600 карт, одну с 27 ДЗ, а с 2 ДЗ нету по прежнему ни одной, значит делаю вывод, что в меньшую сторону вероятности падают скорее всего - быстрее, при уменьшении количества ДЗ на единицу. (чем при увеличении на единицу от 23 ДЗ. (да и от 27 ДЗ)), как то так примерно -

Изображение

Оно кажется логичным, потому что если генератор пихает объекты на карту, где всего их $N$, и это $N$ большое число, вероятности падают при уменьшении на единицу - быстрее, т.к. от 3, до 0, так сказать "короткая дистанция", а от 27, возможен рост, с большой дистанцией, там 27 не так сильно отличается от 28, и т.д. 40 не так сильно отличается от 41, ... Ну это так, чисто интуитивно, а аргументировать я пока это не могу,

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 17:16 
Аватара пользователя


11/12/16
13854
уездный город Н
Skipper в сообщении #1567419 писал(а):
я пока не проверял по вашему параметру $\lambda$, это надо теорию пуассоновских распределений поднимать, что не так быстро.


Тут "поднимать надо" не "теорию пуассоновских распределений", а метод $\chi^2$

Формально порядок действий должен быть такой:
1. Выдвигаем (нулевую) гипотезу, о том, что распределение имеет какой-то определенный вид.
2. Определяем параметры распределения
2а) В общем виде, пользуемся, например, Методом максимального правдоподобия
2б) Для Пуассоновского чуть проще - это однопараметрическое распределение, где параметр - это мат. ожидание. Которое можно оценить как среднее по выборке.
3. Применяем метод $\chi^2$, чтобы отвергнуть или не отвергнуть нулевую гипотезу.

Если не формально, методом "пристального вглядывания в гистограммы", то да. Пуассон (и биномиальное распределение) как-то не очень подходит. Больше на данные эксперимента ложится отрицательное биномиальное распределение с параметрами где-то около $p=0.6; q=1-p=0.4; r=16$

 Профиль  
                  
 
 Re: Как посчитать вероятности выпадения количества событий
Сообщение23.10.2022, 17:22 


24/03/09
573
Минск
EUgeneUS в сообщении #1567422 писал(а):
Если не формально, методом "пристального вглядывания в гистограммы", то да. Пуассон (и биномиальное распределение) как-то не очень подходит. Больше на данные эксперимента ложится отрицательное биномиальное распределение
с параметрами где-то около $p=0.6; q=1-p=0.4; r=16$


Спасибо, буду разбираться, когда в ВУЗе учили ТВ, уже не помню про "отрицательное биномиальное распределение",
Если покажете, что у вас получилось по гистограммам (например какие возможные вероятности для 30 и более ДЗ), буду очень благодарен,

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 20 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group