2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Оценка погрешности для вероятности события
Сообщение17.01.2019, 17:43 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Добрый день.

Прошу прощения за идиотический и простой вопрос, но у меня немного шарики за ролики зашли. :oops:
У меня имеется набор из $N$ симуляций, которые могут закончиться различными способами. В результате каждого из измерений может получиться некоторый результат. Соответственно, я могу вычислить вероятность каждого $i$-го исхода как $p_i = \frac{n_i}{N}$, где $n_i$ число измерений, закончившихся $i$-м исходом.
А могу ли я как-нибудь разумным способом вычислить погрешность (например, стандартное отклонение) к этому числу $p_i$, чтобы получить оценку $p_i_{-\sigma_-}^{+\sigma_+}$?

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение17.01.2019, 18:40 


11/07/16
825
Нахождение интервальных оценок вероятностей полиномиального распределения изложено, например, в книге Г. Ивченко, Ю. Медведев, Введение в математическую статистику:Учебник. М.: Издательство ЛКИ, 2010.-600 С., Пример 18 на с. 238-239.

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение17.01.2019, 21:37 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Markiyan Hirnyk, спасибо большое. Правда, я с полиномиальными распределениями за всю жизнь (к своему стыду) не сталкивался, поэтому пока что буксую.

А такой вопрос: если я сделаю "макросерию" из серий независимых $N$ симуляций, а потом среднее посчитаю как среднее вероятностей исходов в этих "макросериях" симуляций, и аналогично обойдусь со стандартным отклонением, это будет корректная оценка, или нет?

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение17.01.2019, 22:05 


11/07/16
825
Цитата:
Правда, я с полиномиальными распределениями за всю жизнь (к своему стыду) не сталкивался, поэтому пока что буксую

Проконсультируйтесь со специалистами.
Цитата:
А такой вопрос: если я сделаю "макросерию" из серий независимых $N$ симуляций, а потом среднее посчитаю как среднее вероятностей исходов в этих "макросериях" симуляций, и аналогично обойдусь со стандартным отклонением, это будет корректная оценка, или нет?

Не понял, поэтому не могу ответить. "Среднее" каких величин имеете в виду? Что такое "симуляция"? Пожалуйста, изъясняйтесь точно и четко. Извините, по моему местному времени уже поздний вечер.

PS. Если я Вас правильно понял и если точечные оценки вероятностей распределены асимптотически нормально (в данный момент это выяснять не стану), то так поступать можно. Однако это неэффективный путь. Есть такое высказывание, что статистика начинается с 30. Если "симуляция" состоит из 30 опытов и "макросерий" тоже 30, то понадобится 900 опытов. Насколько я понимаю, для оценок из книги Ивченко и Медведева требуется на порядок меньший объем данных.

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение18.01.2019, 00:18 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Markiyan Hirnyk в сообщении #1369435 писал(а):
Не понял, поэтому не могу ответить.

Извиняюсь. Попробую объяснить поподробнее. У меня имеется виртуальный химический реактор (типа известного Urey-Miller Nanoreactor Simulation). Задавая разные начальные условия, я могу проводить моделирование, в результате которого на выходе образуются разные продукты реакций. Соответственно, одно начальное условие даёт один набор продуктов, и это есть та самая одна симуляция.
Я случайным образом меняю начальные условия, в результате чего могу набрать статистику из $N$ прогонов (порядка сотни штук, симуляции не очень дешёвые, да и весит каждая ~ по 5 гигов). И я хочу оценить относительный выход разных продуктов реакции, он, как я понимаю, равен $\omega_i = 100\% \cdot \underbrace{n_i/N}_{\approx p_i}$ (число симуляций, которые привели к i-му продукту на общее число симуляций). А поскольку выходы бывают маленькие (порядка 1-10%), я хочу дать этим выходам оценку погрешности (много симуляций сделать не удастся).
Markiyan Hirnyk в сообщении #1369435 писал(а):
Проконсультируйтесь со специалистами.

Пытаюсь это сделать тут.
В приведённой Вами книге, на стр. 38 (§ 1.1.6) есть формула для дисперсии полиномиального распределения:
$D \nu_i = n p_i (1 - p_i)$. Если я правильно понимаю, именно эту формулу мне и можно использовать? Т.е. оценка среднеквадратичного отклонения для выхода $\omega_i$ будет $\sigma_i \approx 100\% \cdot \sqrt{N p_i(1-p_i)}$, а соответствующая стандартная ошибка $\mathrm{SE}_i =100\% \cdot \frac{\sigma_i}{\sqrt{N}} = 100\% \cdot \sqrt{ p_i(1-p_i)} $, правильно?

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение18.01.2019, 09:37 


11/07/16
825
madschumacher У меня такое впечатление, что Вы не обратили внимание на PS в моем предыдущем сообщении. Вы пишете
Цитата:
В приведённой Вами книге, на стр. 38 (§ 1.1.6) есть формула для дисперсии полиномиального распределения:

Это на с. 39, а не 38. На с. 40 указано, что компоненты полиномиального распределения являются биномиальными распределениями. Этот случай рассмотрен в примере 17 на с. 237-238. Извините, я сейчас занят и не имею возможности рассмотреть Вашу новую идею. Всего доброго!

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение18.01.2019, 22:07 
Аватара пользователя


26/05/12
1705
приходит весна?
madschumacher в сообщении #1369481 писал(а):
Я случайным образом меняю начальные условия, в результате чего могу набрать статистику из $N$ прогонов (порядка сотни штук, симуляции не очень дешёвые, да и весит каждая ~ по 5 гигов). И я хочу оценить относительный выход разных продуктов реакции, он, как я понимаю, равен $\omega_i = 100\% \cdot \underbrace{n_i/N}_{\approx p_i}$ (число симуляций, которые привели к i-му продукту на общее число симуляций).

А смысл всего этого? Я ещё понимаю, если бы при одних и тех же начальных условиях по каким-то внутренним причинам получались бы разные результаты, тогда имело бы смысл наводить статистику и смотреть как среднее и дисперсия зависят от начальных значений. Но вы же сами в ручную меняете начальные условия, зачем же потом это всё в одну кучу смешивать?

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение18.01.2019, 22:47 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
Markiyan Hirnyk в сообщении #1369545 писал(а):
Извините, я сейчас занят и не имею возможности рассмотреть Вашу новую идею. Всего доброго!

Ничего страшного. Спасибо за помощь и наводки, я постараюсь разобраться получше! :D
B@R5uk в сообщении #1369737 писал(а):
Но вы же сами в ручную меняете начальные условия, зачем же потом это всё в одну кучу смешивать?

А кто сказал, что я вручную меняю? Может под
madschumacher в сообщении #1369481 писал(а):
случайным образом меняю начальные условия

я подразумевал нечто физически осмысленное?

(спойлер)

(а я подразумевал :lol: )

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение18.01.2019, 23:02 
Аватара пользователя


26/05/12
1705
приходит весна?
Тогда вам стоит более подробно объяснить, что именно происходит, и почему величина, которую вы рассчитываете имеет смысл.

А вообще, если абстрагироваться от всей физики/химии, то можно придумать что-то такое. Дальше в теме можно почитать критику моего предложения. Но оно, во всяком случае, позволяет ввести распределение для искомой вероятности и рассчитать по нему среднее, наивероятнейшее, дисперсию и чего только пожелаете.

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение18.01.2019, 23:50 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
B@R5uk в сообщении #1369771 писал(а):
Тогда вам стоит более подробно объяснить, что именно происходит, и почему величина, которую вы рассчитываете имеет смысл.

Ну куда уж подробнее? Я не понимаю, что тут непонятного, честно. Задайте вопрос какой-нть, чтобы я понял в каком направлении копать...
B@R5uk в сообщении #1369771 писал(а):
А вообще, если абстрагироваться от всей физики/химии

Мне не очень хочется от неё абстрагироваться, всё же это для меня физика и химия первичны. Работа однако, жрат за неё могу купить. :lol: Да и мозг у меня в других терминах не мыслит, проф.деформация, однако.
А за ссылку спасибо, посмотрю.

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение19.01.2019, 01:07 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
madschumacher
Постановка задачи непонятна. Что значит "меняю начальные условия"?
Вот смотрите, я сейчас буду менять начальные условия.
У меня в корзине $n$ белых, $m$ красных и $k$ черных шариков.
Я достаю из нее шарики, пытаясь по частоте оценить состав.

Поменяю начальные условия (состав корзины). И буду проделывать ту же процедуру.

Ага, а теперь буду менять начальные условия каждый раз.

Так у Вас? Потому что выглядит так, а так ничего не выйдет.

Или все-таки Вы набираете нужную статистику на каждом из начальных условий?

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение19.01.2019, 02:07 
Заслуженный участник
Аватара пользователя


04/09/14
5316
ФТИ им. Иоффе СПб
Otta в сообщении #1369857 писал(а):
Постановка задачи непонятна. Что значит "меняю начальные условия"?
Я, как человек далекий от всего, попытаюсь пояснить, а madschumacher, если что, подправит. Как я понял, случайной величиной являются те самые начальные условия. Видимо, про них известно все (функция распределения и т.п.). После пропускания этих начальных условий через стимулятор на выходе симулятора появляется набор неких других величин, являющихся случайными в силу случайности начальных условий. Проблема в том, что симулятор - "черный ящик", и что он делает с начальными условиями - загадка. Хочется знать (сосчитать) хоть какие стат. свойства выходных параметров. madschumacher, так?

 Профиль  
                  
 
 Re: Оценка погрешности для вероятности события
Сообщение19.01.2019, 02:57 
Заслуженный участник
Аватара пользователя


28/04/16
2395
Снаружи ускорителя
amon в сообщении #1369870 писал(а):
Хочется знать (сосчитать) хоть какие стат. свойства выходных параметров. madschumacher, так?

Точнее и не сказать! Спасибо большое! :D

В контексте приведённого выше виртуального реактора это конкретно означает следующее: у меня есть распределение начальных скоростей/координат системы, из него получаются конкретные варианты стартовых условий. Т.е. система одна и та же, но из-за её квантовой сущности, она может быть разной в начальный момент времени.

(Оффтоп)

Начальные условия генерятся из вигнеровской функции основного колебательного состояния молекулярной системы.

На сгенерированных начальных условиях проводится эволюция системы (по уравнениям класс.меха в жутко сложном потенциале, вычисляемом численно) в присутствии внешних условий (они фиксированы). Это и есть тот самый чёрный ящик.
А выходными параметрами является образующий состав продуктов реакции. Хочется оценить, как распределены разные финальные продукты.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: mihaild


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group