2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4  След.
 
 Re: Вероятность s-грамм
Сообщение08.12.2020, 15:50 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Влияет потому, что спрашивается условная вероятность, что следующая сумма будет меньше М, при условии, что предыдущая меньше. Если корреляция стремится к единице, то вероятность того, что вторая сумма будет меньше М, если первая меньше, стремится к единице. Среднюю вероятность того, что сумма меньше М, можно вычислить и без учёта корреляции, но у нас будут большие серии "успехов" и "неудач", а не независимые испытания.
Изображение
В виде иллюстрации: по одной оси первая сумма, по второй вторая. Если мы знаем, что первая (по горизонтали) меньше М, то вероятность того, что и вторая (по вертикали) меньше М, будет не отношение (красная+синяя)/(красная+синяя+сиреневая+голубая), а (красная)/(красная+сиреневая)

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение08.12.2020, 17:27 


07/08/14
4231
Убирание из суммы первого и добавление еще одного слагаемого эквивалентно фиксированию всех слагаемых кроме одного (любого), потому что все слагаемые имеют одинаковое распределение.
Предположим сумма $m_1+...+m_n \leqslant  M$
а сумма $m_1+...+m_{n-1}=s
Тогда вопрос задачи:
какова вероятность $P(s+m_n \leqslant M)$, поскольку $m_{n+1}-m_1=m_n$. Это верно?

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение08.12.2020, 21:13 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
upgrade в сообщении #1495753 писал(а):
какова вероятность $P(s+m_n \leqslant M)$, поскольку $m_{n+1}-m_1=m_n$. Это верно?


С чего бы?

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение08.12.2020, 21:59 


07/08/14
4231
Евгений Машеров в сообщении #1495769 писал(а):
С чего бы?


upgrade в сообщении #1495753 писал(а):
поскольку $m_{n+1}-m_1=m_n$. Это верно?
Поправка:
поскольку $m_1$ и $m_{n+1}$ одинаково распределены, $m_{n+1}$ можно заменить на $m_1$ вот здесь:
$m_2+m_3+...+m_{n+1}$, переписав выражение $m_2+m_3+...+m_1$
Это верно?

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение08.12.2020, 23:13 
Заслуженный участник
Аватара пользователя


01/09/13
4656
upgrade в сообщении #1495753 писал(а):
какова вероятность

1. По условию.

upgrade в сообщении #1495774 писал(а):
Это верно?

Нет. На $m_1$ наложено ограничение.

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение09.12.2020, 06:54 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
upgrade в сообщении #1495774 писал(а):
Поправка:
поскольку $m_1$ и $m_{n+1}$ одинаково распределены, $m_{n+1}$ можно заменить на $m_1$ вот здесь:
$m_2+m_3+...+m_{n+1}$, переписав выражение $m_2+m_3+...+m_1$
Это верно?


Мне кажется, Вы путаете "одинаковы" и "одинаково распределены". Второе выполняется по условию, первое нет.
Ну и то, что в задаче спрашивается не распределение, а условное распределение.

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение09.12.2020, 07:40 


07/08/14
4231
Geen в сообщении #1495782 писал(а):
На $m_1$ наложено ограничение.

Евгений Машеров в сообщении #1495803 писал(а):
в задаче спрашивается не распределение, а условное распределение.

Это пока без ограничений и условий
"поскольку $m_1$ и $m_{n+1}$ одинаково распределены, $m_{n+1}$ можно заменить на $m_1$:
$m_2+m_3+...+m_{n+1}$, переписав выражение $m_2+m_3+...+m_1$".
Теперь ограничение
$m_1+m_2+...+m_n$ по условию задачи принимает фиксированное значение, которое $\leqslant M$
Это фиксированное значение равно $m_1+s$, где $s=m_2+m_3+...+m_n$
Во второй сумме тоже есть $m_2+m_3+...+m_n$ и поскольку они именно так обозначены, я так понимаю их можно, а может и нужно зафиксировать, оставив $m_{n+1}$
Вторую сумму можно записать как $S=s+m_{n+1}$
$m_1$ и $m_{n+1}$ одинаково распределены, значит вторую сумму можно записать $s+m_1$ (не фиксируя $m_1$), и отсюда (для второй суммы)
$P(m_1+s)=P(s+m_{n+1})$
Т.е. если у первой суммы зафиксировать все слагаемые кроме одного, какова вероятность что это распределение будет $\leqslant M$.

Другой вариант - какова вероятность того что $m_1+m_2+...+m_n$ просто меньше $M$ (любого), так как распределения $m_1+m_2+...+m_n$ и $m_2+m_3+...+m_{n+1}$ -это одно и тоже распределение и спросить "какова вероятность того что $m_2+m_3+...+m_{n+1} \leqslant M$", которое - значение суммы $m_1+m_2+...+m_n$ (да и неважно какой суммы) это тоже самое что спросить "какова вероятность того что $m_1+m_2+...+m_n \leqslant M$", которое ($M$) стало известно.

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение09.12.2020, 10:19 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Когда мы поставили условие на первую сумму - распределение изменилось.
Вот простой пример. Величины $m_i$ принимают с равной вероятностью значения 0 и 1. M - единица. Безусловная вероятность получить сумму двух значений меньше или равно M равна 0.75. Если первая сумма меньше или равна М, то там могут быть (0,0), (0,1), (1,0) с равной вероятностью. Поскольку новое значение равновероятно 0 или 1 - вероятность получить меньше или равно М становится 5/6.

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение10.12.2020, 09:45 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Небольшой численный эксперимент.
Скользящие суммы по 10 величин, принимающих случайные целые значения от 0 до 10, вычисляются последовательно из ряда с 1000000 элементами.
Порог принят $M=70$, условие "больше или равно".
Фактическая вероятность превышения 0.0249, рассчитанная исходя из нормального приближения 0.0228 (что, учитывая грубость аппроксимации дискретной величины непрерывной и малость числа слагаемых, совсем неплохая точность).
Вероятность превышения при условии, что предыдущая сумма превышает порог, 0.5867.
Для теоретического расчёта этой вероятности можно было бы воспользоваться выражением для матожидания одной из коррелированных величин при условии, что другая меньше известной величины.
https://en.wikipedia.org/wiki/Multivari ... stribution
(по ссылке приведено для In the centered case with unit variances, пересчитать легко)
Оценки корреляций последовательных сумм привёл выше.

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение10.12.2020, 10:24 


07/08/14
4231
Евгений Машеров в сообщении #1495823 писал(а):
Когда мы поставили условие на первую сумму - распределение изменилось.

Вероятность того, что во второй сумме первое слагаемое (взятое из первой суммы) $0$:
$$P=P(0)\cdot P(0) + P(1)\cdot P(0)=\frac{1}{2}\frac{1}{2}+\frac{1}{2}\cdot 1 = 0.75$$
Вероятность того, что во второй сумме первое слагаемое (взятое из первой суммы) $1$:
$$P=P(0)\cdot P(1) + P(1)\cdot P(1)=\frac{1}{2}\frac{1}{2}+\frac{1}{2}\cdot 0 = 0.25$$
Т.о. распределения слагаемых во второй сумме не равны распределениям слагаемых в первой (меняются при наложении условия), т.е. $m_1\not = m_{n+1}$, а $m_2$ в первой сумме $\not = $ $m_2$ во второй сумме. Теперь вроде правильно.

(Оффтоп)

Такая запись сбивает с толку
Stasya7 в сообщении #1495395 писал(а):
Вероятность $P(m_1+m_2+...+m_s \leqslant M)$ можно оценить нормальным распределением при достаточно большом $s$. Допустим, она известна.

Как найти условную вероятность $P(m_2+m_3+...+m_{s+1} \leqslant M)$,
ведь вторая сумма составлена не из слагаемых первой, а из слагаемых первой с условием, а это - другие распределения.

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение10.12.2020, 16:02 


15/10/15
82
DeBill в сообщении #1495673 писал(а):
Вывод общей формулы стандартен: пусть $\theta_i$ равна 1, если $i$-я сумма меньше $M$, и равна 0 - иначе. Тогда $\eta =\sum\limits_{i=1}^{k} \theta_i$ - и есть кол-во сумм, меньших $M$. Значит, ожидаемое кол-во сумм, меньших $M$, равно $M\eta = \sum\limits_{i=1}^{k}M\theta_i=k\cdot P\{S<M\}$

DeBill,
А как можно попробовать найти распределение величины $\eta$? Хотя бы для случая $P(\eta=0)$?
Например, вероятность того, что все суммы одновременно превосходят $M$.

Я правильно понимаю, что $\theta_i$ не являются независимыми?
То есть на суммы уже накладываются ограничения и распределение $\theta_i$ меняется:
$P(\theta_1 = 0) = P(S_1 > M)$
$P(\theta_2 = 0) = P(S_2 > M | S_1 >M)$
$P(\theta_3 = 0) = P(S_3 > M | S_2 >M)$
...
А нужна совместная вероятность $P(\theta_1 = 0, \theta_2 = 0, ..., \theta_k = 0) = P(\sum\limits_{i=1}^{k}\theta_i)$ (распределение суммы зависимых величин).

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение10.12.2020, 22:09 
Заслуженный участник


10/01/16
2318
Stasya7 в сообщении #1495949 писал(а):
Я правильно понимаю, что $\theta_i$ не являются независимыми?

Да. Да Вы это уже и писали с самого начала.
Stasya7 в сообщении #1495949 писал(а):
А как можно попробовать найти распределение величины $\eta$?

Боюсь, это сложно. Ведь уже сама вероятность $P\{\theta_i=0\}$ для Вашего распределения (при небольших $s$, когда ЦПТ еще плохо работает) выглядит довольно сложно - я писал ужасную формулы - правда, для непрерывного равномерного распределения, но для дискретного будет почти такая же. Что то считабельное, видимо, можно получить, если все слагаемые - нормальны (тогда и все будет нормально) (или , как писал Евгений Машеров, аппроксимить Ваше распределение нормальным. По ссылке там же, похоже, можно получить какие-нить теоретические формулы, а численный эксперимент - там же - позволяет надеяться на счасте)

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение11.12.2020, 00:23 


15/10/15
82
Евгений Машеров в сообщении #1495930 писал(а):
Для теоретического расчёта этой вероятности можно было бы воспользоваться выражением для матожидания одной из коррелированных величин при условии, что другая меньше известной величины.
А как от матожидания перейти к условной вероятности?

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение12.12.2020, 02:06 


15/10/15
82
Евгений Машеров в сообщении #1495930 писал(а):
Небольшой численный эксперимент.
Для теоретического расчёта этой вероятности можно было бы воспользоваться выражением для матожидания одной из коррелированных величин при условии, что другая меньше известной величины.

Евгений Машеров, то есть, вероятность, что сумма больше некоторого значения при условии, что предыдущая сумма превышает это значение, $P(S_i | S_{i-1} > M)$ можно определить как: $Norm(\mu, \sigma)$, где:

$\mu = E(S_i | S_{i-1} > M)=\rho {\phi (\frac{M-\mu_i}{\sigma_i}) \over (1-\Phi (\frac{M-\mu_i}{\sigma_i}))}$
$\sigma = (1-\rho^2)\sigma^2_i$ ?

 Профиль  
                  
 
 Re: Вероятность s-грамм
Сообщение14.12.2020, 01:41 


15/10/15
82
DeBill в сообщении #1495964 писал(а):
как писал Евгений Машеров, аппроксимить Ваше распределение нормальным. По ссылке там же, похоже, можно получить какие-нить теоретические формулы, а численный эксперимент - там же - позволяет надеяться на счасте)
DeBill
Если я аппроксимирую вероятность $P(S_i | S_{i-1} > M) \approx 1-Norm(E(S_i | S_{i-1} > M), D(S_i | S_{i-1}))$ для любых $i >1$ (ведь условные вероятности будут равны для любых последовательных сумм?), то тогда
P($\eta=0)=P(S_1>M)\prod\limits_{i=2}^{N-s+1}P(S_i | S_{i-1} > M)$$=P(S_1>M)(P(S_2 | S_{1} > M))^{N-s}$ ?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 49 ]  На страницу Пред.  1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group