2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Найти ковариацию случайных величин
Сообщение23.06.2019, 19:23 


20/03/14
12041
vicvolf
Вы как собираетесь определять произведение с.в., заданных на разных в.п.?

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение23.06.2019, 19:30 


23/02/12
3372
Someone в сообщении #1400952 писал(а):
где $1\leqslant k\leqslant\min\{i,j\}$,
Это неверно, поэтому вывод неправильный. Надо сменить обозначения $1 \leq k_i \leq i$.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение23.06.2019, 20:57 
Заслуженный участник
Аватара пользователя


23/07/05
17989
Москва
Someone в сообщении #1400952 писал(а):
приходится сделать вывод, что эти случайные величины определены на разных вероятностных пространствах.
Нет, я здесь не прав.
vicvolf в сообщении #1401039 писал(а):
Someone в сообщении #1400952 писал(а):
где $1\leqslant k\leqslant\min\{i,j\}$,
Это неверно, поэтому вывод неправильный. Надо сменить обозначения $1 \leq k_i \leq i$.
Но не по этой причине. Как раз здесь у меня всё в порядке.

Но Вы не можете вычислять ковариацию, если неизвестно совместное распределение вероятностей, а его невозможно определить, если известны только вероятности значений.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение23.06.2019, 21:41 


23/02/12
3372
Someone в сообщении #1401052 писал(а):
Но Вы не можете вычислять ковариацию, если неизвестно совместное распределение вероятностей, а его невозможно определить, если известны только вероятности значений.
Я уже писал об этом. Я понял, что в данном случае предположил независимость случайных величин.

-- 23.06.2019, 22:37 --

Евгений Машеров в сообщении #1400956 писал(а):
(для описанной выше схемы получения равновероятных, но зависимых случайных величин)
Пусть $f(k)$ при чётных k равно 1, при нечётных -1.
Тогда для большого n матожидание среднего будет стремиться к нулю, и ковариация будет приблизительно равна матожиданию произведений. Но для достаточно больших номеров вероятность "переключения" стремится к нулю, и последовательность случайных значений будет состоять из очень длинных цепочек единиц или минус единиц, и ковариация соседних отсчётов будет стремиться к единице.
Интересный пример зависимых случайных величин. Что такое вероятность переключения? Нельзя ли подробнее разобрать данный пример. Почему ковариация будет стремиться к 1, если эта вероятность стремиться к нулю? Думаю, что она тоже стремится к нулю.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение24.06.2019, 15:04 


23/02/12
3372
vicvolf в сообщении #1401063 писал(а):
Евгений Машеров в сообщении #1400956 писал(а):
(для описанной выше схемы получения равновероятных, но зависимых случайных величин)
Пусть $f(k)$ при чётных k равно 1, при нечётных -1. Тогда для большого n матожидание среднего будет стремиться к нулю, и ковариация будет приблизительно равна матожиданию произведений. Но для достаточно больших номеров вероятность "переключения" стремится к нулю, и последовательность случайных значений будет состоять из очень длинных цепочек единиц или минус единиц, и ковариация соседних отсчётов будет стремиться к единице.
Интересный пример зависимых случайных величин. Что такое вероятность переключения? Нельзя ли подробнее разобрать данный пример. Почему ковариация будет стремиться к 1, если эта вероятность стремиться к нулю? Думаю, что она тоже стремится к нулю.

Поверил Ваш пример. Если $i$ или $j$ - нечетно, то $M[g_i]M[g_j]=1/ij$, в остальных случаях $M[g_i]M[g_j]=0$. Следовательно, $M[g_i]M[g_j] \leq 1/ij$. $M[g_ig_j]$ также принимает либо значение ноль, либо значение $M[g_ig_j] \leq 1/i$, где $j>i$. Поэтому - $|cov[g_i,g_j]|=|M[g_ig_j]-M[g_i]M[g_j]| \leq 1/i$.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение24.06.2019, 18:34 
Заслуженный участник
Аватара пользователя


11/03/08
9971
Москва
Проверьте выкладки.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение25.06.2019, 18:41 


23/02/12
3372
Евгений Машеров в сообщении #1401282 писал(а):
Проверьте выкладки.
Проверил. У нас расхождение только в математическом ожидании произведения случайных величин.

Сумма $\sum_{l=1}^i\sum_{m=1}^j {f(l)f(m)}$ при натуральных $i<j$ принимает только значения: $-1,0,1$. Например, $\sum_{l=1}^1\sum_{m=1}^3 {f(l)f(m)}=(-1)(-1)+(-1)(+1)+(-1)(-1)=1$.

Каждый член этой суммы умножается на вероятность произведения: $P{(g_i=f(l)) \cap (g_j=f(m))=P(g_i=f(l))P(g_j=f(m)/g_i=f(l)),$ где $P(g_i=f(l))=1/i,P(g_j=f(m)/g_i=f(l)) \leq 1$.

Поэтому $P(g_i=f(l)) \cap P(g_j=f(m)/g_i=f(l)) \leq 1/i$.

Следовательно, $|M[g_ig_j]| \leй 1/i$ и $cov[g_i,g_j] \leq |M[g_ig_j]|+|M[g_i]M[g_j]|=1/i+1/ij \leq 1,5/i$. Верно?

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение25.06.2019, 18:47 
Заслуженный участник
Аватара пользователя


11/03/08
9971
Москва
Начиная с
vicvolf в сообщении #1401503 писал(а):
Сумма $\sum_{l=1}^i\sum_{m=1}^j {f(l)f(m)}$ при натуральных $i<j$ принимает только значения: $-1,0,1$.

неверно.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение25.06.2019, 21:36 


23/02/12
3372
Евгений Машеров в сообщении #1401505 писал(а):
Начиная с
vicvolf в сообщении #1401503 писал(а):
Сумма $\sum_{l=1}^i\sum_{m=1}^j {f(l)f(m)}$ при натуральных $i<j$ принимает только значения: $-1,0,1$.

неверно.
Пожалуйста, пример на другое значение.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение26.06.2019, 10:24 
Заслуженный участник
Аватара пользователя


11/03/08
9971
Москва
Ошибка Ваша не в том, что Вы неверно вычисляете выражение, а в том, что Вы его вообще вычисляете. Это имело бы смысл, если бы вероятности были бы одинаковы, и их можно было бы вынести за знак суммы. А они, невзирая на равновероятность исходов для отдельных испытаний, не равны, в силу зависимости последовательных испытаний. Если же постулировать независимость - то вопрос о некоррелированности становится изрядно тривиален.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение26.06.2019, 15:18 


23/02/12
3372
Евгений Машеров в сообщении #1401595 писал(а):
Ошибка Ваша не в том, что Вы неверно вычисляете выражение, а в том, что Вы его вообще вычисляете. Это имело бы смысл, если бы вероятности были бы одинаковы, и их можно было бы вынести за знак суммы. А они, невзирая на равновероятность исходов для отдельных испытаний, не равны, в силу зависимости последовательных испытаний. Если же постулировать независимость - то вопрос о некоррелированности становится изрядно тривиален.
Значит дело не в суммах произведений значений арифметических функций, а в вероятностях этих значений. Я понимаю, что эти события зависимы и поэтому не равновероятны. Поэтому я их не считаю, а делаю оценку сверху условной вероятности этих событий:

$P{(g_i=f(l)) \cap (g_j=f(m))=P(g_i=f(l))P(g_j=f(m)/g_i=f(l)),$

где $P(g_i=f(l))=1/i,P(g_j=f(m)/g_i=f(l)) \leq 1$.

Поэтому $P(g_i=f(l)) \cap P(g_j=f(m)/g_i=f(l)) \leq 1/i$.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение26.06.2019, 15:55 
Заслуженный участник
Аватара пользователя


11/03/08
9971
Москва
Ограничусь расчётом для автокорреляций (автоковариаций) первого порядка. Общий случай может быть исследован аналогично, но для вывода о том, что без независимости равновероятность не гарантирует некоррелированности величин, достаточно и первого.
Механизм генерации таков, что при $m+1$ испытании новая величина g с вероятностью $\frac m {m+1}$ совпадает с предыдущей, а с вероятностью $\frac 1 {m+1}$ равна $g_{m+1}$. Легко видеть, что все $g_i, i \le m$ в m-том испытании равновероятны. При этом $f(g_m)=f(g_{m+1})$ с вероятностью $\frac m {m+1}$, и их произведение для данной $f(g)$ единица, и в половине случаев единица будет и при событии с вероятностью $\frac 1 {m+1}$, в половине же при таком событии будет минус единица. То есть матожидание произведения m-того значения на (m+1)-ое окажется равно $\frac m  {m+1}=1-\frac 1 {m+1}$, а матожидание суммы этих произведений от первого до n-ного слагаемого можно посчитать через сумму гармонического ряда, получив $n-\ln n-\gamma$. А так как сумма квадратов будет n, то с ростом n корреляция будет стремиться к единице.
Причина очевидна, наша последовательность будет состоять из всё более длинных цепочек 1 или -1.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение27.06.2019, 16:08 


23/02/12
3372
Евгений Машеров в сообщении #1401636 писал(а):
для вывода о том, что без независимости равновероятность не гарантирует некоррелированности величин.
Полностью согласен.
Цитата:
Механизм генерации таков, что при $m+1$ испытании новая величина g с вероятностью $\frac m {m+1}$ совпадает с предыдущей, а с вероятностью $\frac 1 {m+1}$ равна $g_{m+1}$. Легко видеть, что все $g_i, i \le m$ в m-том испытании равновероятны. При этом $f(g_m)=f(g_{m+1})$ с вероятностью $\frac m {m+1}$, и их произведение для данной $f(g)$ единица, и в половине случаев единица будет и при событии с вероятностью $\frac 1 {m+1}$, в половине же при таком событии будет минус единица. То есть матожидание произведения m-того значения на (m+1)-ое окажется равно $\frac m  {m+1}=1-\frac 1 {m+1}$, а матожидание суммы этих произведений от первого до n-ного слагаемого можно посчитать через сумму гармонического ряда, получив $n-\ln n-\gamma$. А так как сумма квадратов будет n, то с ростом n корреляция будет стремиться к единице. Причина очевидна, наша последовательность будет состоять из всё более длинных цепочек 1 или -1.
Вы вернулись к первому примеру. Действительно в этом случае корреляция может стремиться к единице.

Но меня заинтересовал Ваш второй пример. Позже я напишу почему. Я попытаюсь для этого примера дать оценку дисперсии суммы случайных величин $D[\sum_{i=1}^n {g_i}]$.

Для оценки буду использовать формулу:

$|D[\sum_{i=1}^n {g_i}]| \leq \sum_{i=1}^n {|D[g_i]|}+\sum\sum_{i \not= j} |cov[g_ig_j]|$. (1)

Так как $|g_i| \leq 1$, то: $|D[g_i]|=|M[g_i^2]-M^2[g_i]|=|(\sum_{k=1}^i {f^2(k)})/i-({\sum_{k=1}^i {f(k))^2/i^2| \leq 1$, (2)

так как первая сумма равна 1, а вторая $\leq 1/i^2$.

На основании (2): $\sum_{i=1}^n {|D[g_i]|} \leq n$. (3)

Так как ранее мы получили оценку ковариации: $|cov[g_ig_j] \leq 1.5/i$, для $i <j$, то:

$\sum\sum_{i \not= j} |cov[g_ig_j]| \leq \sum_{i=1}^{n(n-1)} {1.5/i}$. (4)

Используя частичную сумму гармонического ряда на основании (4) получим:

$\sum\sum_{i \not= j} |cov[g_ig_j]| \leq 1.5(\log n(n-1)+ \gamma)= 3 logn+1.5 \gamma$, (5)

где $\gamma=0,5772$ (постоянная Эйлера).

На основании (3) и (5) окончательно получим:

$|D[\sum_{i=1}^n {g_i}]| \leq n+ logn +1.5\gamma$ или $D[\sum_{i=1}^n {g_i}]=O(n)$.

 Профиль  
                  
 
 Re: Найти ковариацию случайных величин
Сообщение28.06.2019, 16:58 


23/02/12
3372
Теперь поясню, почему меня заинтересовал данный пример.

Рассмотрим последовательность случайных величин $g_1,g_2,...,(|g(i)| \leq C)$.

Легко показать, что максимум дисперсии случайной величины $g_i$ достигается, когда случайная величина принимает только значения $C,-C$ с равной вероятностью.

В этом случае в формуле $D[g_i]=M[g_i^2]-M^2[g_i]$ значение $M[g_i]=0$, а $M[g_i^2]=C^2$, поэтому $D[g_i]=C^2$.

Для суммы случайных величин $\sum_{i=1}^n {g_i}, |g_i | \leq C$ в этом случае также достигается максимум дисперсии, так как в формуле:

$D[\sum_{i=1}^n {g_i}]=M[(\sum_{i=1}_n {g_i^2})^2]-M^2[\sum_{i=1}^n {g_i}]$ значение $M[\sum_{i=1}^n {g_i}]=0$,

поэтому $D[\sum_{i=1}^n {g_i}]=M[(\sum_{i=1}^n {g_i})^2]=M[(\sum_{i=1}^n {g_i^2)]+\sum\sum_{i \not= j} M[g_ig_j]$.

Сделаем оценку первого слагаемого в последнем выражении:

$|\sum_{i=1}^n {M[g_i^2]} \leq C^2n$.

В оценке второго слагаемого, используем оценку: $|M[g_ig_j]| \leq 1.5C^2/i,i <j$, поэтому, на основании частичной суммы гармонического ряда, получим:

$|\sum\sum_{i \not= j} M[g_ig_j]| \leq  \sum_{i=1}^{n(n-1)} {1.5C^2/i}=C^2 (3logn+1.5\gamma)$.

Используя обе полученные оценки получим:

$|D[\sum_{i=1}^n {g_i}]| \leq C^2 (n+3logn+1.5\gamma)$ или $D[\sum_{i=1}^n {g_i}]=O(n)$.

Отсюда следует, что если случайная величина $g_i$ принимает значения арифметической функции $f$, т.е. если $g_i(1)=f(1),...,g_i(i)=f(i)$, с равной вероятностью и арифметическая функция ограничена - $|f(i) |\leq C$, то для дисперсии суммы случайных величин выполняется оценка: $D[\sum_{i=1}^n {g_i}]=O(n)$.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 29 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group