2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Корреляторы для нормального распределения
Сообщение09.07.2017, 00:36 


05/10/10
152
Здравствуйте. В книге Д.С. Горбунов, В.А. Рубаков "Введение в теорию ранней Вселенной. Космологические возмущения. Инфляционная теория", Приложение С. Гауссовы случайные величины и гауссовы случайные поля следующим образом определяются корреляторы для набора случайных величин $q_1,\ldots,q_N$ с законом распределения
$$
F(q_1,\ldots,q_N)=\dfrac{1}{(2\pi)^{N/2}\left(\det{M}\right)}\int{\exp\left\{-\dfrac{1}{2}q_mM_{mn}q_n\right\}}.
$$
Вводится производящая функция
$$
Z(j_1,\dots,q_N)=\int{F(q_1,\dots,q_N)\mathrm{e}^{j_nq_n}d^Nq}=\exp\left\{\dfrac{1}{2}j_mD_{mn}j_n\right\},
$$
где $D=M^{-1}$. Сами корреляторы задаются выражением
$$
\left<q_{n_1},\ldots,q_{n_k}\right>=\left.\left[\dfrac{\partial^{k}Z}{\partial j_{n_1}\ldots \partial j_{n_k}}\right]\right|_{j_m=0}.
$$
Далее имеется следующее утверждение:
Цитата:
...справедливо утверждение, которое в квантовой теории поля называют теоремой Вика: для вычисления среднего $\left<q_{n_1}\ldots q_{n_{2k}}\right>$ необходимо величины $q_{n_1},\ldots q_{n_{2k}}$ разбить на пары,
каждой паре $(q_{n_r},q_{n_s})$ поставить в соответствие величину $D_{n_r n_s$, а разбиению --- произведение всех таких величин, и, наконец,
просуммировать по всем возможным разбиениям. Например, среднее от произведения четырех гауссовых случайных величин равно
$$
\left<q_pq_rq_sq_t\right>=D_{pr}D{st}+D_{ps}D_{rt}+D_{pt}D_{rs}.
$$
Верно и обратное утверждение: если все корреляторы случайных величин удовлетворяют теореме Вика с матрицей $D_{mn}$, а сама эта матрица задает положительно определенную квадратичную форму, то соответствующий набор случайных величин является гауссовым и характеризуется функцией распределения...

которая приведена вначале. Требуется доказать это утверждение и обратное. Прямое утверждение можно доказать, если записать общее выражение для производной прjизводящей функции $Z(j)$, а вот как доказать обратное утверждение, никаких идей совершенно. Пожалуйста, подскажите можно ли доказать прямое утверждение проще, чем через общее выражение для производной производящей функции, и в каком направлении двигаться, чтобы доказать обратное утверждение.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 21:05 


26/05/17
41
Москва
Должен Вам заметить, что в терминах здесь большая путаница, которая будет очень мешать в доказательствах. В книге плотность распределения сл. вектора часто называют функцией распределения, характеристическую функцию - производящей, элементы корреляционной матрицы - набором корреляторов. Формулы вообще никакой критики не выдерживают. Прочитайте про многомерное нормальное распределение где-нибудь в нормальном учебнике по теории вероятностей (Боровков или Ширяев), потом уже в книге Андерсона, если не найдете ответа. Для начала сформулируйте задачу в правильных общепринятых терминах.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 21:15 


05/10/10
152
Optimizator
разве у характеристической функции было бы не $\mathrm{e}^{ij_mq_m}$?

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 22:01 


26/05/17
41
Москва
Да, простите, я не совсем понял эти обозначения, показалось, что $j$ - это мнимая единица. С учетом того, что подвектор гауссового вектора тоже гауссов, прямое утверждение сводится к доказательству формулы для мат. ожидания произведения всех компонент. Наверное, так можно теорему Вика сформулировать:
если $\xi=(\xi_1,\ldots,\xi_n)\sim N(\vec 0,\Sigma)$, то ${\bf E} (\xi_1\ldots\xi_n)=0$ при нечетном $n$, а при четном $n=2m$
$$ 
{\bf E} (\xi_1\ldots\xi_{2m})=
\sum_{\{ \{i_1,j_1\},\ldots,\{i_m,j_m\} \}} \sigma_{i_1j_1}\ldots \sigma_{i_m j_m},
$$
где $\Sigma=\|\sigma_{ij}\|_{n\times n}$.
При $n=1,2$ это очевидно, а дальше, может, по индукции? Матрицу привести к блочно-диагональному виду? Для $n=3,4$ сначала попробовать.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:00 
Заслуженный участник
Аватара пользователя


23/07/08
10707
Crna Gora
Ещё одна ошибка в книге:
Цитата:
Задача 2. Показать, что нормировочный множитель в (C.2) и (C.5) равен $\mathscr N=(\det M)^{-1/2}(2\pi)^{-N/2}$.
Тут вместо $(\det M)^{-1/2}$ должно быть либо $(\det M)^{+1/2}$, либо $(\det D)^{-1/2}$.

Как быстро убедиться, что здесь ошибка: рассмотреть одномерное нормальное распределение. Единственный элемент матрицы $M$ равен $\frac 1{\sigma^2}$, это же значение имеет $\det M$. Тогда, согласно условию задачи, в нормировочном множителе $\sigma$ должно оказаться в числителе, что, как мы знаем, неверно.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:11 


05/10/10
152
Optimizator
спасибо, попробую. Но это у вас получается формулировка прямая, а вот главная сложность с обратной. Она будет звучать примерно таким образом: если для $\xi=(\xi_1,\ldots\xi_n)$
$$
\mathrm{E}(\xi_1...\xi_{n})=0
$$
для нечетных $n$, а для четных $n=2m$
$$
\mathrm{E}(\xi_1...\xi_{2m})=\sum_{\left\{\left\{i_1,j_1\right\},\ldots \left\{i_m,j_m\right\}\right\}}{\mathrm{E}(x_{i_1}x_{j_1})\ldots \mathrm{E}(x_{i_m}x_{j_m})},
$$
то плотность распределения $\xi$ имеет вид
$$
\exp\left\{-\dfrac{1}{2}\xi^T\Sigma^{-1}\xi\right\},
$$
где $\Sigma=||\mathrm{E}(x_ix_j)||_{n\times n}$

svv
это моя опечатка, конечно.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:12 
Заслуженный участник
Аватара пользователя


23/07/08
10707
Crna Gora
Почему Ваша? Так в книге.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:30 


05/10/10
152
svv
в книге в явном виде коэффициент выписан отдельно (и верно), я просто записала его в явном виде в функции.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 00:34 


26/05/17
41
Москва
Anna from Svetl в сообщении #1232473 писал(а):
... главная сложность с обратной. Она будет звучать примерно таким образом: если для $\xi=(\xi_1,\ldots\xi_n)$
$$
\mathrm{E}(\xi_1...\xi_{n})=0
$$
для нечетных $n$, а для четных $n=2m$
$$
\mathrm{E}(\xi_1...\xi_{2m})=\sum_{\left\{\left\{i_1,j_1\right\},\ldots \left\{i_m,j_m\right\}\right\}}{\mathrm{E}(x_{i_1}x_{j_1})\ldots \mathrm{E}(x_{i_m}x_{j_m})},
$$
то плотность распределения $\xi$ имеет вид
$$
\exp\left\{-\dfrac{1}{2}\xi^T\Sigma^{-1}\xi\right\},
$$
где $\Sigma=||\mathrm{E}(x_ix_j)||_{n\times n}$


Нет, сложнее (даже если исправить опечатки $x_i$ на $\xi_i$ :-) ). Контрпример к Вашему варианту: пара независимых центрированных дискретных с.в.
Ну и аргументами плотности лучше брать не с.в., а переменные-параметры, да и нормировочный множитель не забывать :-)

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 00:45 


05/10/10
152
Optimizator
Столько всяких учебников пересмотрела за последние пару дней, что с обозначениями совершенная каша :-)
Тогда как должна звучать обратная теорема? Вот не представляю, какое доказательство для нее имели в виду авторы учебника. По идее, должно быть что-то простое, потому что если уж они отдельно приложение выделили для гауссовых случайных величин, подразумевается, что читатель не имеет сверхзнаний в данной области.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 01:15 
Заслуженный участник
Аватара пользователя


23/07/08
10707
Crna Gora
Может быть, будет полезной такая идея.

Прежде всего, для аккуратности будем различать верхние и нижние индексы. Переменные $q^i$ будем трактовать как координаты, в них индекс по определению верхний. Тогда элементы матрицы $M$ должны иметь нижние индексы, так как выражение $M_{mn}\,q^m\,q^n$ инвариант. А элементы матрицы $D$ должны иметь верхние индексы, чтобы уравнение $D^{km}M_{mn}=\delta^k_n$ сохраняло вид при замене координат.

Рассмотрим среднее произведения двух (для простоты) гауссовых величин:
$$\langle q^p q^r \rangle=\dfrac{(\det{M})^{1/2}}{(2\pi)^{N/2}}\int q^p q^r {\exp\left(-\dfrac{1}{2}M_{mn}q^m q^n\right)\;d^Nq$$Перейдём к новым переменным $\tilde q^s$ с помощью линейной замены $q^p=T^p{}_{\tilde s}\,\tilde q^s$. При этом
$(\det M)^{1/2}=\dfrac {(\det \tilde M)^{1/2}}{\det T};\quad d^N q=\dfrac{D(q)}{D(\tilde q)}\,d^N \tilde q=\det T\,d^N \tilde q\;,$
где $\frac{D()}{D()}$ — якобиан преобразования координат.
Учитывая это, получим:$$\langle q^p q^r \rangle=\dfrac{(\det{\tilde M})^{1/2}}{(2\pi)^{N/2}}\int T^p{}_{\tilde s}\,\tilde q^s \;T^r{}_{\tilde t}\,\tilde q^t \;{\exp\left(-\dfrac{1}{2}\tilde M_{mn}\tilde q^m \tilde q^n\right)\;d^N\tilde q= T^p{}_{\tilde s}\,T^r{}_{\tilde t}\,\langle \tilde q^s \,\tilde q^t \rangle$$Мы получили, что набор средних $\langle q^p q^r \rangle$ при линейной замене координат преобразуется как набор компонент тензора. Если это и так было очевидно — прекрасно. :-) Аналогичный вывод получится для произведения более чем двух гауссовых величин.

Очевидно, что и набор величин $D^{pr}$ (или, в более общем случае, их произведений) преобразуется по тому же закону. А раз так, достаточно доказать теорему в какой-либо одной «удобной» системе координат. Такой системой является та, в которой матрица $\tilde M$ имеет диагональный вид. Тогда $\tilde D$ также диагональна. При этом совместная плотность распределения величин $\tilde q^i$ равна произведению плотностей отдельных величин, поэтому $\tilde q^i$ независимы. Записанный выше кратный интеграл для вычисления среднего представляется в виде произведения простых интегралов.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 15:04 


05/10/10
152
svv
спасибо, очень интересный подход. Но я не совсем понимаю, как доказывать теорему в случае диагональной матрицы $M$? Тогда от нуля будут отличны только средние от произведения четного числа одинаковых величин, например, $\left<\tilde{q}_{i_1}^2\tilde{q}_{i_2}^4\tilde{q}_{i_3}^2\right> =\sigma_{i_1 i_1}^2\cdot \sigma_{i_2 i_2}^4\cdot 3!!\cdot \sigma_{i_3 i_3}^2=3!!\cdot D^{i_1 i_1}\left(D^{i_2 i_2}\right)^2D^{i_3i_3}$, если $\tilde{M}_{ij} = \dfrac{1}{\sigma_{ii}^2}$ при $i=j$ и $\tilde{M}_{ij}=0$ при $i\neq j$. Как перейти к доказательству?

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 15:25 
Заслуженный участник
Аватара пользователя


23/07/08
10707
Crna Gora
Пока не думал об этом, не знаю.

Хочу заметить, что в рамках того же подхода можно сделать ещё один небольшой шаг: линейным преобразованием $q$ привести матрицы $M$ и $D$ к единичным. Это возможно потому, что в силу положительной определённости $M$ после приведения к диагональному виду на диагонали будут стоять строго положительные значения.

Верю, что в любом случае свойство независимости случайных величин $\tilde q^i$ будет полезным, и применение ему найдётся.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 20:30 


05/10/10
152
svv
ладно, буду думать. Может что-нибудь получится.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 21:48 
Заслуженный участник
Аватара пользователя


23/07/08
10707
Crna Gora
Итак, линейной заменой переменных мы привели матрицы к виду $M=D=E$. Вычислим среднее произведения гауссовых величин с помощью кратного интеграла. Сейчас удобно все индексы писать внизу, вверху будут степени.

Чтобы задать некоторое произведение случайных величин из гауссова набора, достаточно указать, в какой степени $n_i$ каждая из величин $q_i$ входит в произведение. (Если $q_i$ не входит в произведение, то $n_i=0$.)$$(q_1)^{n_1}\,(q_2)^{n_2}\ldots (q_N)^{n_N}=\prod\limits_{i=1}^N (q_i)^{n_i}$$Среднее значение этого произведения по общей формуле равно$$\dfrac{1}{(2\pi)^{N/2}}\int\limits_{\mathbb R^N}\left(\prod\limits_{i=1}^N (q_i)^{n_i}\right)\,\exp\left(-\dfrac{1}{2}\sum\limits_{k=1}^n (q_k)^2 \right)\,d^N q=\prod\limits_{i=1}^N \left\{\dfrac{1}{\sqrt{2\pi}}\int\limits_{-\infty}^{+\infty} x^{n_i}\,e^{-x^2/2}\,dx\right\}$$Интеграл в фигурных скобках равен нулю, если $n_i$ нечётное, и $(n_i-1)!!$, если чётное (см. Рыжик и Градштейн, 3.461-2, стр.351). Далее считаем все $n_i$ чётными, тогда$$\langle \prod\limits_{i=1}^N (q_i)^{n_i}\rangle=\prod\limits_{i=1}^N (n_i-1)!!$$Остаётся получить то же значение, исходя из сумм произведений $D_{pq}$. Учитывая вид полученного результата и то, что $D_{pq}=\delta_{pq}$, можно ожидать, что впереди — чистая комбинаторика.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 28 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: smorn


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group