2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Корреляторы для нормального распределения
Сообщение09.07.2017, 00:36 


05/10/10
152
Здравствуйте. В книге Д.С. Горбунов, В.А. Рубаков "Введение в теорию ранней Вселенной. Космологические возмущения. Инфляционная теория", Приложение С. Гауссовы случайные величины и гауссовы случайные поля следующим образом определяются корреляторы для набора случайных величин $q_1,\ldots,q_N$ с законом распределения
$$
F(q_1,\ldots,q_N)=\dfrac{1}{(2\pi)^{N/2}\left(\det{M}\right)}\int{\exp\left\{-\dfrac{1}{2}q_mM_{mn}q_n\right\}}.
$$
Вводится производящая функция
$$
Z(j_1,\dots,q_N)=\int{F(q_1,\dots,q_N)\mathrm{e}^{j_nq_n}d^Nq}=\exp\left\{\dfrac{1}{2}j_mD_{mn}j_n\right\},
$$
где $D=M^{-1}$. Сами корреляторы задаются выражением
$$
\left<q_{n_1},\ldots,q_{n_k}\right>=\left.\left[\dfrac{\partial^{k}Z}{\partial j_{n_1}\ldots \partial j_{n_k}}\right]\right|_{j_m=0}.
$$
Далее имеется следующее утверждение:
Цитата:
...справедливо утверждение, которое в квантовой теории поля называют теоремой Вика: для вычисления среднего $\left<q_{n_1}\ldots q_{n_{2k}}\right>$ необходимо величины $q_{n_1},\ldots q_{n_{2k}}$ разбить на пары,
каждой паре $(q_{n_r},q_{n_s})$ поставить в соответствие величину $D_{n_r n_s$, а разбиению --- произведение всех таких величин, и, наконец,
просуммировать по всем возможным разбиениям. Например, среднее от произведения четырех гауссовых случайных величин равно
$$
\left<q_pq_rq_sq_t\right>=D_{pr}D{st}+D_{ps}D_{rt}+D_{pt}D_{rs}.
$$
Верно и обратное утверждение: если все корреляторы случайных величин удовлетворяют теореме Вика с матрицей $D_{mn}$, а сама эта матрица задает положительно определенную квадратичную форму, то соответствующий набор случайных величин является гауссовым и характеризуется функцией распределения...

которая приведена вначале. Требуется доказать это утверждение и обратное. Прямое утверждение можно доказать, если записать общее выражение для производной прjизводящей функции $Z(j)$, а вот как доказать обратное утверждение, никаких идей совершенно. Пожалуйста, подскажите можно ли доказать прямое утверждение проще, чем через общее выражение для производной производящей функции, и в каком направлении двигаться, чтобы доказать обратное утверждение.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 21:05 


26/05/17
41
Москва
Должен Вам заметить, что в терминах здесь большая путаница, которая будет очень мешать в доказательствах. В книге плотность распределения сл. вектора часто называют функцией распределения, характеристическую функцию - производящей, элементы корреляционной матрицы - набором корреляторов. Формулы вообще никакой критики не выдерживают. Прочитайте про многомерное нормальное распределение где-нибудь в нормальном учебнике по теории вероятностей (Боровков или Ширяев), потом уже в книге Андерсона, если не найдете ответа. Для начала сформулируйте задачу в правильных общепринятых терминах.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 21:15 


05/10/10
152
Optimizator
разве у характеристической функции было бы не $\mathrm{e}^{ij_mq_m}$?

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 22:01 


26/05/17
41
Москва
Да, простите, я не совсем понял эти обозначения, показалось, что $j$ - это мнимая единица. С учетом того, что подвектор гауссового вектора тоже гауссов, прямое утверждение сводится к доказательству формулы для мат. ожидания произведения всех компонент. Наверное, так можно теорему Вика сформулировать:
если $\xi=(\xi_1,\ldots,\xi_n)\sim N(\vec 0,\Sigma)$, то ${\bf E} (\xi_1\ldots\xi_n)=0$ при нечетном $n$, а при четном $n=2m$
$$ 
{\bf E} (\xi_1\ldots\xi_{2m})=
\sum_{\{ \{i_1,j_1\},\ldots,\{i_m,j_m\} \}} \sigma_{i_1j_1}\ldots \sigma_{i_m j_m},
$$
где $\Sigma=\|\sigma_{ij}\|_{n\times n}$.
При $n=1,2$ это очевидно, а дальше, может, по индукции? Матрицу привести к блочно-диагональному виду? Для $n=3,4$ сначала попробовать.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:00 
Заслуженный участник
Аватара пользователя


23/07/08
10910
Crna Gora
Ещё одна ошибка в книге:
Цитата:
Задача 2. Показать, что нормировочный множитель в (C.2) и (C.5) равен $\mathscr N=(\det M)^{-1/2}(2\pi)^{-N/2}$.
Тут вместо $(\det M)^{-1/2}$ должно быть либо $(\det M)^{+1/2}$, либо $(\det D)^{-1/2}$.

Как быстро убедиться, что здесь ошибка: рассмотреть одномерное нормальное распределение. Единственный элемент матрицы $M$ равен $\frac 1{\sigma^2}$, это же значение имеет $\det M$. Тогда, согласно условию задачи, в нормировочном множителе $\sigma$ должно оказаться в числителе, что, как мы знаем, неверно.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:11 


05/10/10
152
Optimizator
спасибо, попробую. Но это у вас получается формулировка прямая, а вот главная сложность с обратной. Она будет звучать примерно таким образом: если для $\xi=(\xi_1,\ldots\xi_n)$
$$
\mathrm{E}(\xi_1...\xi_{n})=0
$$
для нечетных $n$, а для четных $n=2m$
$$
\mathrm{E}(\xi_1...\xi_{2m})=\sum_{\left\{\left\{i_1,j_1\right\},\ldots \left\{i_m,j_m\right\}\right\}}{\mathrm{E}(x_{i_1}x_{j_1})\ldots \mathrm{E}(x_{i_m}x_{j_m})},
$$
то плотность распределения $\xi$ имеет вид
$$
\exp\left\{-\dfrac{1}{2}\xi^T\Sigma^{-1}\xi\right\},
$$
где $\Sigma=||\mathrm{E}(x_ix_j)||_{n\times n}$

svv
это моя опечатка, конечно.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:12 
Заслуженный участник
Аватара пользователя


23/07/08
10910
Crna Gora
Почему Ваша? Так в книге.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение09.07.2017, 23:30 


05/10/10
152
svv
в книге в явном виде коэффициент выписан отдельно (и верно), я просто записала его в явном виде в функции.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 00:34 


26/05/17
41
Москва
Anna from Svetl в сообщении #1232473 писал(а):
... главная сложность с обратной. Она будет звучать примерно таким образом: если для $\xi=(\xi_1,\ldots\xi_n)$
$$
\mathrm{E}(\xi_1...\xi_{n})=0
$$
для нечетных $n$, а для четных $n=2m$
$$
\mathrm{E}(\xi_1...\xi_{2m})=\sum_{\left\{\left\{i_1,j_1\right\},\ldots \left\{i_m,j_m\right\}\right\}}{\mathrm{E}(x_{i_1}x_{j_1})\ldots \mathrm{E}(x_{i_m}x_{j_m})},
$$
то плотность распределения $\xi$ имеет вид
$$
\exp\left\{-\dfrac{1}{2}\xi^T\Sigma^{-1}\xi\right\},
$$
где $\Sigma=||\mathrm{E}(x_ix_j)||_{n\times n}$


Нет, сложнее (даже если исправить опечатки $x_i$ на $\xi_i$ :-) ). Контрпример к Вашему варианту: пара независимых центрированных дискретных с.в.
Ну и аргументами плотности лучше брать не с.в., а переменные-параметры, да и нормировочный множитель не забывать :-)

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 00:45 


05/10/10
152
Optimizator
Столько всяких учебников пересмотрела за последние пару дней, что с обозначениями совершенная каша :-)
Тогда как должна звучать обратная теорема? Вот не представляю, какое доказательство для нее имели в виду авторы учебника. По идее, должно быть что-то простое, потому что если уж они отдельно приложение выделили для гауссовых случайных величин, подразумевается, что читатель не имеет сверхзнаний в данной области.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 01:15 
Заслуженный участник
Аватара пользователя


23/07/08
10910
Crna Gora
Может быть, будет полезной такая идея.

Прежде всего, для аккуратности будем различать верхние и нижние индексы. Переменные $q^i$ будем трактовать как координаты, в них индекс по определению верхний. Тогда элементы матрицы $M$ должны иметь нижние индексы, так как выражение $M_{mn}\,q^m\,q^n$ инвариант. А элементы матрицы $D$ должны иметь верхние индексы, чтобы уравнение $D^{km}M_{mn}=\delta^k_n$ сохраняло вид при замене координат.

Рассмотрим среднее произведения двух (для простоты) гауссовых величин:
$$\langle q^p q^r \rangle=\dfrac{(\det{M})^{1/2}}{(2\pi)^{N/2}}\int q^p q^r {\exp\left(-\dfrac{1}{2}M_{mn}q^m q^n\right)\;d^Nq$$Перейдём к новым переменным $\tilde q^s$ с помощью линейной замены $q^p=T^p{}_{\tilde s}\,\tilde q^s$. При этом
$(\det M)^{1/2}=\dfrac {(\det \tilde M)^{1/2}}{\det T};\quad d^N q=\dfrac{D(q)}{D(\tilde q)}\,d^N \tilde q=\det T\,d^N \tilde q\;,$
где $\frac{D()}{D()}$ — якобиан преобразования координат.
Учитывая это, получим:$$\langle q^p q^r \rangle=\dfrac{(\det{\tilde M})^{1/2}}{(2\pi)^{N/2}}\int T^p{}_{\tilde s}\,\tilde q^s \;T^r{}_{\tilde t}\,\tilde q^t \;{\exp\left(-\dfrac{1}{2}\tilde M_{mn}\tilde q^m \tilde q^n\right)\;d^N\tilde q= T^p{}_{\tilde s}\,T^r{}_{\tilde t}\,\langle \tilde q^s \,\tilde q^t \rangle$$Мы получили, что набор средних $\langle q^p q^r \rangle$ при линейной замене координат преобразуется как набор компонент тензора. Если это и так было очевидно — прекрасно. :-) Аналогичный вывод получится для произведения более чем двух гауссовых величин.

Очевидно, что и набор величин $D^{pr}$ (или, в более общем случае, их произведений) преобразуется по тому же закону. А раз так, достаточно доказать теорему в какой-либо одной «удобной» системе координат. Такой системой является та, в которой матрица $\tilde M$ имеет диагональный вид. Тогда $\tilde D$ также диагональна. При этом совместная плотность распределения величин $\tilde q^i$ равна произведению плотностей отдельных величин, поэтому $\tilde q^i$ независимы. Записанный выше кратный интеграл для вычисления среднего представляется в виде произведения простых интегралов.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 15:04 


05/10/10
152
svv
спасибо, очень интересный подход. Но я не совсем понимаю, как доказывать теорему в случае диагональной матрицы $M$? Тогда от нуля будут отличны только средние от произведения четного числа одинаковых величин, например, $\left<\tilde{q}_{i_1}^2\tilde{q}_{i_2}^4\tilde{q}_{i_3}^2\right> =\sigma_{i_1 i_1}^2\cdot \sigma_{i_2 i_2}^4\cdot 3!!\cdot \sigma_{i_3 i_3}^2=3!!\cdot D^{i_1 i_1}\left(D^{i_2 i_2}\right)^2D^{i_3i_3}$, если $\tilde{M}_{ij} = \dfrac{1}{\sigma_{ii}^2}$ при $i=j$ и $\tilde{M}_{ij}=0$ при $i\neq j$. Как перейти к доказательству?

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 15:25 
Заслуженный участник
Аватара пользователя


23/07/08
10910
Crna Gora
Пока не думал об этом, не знаю.

Хочу заметить, что в рамках того же подхода можно сделать ещё один небольшой шаг: линейным преобразованием $q$ привести матрицы $M$ и $D$ к единичным. Это возможно потому, что в силу положительной определённости $M$ после приведения к диагональному виду на диагонали будут стоять строго положительные значения.

Верю, что в любом случае свойство независимости случайных величин $\tilde q^i$ будет полезным, и применение ему найдётся.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 20:30 


05/10/10
152
svv
ладно, буду думать. Может что-нибудь получится.

 Профиль  
                  
 
 Re: Корреляторы для нормального распределения
Сообщение10.07.2017, 21:48 
Заслуженный участник
Аватара пользователя


23/07/08
10910
Crna Gora
Итак, линейной заменой переменных мы привели матрицы к виду $M=D=E$. Вычислим среднее произведения гауссовых величин с помощью кратного интеграла. Сейчас удобно все индексы писать внизу, вверху будут степени.

Чтобы задать некоторое произведение случайных величин из гауссова набора, достаточно указать, в какой степени $n_i$ каждая из величин $q_i$ входит в произведение. (Если $q_i$ не входит в произведение, то $n_i=0$.)$$(q_1)^{n_1}\,(q_2)^{n_2}\ldots (q_N)^{n_N}=\prod\limits_{i=1}^N (q_i)^{n_i}$$Среднее значение этого произведения по общей формуле равно$$\dfrac{1}{(2\pi)^{N/2}}\int\limits_{\mathbb R^N}\left(\prod\limits_{i=1}^N (q_i)^{n_i}\right)\,\exp\left(-\dfrac{1}{2}\sum\limits_{k=1}^n (q_k)^2 \right)\,d^N q=\prod\limits_{i=1}^N \left\{\dfrac{1}{\sqrt{2\pi}}\int\limits_{-\infty}^{+\infty} x^{n_i}\,e^{-x^2/2}\,dx\right\}$$Интеграл в фигурных скобках равен нулю, если $n_i$ нечётное, и $(n_i-1)!!$, если чётное (см. Рыжик и Градштейн, 3.461-2, стр.351). Далее считаем все $n_i$ чётными, тогда$$\langle \prod\limits_{i=1}^N (q_i)^{n_i}\rangle=\prod\limits_{i=1}^N (n_i-1)!!$$Остаётся получить то же значение, исходя из сумм произведений $D_{pq}$. Учитывая вид полученного результата и то, что $D_{pq}=\delta_{pq}$, можно ожидать, что впереди — чистая комбинаторика.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 28 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group