2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Ранговые корреляции случайных процессов
Сообщение19.02.2017, 14:16 


07/10/15

2400
Экспериментируя с нормальными псевдослучайными векторами (генератор matlab) обнаружил следующую закономерность.
Все парные корреляции компонент векторов, по абсолютной величине, укладываются в диапазон $\Delta R \approx\frac{3}{\sqrt{N-2}}$, т. е. выполняется хорошо известное правило 3-х сигм. Для ранговых корреляций Спирмена и Кендалла наблюдается то же самое, разумеется $\sigma$ у них другие, но правило 3-х сигм выполняется так же хорошо.

После этого я выполняю декоррелирующее преобразование методом главных компонент, обнуляющее все взаимные корреляции Пирсона. Ранговые корреляции при этом не обнуляются, но диапазон их варьирования сужается в 3 раза, т.е. от 3-х сигм до 1 сигмы. Проверялось многократно, получается всегда примерно тоже самое.

Как это можно интерпретировать? Почему ранговые корреляции не обнуляются, ведь насколько я знаю корреляции Спирмена можно вычислять аналогично корреляциям Пирсона, заменив значения на их ранги. И почему диапазон их варьирования уменьшается именно до 1 сигмы, а не до 2-х, например, или до 1,5?

 Профиль  
                  
 
 Re: Ранговые корреляции случайных процессов
Сообщение19.02.2017, 19:53 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
Потому, что переход от значений переменной к рангам это нелинейное преобразование. Точное выражение написать затрудняюсь, поскольку ранг элемента зависит не только от его значения, но и от значений всех прочих элементов выборки. А приблизительно ранг будет $R(x_i)=nF(x_i)$ где $F(x)$ функция распределения величины. Нелинейные же преобразования корреляции не сохраняют.

 Профиль  
                  
 
 Re: Ранговые корреляции случайных процессов
Сообщение20.02.2017, 13:06 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
А насчёт "отчего 3 сигмы" - а при изменении длин векторов это сохраняется?

 Профиль  
                  
 
 Re: Ранговые корреляции случайных процессов
Сообщение20.02.2017, 15:03 


07/10/15

2400
да, всегда сохраняется

-- 20.02.2017, 16:07 --

сначала $r_{max}\approx\rho_{max}\approx3\sigma$, потом, после декорреляции по Пирсону $r_{max}\approx0$, а по Спирмену $\rho_{max}\approx \sigma$

-- 20.02.2017, 16:18 --

У меня была идея, что доверительные интервалы корреляций Пирсона и Спирмена расширяются из за уменьшения числа степеней свободы главных компонент по сравнению с исходными сигналами, и расширяются они по разному. Но тогда всё бы зависело от числа компонент и длинны векторов, а здесь примерно всегда одно и то же. После декорреляции ранговые корреляции продолжают распределятся в диапазоне $1\sigma$.

-- 20.02.2017, 16:20 --

причём распределяются они примерно по нормальному закону, что до декорреляции, что после неё.

-- 20.02.2017, 17:00 --

Зато из этого следует полезный вывод: нелинейные преобразования главных компонент изменяют их взаимные корреляции, но они никогда не смогут увеличить эти корреляции более $1\sigma$ (для нормально распределённых величин - можно использовать как критерий нелинейности).
Т. е. различия между корреляциями Пирсона и Спирмена можно рассматривать как своеобразный запас на нелинейные трансформации. Но вот почему именно 1 сигма - это продолжает оставаться загадкой ...

 Профиль  
                  
 
 Re: Ранговые корреляции случайных процессов
Сообщение21.02.2017, 11:14 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
Я бы предполагал, что по мере роста длин векторов корреляции Спирмена тоже должны падать. Но, поскольку дисперсия коэффициентов при этом падает, эффект маскируется, и проявился бы при очень сильной разнице длин, в десятки и сотни раз. Впрочем, тут желателен численный эксперимент.
Что же до
Andrey_Kireew в сообщении #1194092 писал(а):
нелинейные преобразования главных компонент изменяют их взаимные корреляции, но они никогда не смогут увеличить эти корреляции более $1\sigma$

то давайте рассмотрим две величины. Одна из них стандартная нормально распределённая $x=N(0,1)$, а вторая
$y=\begin{cases}
-x,&\text{если $|x|\le p$;}\\
x,&\text{если $|x|> p$.}
\end{cases}
$
где p - параметр. Очевидно, при $p=0$ корреляция между x и y единица (это две тождественные величины), а при $p=\infty$ минус единица (противоположные), и существует значение p, при котором корреляция x и y нулевая. Соответственно, вычисление ГК для ортогональных величин оставит их неизменными. Но возведём их в достаточно высокую нечётную степень, и получим сколь угодно близкую к единице корреляцию преобразованных величин.
Если вспомнить, что корреляции Спирмена вычисляются по той же формуле, что и Пирсона, только с заменой значений их рангами, взять в качестве рангов их приближения функцией распределения $r_i=nF(x_i)$, а функцию нормального распределения разложить в ряд Тейлора, получим
$\Phi(x)=0.5+I(x)=0.5+\frac 1 {2\pi}\Sigma_{i=0}^\infty \frac {(-1)^nx^{2n+1}}{2^n n!(2n+1) }\approx 0.5+\frac 1 {2\pi}(x-x^3/6+x^5/40+\ldots)$
Постоянный сдвиг и общий сомножитель для корреляции несущественен, член с x в первой степени компенсирован при ортогонализации, а кубический и последующие - нет.

 Профиль  
                  
 
 Re: Ранговые корреляции случайных процессов
Сообщение21.02.2017, 16:09 


07/10/15

2400
Интересное объяснение

 Профиль  
                  
 
 Re: Ранговые корреляции случайных процессов
Сообщение22.02.2017, 11:12 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
Евгений Машеров в сообщении #1193822 писал(а):
А приблизительно ранг будет $R(x_i)=nF(x_i)$ где $F(x)$ функция распределения величины.


Во избежание недоразумений. Имеется в виду "приблизительно", если F(x) это функция распределения, исходя из которой генерировались случайные величины. Если F(x) эмпирическая функция распределения, то формула будет сколь точна, столь бесполезна :?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: SomePupil


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group