2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2, 3  След.
 
 Обобщение корреляции на три величины
Сообщение04.03.2023, 13:27 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
Известна формула коэффициента корреляции
$$\rho=\frac{EX_1X_2-EX_1EX_2}{\sqrt{DX_1DX_2}},$$
он бывает на отрезке $[-1,1]$, что дает ограничения и на $EX_1X_2$. А что можно сказать про $EX_1X_2X_3$? Известен ли какой-то коэффициент, который выражается через это среднее и отражает зависимость трех величин, и в каких они могут быть границах? Для упрощения задачи, допустим, все величины $X_i$ со значениями на отрезке $[0,1]$ (тогда границы среднего тройного произведения 0 и 1 тривиальны).

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение04.03.2023, 13:34 
Заслуженный участник


18/09/21
1756
Сведите к предыдущему случаю: $E(X_1X_2X_3)=E((X_1X_2)X_3)$.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение04.03.2023, 14:28 


27/06/20
337
Если у нас есть случайный вектор
$\begin{bmatrix}
x_1 \\
x_2 \\
x_3
\end{bmatrix}$
то описать одним коэффициентом линейную зависимость $x_1$ от $x_2$ и $x_3$ с одной стороны, $x_2$ от $x_1$ и $x_3$ с другой стороны и $x_3$ от $x_1$ и $x_2$ с третьей вероятно не получится.

Поэтому берут корреляционную матрицу для этого вектора
$\begin{bmatrix}
r_{1,1} & r_{1,2} & r_{1,3}\\
r_{2,1} & r_{2,2} & r_{2,3}\\
r_{3,1} & r_{3,2} & r_{3,3}
\end{bmatrix}$
И для каждого элемента вектора (на примере первого) находят такой коэффициент:
$r_{1,\ 23} = \sqrt{ \begin{bmatrix}
r_{1,2} & r_{1,3}\end{bmatrix}  \times \begin{bmatrix}
r_{2,2} & r_{2,3}\\
r_{3,2} & r_{3,3}
\end{bmatrix}^{-1} \times
\begin{bmatrix}
r_{1,2} \\
r_{1,3}
\end{bmatrix} } $
Это не ограничивается зависимостью одного элемента вектора от двух других. То же для одного от трех и т.д.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение04.03.2023, 17:28 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
zykov в сообщении #1584243 писал(а):
Сведите к предыдущему случаю:
Получится что-то сильно несимметричное и громоздкое.
ipgmvq в сообщении #1584246 писал(а):
Если у нас есть случайный вектор
Это я знаю, спасибо. Речь идет об описании более тонкой зависимости, не линейной. Например, три величины могут быть вообще независимы попарно, но зависимы в совокупности, и тройное произведение это может уловить.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение04.03.2023, 18:24 
Заслуженный участник


18/09/21
1756
alisa-lebovski в сообщении #1584269 писал(а):
Речь идет об описании более тонкой зависимости, не линейной
Ну корреляция - это всё же линейная вещь.
Например, $X$ и $Y$ могут быть нелинейно зависимы, так что $X^2+Y^2=1$ всё время.
$X=\cos \varphi$, $Y=\sin \varphi$, где $\varphi$ равномерно распределено на $[0,2\pi]$.
Корреляция не покажет зависимости.

Если интересует именно нелинейность, то это другие вещи, что-то вроде "машинного обучения".
Если нужно просто анализировать три величины, то лучше делать линейный анализ.
Типичный линейный метод - Principal component analysis.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение04.03.2023, 18:37 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
zykov в сообщении #1584282 писал(а):
Ну корреляция - это всё же линейная вещь.
Ладно, я неудачно выразилась. Речь идет о неком показателе зависимости, который не называется корреляцией.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение04.03.2023, 18:48 
Заслуженный участник


18/09/21
1756
Всё жа надо определиться, линейный это анализ или нелинейный.
Если нелинейный, то там всё сложно. В области Machine Learning (ML) этим занимаются.
(Вот представьте, что все три зависимы, так что лежат на какой-то кривой, но эта кривая - запутанный клубок в кубике 1x1x1.)
Если линейный, то PCA тут достатчно. Для трёхмерной величины из него можно соорудить два коэффициента - степень одномерности и степень двумерности.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение04.03.2023, 19:12 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
По-моему, в исходном сообщении все было четко сформулировано. Линейность не предполагается. Тема была о величине $EX_1X_2X_3$. В частности, для независимых в совокупности величин верно $EX_1X_2X_3=EX_1EX_2EX_3$. Если взять $EX_1X_2X_3-EX_1EX_2EX_3$, то будет равно нулю. Иначе оно может быть не равно нулю, даже если попарно величины независимы. Возникает вопрос - можно ли выражение $EX_1X_2X_3-EX_1EX_2EX_3$ поделить на что-то подходящее и получить некий коэффициент, тоже на отрезке $[-1,1]$? Но это вряд ли. Или делать что-то более хитрое, но в конечном счете получить некий коэффициент, отражающий зависимость, в определенных границах? Или, может быть, взять за основу $E((X_1-EX_1)(X_2-EX_2)(X_3-EX_3))$?

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение05.03.2023, 01:47 


27/06/20
337
alisa-lebovski в сообщении #1584296 писал(а):
Или, может быть, взять за основу $E((X_1-EX_1)(X_2-EX_2)(X_3-EX_3))$?
Можно вероятно взять и "нормализовать" произведением $((E(X_1-EX_1)^3)^{1/3})((E(X_2-EX_2)^3)^{1/3})((E(X_3-EX_3)^3)^{1/3})$ :?
Однако что за франкенштейн получится у нас, куда будет смещена его выборочная оценка, каким тестом подтвердить, что эта выборочная оценка на самом деле отличается от нуля, и какой от него практический толк, ведь такая зависимость при полном отсутствии попарной зависимости в природе редкость, разве нет?

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение05.03.2023, 08:14 
Заслуженный участник


24/08/12
1053
alisa-lebovski
Вроде есть такой метод, чтобы ухватить степень корелляции/зависимости, можно вычислять дробную (хаусдорфову и т.д.) размерность гиперповерхности на которой лежат тройки $X_1,X_2,X_3$.
В данном случае (трех величин) она будет с нуля до 3 (полная независимость); например если $X_1=f_1(X_3),X_2=f_2(X_3),X_3$ то они будут "ложится" на одномерную кривую (коеффициент получится ~1), если $X_1=f(X_3,X_2),X_2,X_3$ то на двухмерной поверхности (коеффициент получится ~2) и т.д.
https://en.wikipedia.org/wiki/Correlation_dimension

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение05.03.2023, 10:39 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Грубоэмпирический подход. Нарезаем интервалы, считаем попадания в ячейки. Проверяем гипотезу, что вероятность попадания в ячейку i по первой переменной, j по второй, k по третьей $P_{ijk}=\frac {n_i m_j q_k} N$
где $n_i$ число попаданий в i-тый интервал первой переменной, аналогично для прочих, N - общее число наблюдений.
Хи-квадрат, скажем.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение05.03.2023, 11:24 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
Я думаю, нормализовать лучше так:
$$r=\frac{E((X_1-EX_1)(X_2-EX_2)(X_3-EX_3))}{(DX_1DX_2DX_3)^{1/2}},$$
тогда коэффициент инвариантен относительно сдвиго-масштабных преобразований, как и обычный коэффициент корреляции. Осталось выяснить, будет ли он на $[-1,1]$ или в каких-то еще границах. Задача сводится к следующей: в каких границах $EX_1X_2X_3$, если $EX_1=EX_2=EX_3=0$ и $DX_1=DX_2=DX_3=1$. Похоже на многомерную задачу вариационного исчисления, но может быть, как-то проще делается?

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение05.03.2023, 11:37 
Заслуженный участник


18/09/21
1756
Внизу степень $\frac12$, а не $\frac32$.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение05.03.2023, 11:37 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Трикорреляция - метод известный, применительно к анализу временных рядов.
$\int _{-\infty }^{\infty }f^{*}(x)f(x+s_{1})f(x+s_{2})dx$
(Звёздочка тут комплексное сопряжение)
Используется наряду с биспектром, преобразованием Фурье от трикорреляции. Для гауссовских случайных процессов смысла не имеет, это для негауссовскости. Есть обобщения и на более высокий порядок.
Практически применяется в обработке сигналов (речевых, изображений, электроэнцефалограмм). В частности, существует прибор "Биспектральный анализатор" для контроля глубины наркоза (но точный алгоритм его работы фирмой-производителем не разглашается, помимо биспектра используются и иные показатели).
В определённом смысле можно сказать, что это характеристика формы сигнала (для той же ЭЭГ практически важно, что волны могут быть и не правильными синусоидами, а заостренными, притуплёнными, аркообразными, комплексами "пик-волна" и т.п.; а на обычном частотном спектре во всех случаях видны две частоты, но не их фазовое соотношение, задающее форму).
Есть ещё такой подход
https://pubmed.ncbi.nlm.nih.gov/26098298/
(полный текст есть на Либгене).
Но там какая-то специфика генетического анализа.
Вообще же использование тройного произведения не всегда даст нужную информацию. Контрпример навскидку.
Случайно выбирается точка на сфере (для определённости центр в нуле, радиус единица).
Исследуемые величины - координаты этой точки X,Y,Z.
Очевидно, матожидание тройного произведения равно нулю.
Но зная две величины, знаем третью с точностью до знака.
В данном случае размерность поверхности, на которой лежат точки - 2. Так что можно какие-то методы оценки размерности использовать, но мой ограниченный опыт показывает, что вычислительные затраты большие, а на реально доступных объёмах выборок точность никакая. Однако это очень частное мнение, вероятно, где-то и заработает.

 Профиль  
                  
 
 Re: Обобщение корреляции на три величины
Сообщение05.03.2023, 11:40 
Заслуженный участник


18/09/21
1756
alisa-lebovski в сообщении #1584371 писал(а):
Осталось выяснить, будет ли он на $[-1,1]$ или в каких-то еще границах.
Если все три величины связанны так что просто являются одной и той же величной, то $E[X^3]$ - это третий момент, который не имеет отношения ко второму моменту.
Т.е. может быть что угодно.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 34 ]  На страницу 1, 2, 3  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group