2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Ковариация и корреляция
Сообщение18.01.2024, 15:07 
Аватара пользователя
Всем доброго здравия. Уважаемые, возник вопрос. Существует понятие коэффициента корреляции для 2-х случайных величин:

$\rho =\frac{cov(X,Y)}{\sigma_x \sigma_y} = \frac{M[(X-\mu_x)(Y-\mu_Y)]}{\sigma_x \sigma_y} $ , или в выборочном случае: $\rho =\frac{\bar{xy}-\bar{x}\bar{y}}{\bar{S_x} \bar{S_y}} $ . Это понятие, вроде определяется для общего случая. Но его называют линейным коэффициентом корреляции. А почему его называю линейным ? Ведь таким он определяется для общего случая.

 
 
 
 Re: Ковариация и корреляция
Сообщение18.01.2024, 15:14 
Потому, что он характеризует только силу линейной взаимосвязи, и даже формально связан с коэффициентом наклона линейной регрессии. Есть и нелинейные корреляции, например Спирмена, Кендалла и т.п., одинаково чувствительные как к линейным так и нелинейным зависимостям. Но они менее мощные.

 
 
 
 Re: Ковариация и корреляция
Сообщение18.01.2024, 16:58 
Аватара пользователя
Тут небольшая неточность. Он коэффициент линейной корреляции. Хотя указанное Вами наименование тоже распространено. Поскольку полноценно характеризует лишь наличие и силу линейной зависимости. В нелинейном случае он может вообще не работать (простейший пример - корреляции между x и $x^2$ или $|x|$, если иксы разбросаны симметрично около нуля - связь точная, функциональная, но корреляция равна нулю.)

 
 
 
 Re: Ковариация и корреляция
Сообщение18.01.2024, 19:35 
Аватара пользователя
Stensen в сообщении #1626392 писал(а):
Но его называют линейным коэффициентом корреляции. А почему его называю линейным ?

Просто так назвали... :D Если Вы вместо $Y$ возьмете $Y^2$ то опять же получите коэффициент корреляции (линейный) между $X$ и $Y^2$.
Вообще уравнения регрессии относятся к линейному программированию потому, что они линейны относительно коэффициентов, а переменные могут быть любыми - квадратами ч.-либо, логарифмами и пр.
Например $Y=k_0+k_1X+k_2X^2+k_3X^3+k_4X^4...$ ур-ние линейное относительно коэффициентов .

 
 
 
 Re: Ковариация и корреляция
Сообщение18.01.2024, 21:05 
Аватара пользователя
Amw в сообщении #1626416 писал(а):
относятся к линейному программированию


Вообще-то линейное программирование это метод оптимизации при линейных ЦФ и ограничениях. К линейной регрессии отношения не имеет.

 
 
 
 Re: Ковариация и корреляция
Сообщение18.01.2024, 21:23 
Аватара пользователя
Согласен. Перемешалось маленько за давностью лет.

 
 
 
 Re: Ковариация и корреляция
Сообщение19.01.2024, 09:24 
Аватара пользователя
Stensen в сообщении #1626392 писал(а):
Это понятие, вроде определяется для общего случая.


Считать можно для любых данных. Но если зависимость не линейная, выводы будут неосмыслены. Если зависимость нелинейная, но монотонная, есть резон использовать Спирмена (или Кэнделла). При существенно нелинейной, наподобие вышеприведенного примера с квадратом, нужны другие методы (скажем, было такое "корреляционное отношение", где использовалось разбиение на ячейки, есть ядерные оценки и т.п.).

 
 
 
 Re: Ковариация и корреляция
Сообщение19.01.2024, 10:20 
Аватара пользователя
Евгений Машеров в сообщении #1626465 писал(а):
Считать можно для любых данных. Но если зависимость не линейная, выводы будут неосмыслены.
Т.е осмысленны только для линейной корреляции.
Евгений Машеров в сообщении #1626465 писал(а):
При существенно нелинейной, наподобие вышеприведенного примера с квадратом, нужны другие методы
Всё равно, первым шагом можно пытаться аппроксимировать полиномом (регрессионный анализ), а если переменная одна - просто предварительно на график посмотреть... :D
Дальше, если есть какие-то теории процесса, уже пытаться моделировать аналитически.

 
 
 [ Сообщений: 8 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group