2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Как связаны регрессия и корреляция?
Сообщение10.07.2013, 15:16 


28/11/11
2884
Пытаюсь понять, как можно наглядно представить коэффициент корреляции. (Чтобы его можно было оценить "на глаз" из диаграммы рассеяния.)
По-видимому, коэффициент корреляции $r$ связан с (нормированным) углом наклона регрессии (вроде линию регрессии на глаз провести можно).
Какой вид имеет эта связь? Хотелось бы увидеть формулу.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение10.07.2013, 15:38 
Заслуженный участник
Аватара пользователя


11/03/08
9970
Москва
"На глаз" - по форме эллипса рассеяния.
Не на глаз - строите регрессии Y на X и X на Y. Косинус угла меж ними равен коэффициенту корреляции.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение10.07.2013, 15:56 


28/11/11
2884
Евгений Машеров в сообщении #744858 писал(а):
"На глаз" - по форме эллипса рассеяния.

Я не точно выразился: хотелось бы на глаз оценить сколько-нибудь количественно, а не качественно при сравнении двух $r$.
Тогда baloon rule?

Евгений Машеров в сообщении #744858 писал(а):
Косинус угла меж ними равен коэффициенту корреляции.

Разве? :shock:

-- 10.07.2013, 16:14 --
Евгений Машеров
Не как косинус угла, а как среднее геометрическое вроде:
$$
r=\pm\sqrt{b_{Y\cdot X}\,\cdot\,b_{X\cdot Y}}
$$
Правильно?

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение10.07.2013, 16:19 
Заслуженный участник
Аватара пользователя


11/03/08
9970
Москва
Ну да, произведение наклонов это коэффициент детерминации, а коэффициент корреляции корень из него.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение10.07.2013, 16:28 


28/11/11
2884
longstreet в сообщении #744867 писал(а):
$$
r=\pm\sqrt{b_{Y\cdot X}\,\cdot\,b_{X\cdot Y}}
$$

А почему это так? Откуда это с наглядностью следует?

-- 10.07.2013, 16:29 --

И, всё-таки, как это связано с углом наклона линии регресии (что было бы более очевидно)?

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение10.07.2013, 17:29 
Аватара пользователя


24/05/13
49
longstreet в сообщении #744882 писал(а):
И, всё-таки, как это связано с углом наклона линии регресии (что было бы более очевидно)?


Углом наклона которой из линий? X на Y, или Y на X ?

При $r=0$ эти линии перпендикулярны.
При $|r|=1$ эти линии совпадают.
А наклон может быть любой.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение11.07.2013, 08:10 
Заслуженный участник
Аватара пользователя


11/03/08
9970
Москва
Непосредственно выразить безразмерный коэффициент корреляции через наклон линии регрессии, величину размерную и зависящую от выбора единиц измерения (к примеру, если коэффициент регрессии веса человека на рост, выраженные в сантиметрах и килограммах, равен 1 с размерностью килограмм/сантиметр, то для измерений в фунтах и дюймах уже будет 5.6, а если пуды и аршины, то 0.00088) Наклон же линии регрессии X на Y имеет размерность, обратную размерности наклона в регрессии Y на X, и их произведение уже безразмерно. Если выписать выражения для этих наклонов и перемножить их - увидим возведённое в квадрат выражение для корреляции.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение13.07.2013, 20:03 


28/11/11
2884
Евгений Машеров, про косинус угла -- Вы были правы. Но только не между двумя линиями регрессии, а между двумя векторами в $n$-мерном пространстве исходных данных. Я пока ещё не разобрался в такой интерпретации. Две ссылки с описанием такого подхода:
1) Thirteen Ways to Look at the Correlation Coefficient, подход №8;
2) А more elegant view of the correlation coefficient.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение23.07.2013, 03:51 


28/11/11
2884
Непонятный для меня момент (из второй ссылки, см. предыдущее сообщение):
Цитата:
we normalize $x$ and $y$ by subtracting from each data point the mean of the data set

Именно, для коэффициента корреляции осуществляется переход от
$$
r=\frac{\sum u v}{\sqrt{\sum u^2}\sqrt{\sum v^2}}
$$
путём замены/нормализации $u=x-\hat{x}$ и $v=y-\hat{y}$ к
$$
r=\frac{\sum (x-\hat{x})(y-\hat{y})}{\sqrt{\sum (x-\hat{x})^2}\sqrt{\sum (y-\hat{y})^2}}
$$

Собственно, зачем эта замена делается, и почему она именно такая (вычитая среднее арифметическое, а не нормализация к другой шкале)?
Вообще, границы интервала $[-1;1]$ при этой "нормализации" не изменяются никак -- так что это такая за нормализация?

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение23.07.2013, 07:54 
Аватара пользователя


21/01/09
3926
Дивногорск
longstreet в сообщении #744853 писал(а):
По-видимому, коэффициент корреляции $r$ связан с (нормированным) углом наклона регрессии (вроде линию регрессии на глаз провести можно).
Какой вид имеет эта связь? Хотелось бы увидеть формулу.

$r_{xy}=a\frac{\sigma_x}{\sigma_y}$ для линейной регрессии $y=ax+b$.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение23.07.2013, 08:11 
Заслуженный участник
Аватара пользователя


11/03/08
9970
Москва
Замена делается для инвариантности к выбору начала отсчёта (зависимость средней температуры от высоты над уровнем моря - чтобы выбор градусов Кельвина и Цельсия, а равно высоты от Кронштадтского футштока или от моря в Анталии, Констанцы или Остенде не повлиял на результат)

(Оффтоп)

Изображение

Инвариантность к выбору единиц измерения обеспечивается делением на знаменатель, дающей безразмерную величину (обычно всё же, по крайней мере в русской литературе, такое вычитание именуют "центрированием", а "нормирование" - деление на стандартное отклонение).
Среднее арифметическое не является единственно возможным выбором, можно использовать медиану, скажем, или середину размаха. Однако оно легко считается, широко используется в разных сферах и, last, but not least, позволяет упростить многие выкладки.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение23.07.2013, 10:00 
Заслуженный участник
Аватара пользователя


11/03/08
9970
Москва
longstreet в сообщении #748490 писал(а):
Вообще, границы интервала $[-1;1]$ при этой "нормализации" не изменяются никак -- так что это такая за нормализация?


Ну, принципиально они те же, в том смысле, что и без нормализации не выйдут за плюс-минус единицу.
Но попробуйте посчитать без вычитания. Простенький пример.
Х=(99, 100, 101) У=(-1, 0, 1)
Очевидно, точная линейная связь. R=1
А теперь то же без вычитания средних.
$r=\frac {-99+0+101} {173.21\cdot 1.414}=\frac 2 {244.92}=0.0082$
То есть формально "попали в интервал", а фактически никакой информации о связи не получено.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение24.07.2013, 03:06 


28/11/11
2884
Евгений Машеров в сообщении #748503 писал(а):
Инвариантность к выбору единиц измерения обеспечивается делением на знаменатель

Так делением или вычитанием (там же замена $u=x-\hat{x}$, а не $u=\frac{x}{\hat{x}}$)?

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение24.07.2013, 06:07 
Заслуженный участник
Аватара пользователя


11/03/08
9970
Москва
Вычитание убирает зависимость от начала отсчёта (Цельсий или Кельвин, Фаренгейт или Ренкин, Кронштадт или Остенде...), деление убирает зависимость от единицы измерения (пикофарады или сантиметры. фунты или килограммы, футы или метры...). Только одного действия недостаточно.

 Профиль  
                  
 
 Re: Как связаны регрессия и корреляция?
Сообщение24.07.2013, 13:24 


28/11/11
2884
Кажется, понятно! Евгений Машеров, спасибо большое Вам!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 17 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group