2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 19:02 
Было у меня 50 значений х и соответствующих им 50 значений y
Я нашел с верхним подчеркиванием $x=34,97$, $y=10,05$, $xy=323,90$
$\sigma_x=1,78$ $\sigma_y=0,42$
По этой формуле я нашел коэффициент корреляции

$r=\frac{xy-x\cdot y}{\sigma_x\cdot\sigma_y}$

$r=\frac{323,90-34,97\cdot 10,05}{1,78\cdot0,42}=-37,21$

Может быть такой коэффициент корреляции ? Если такой коэффициент может быть, я думаю, что между x и y существует зависимость. Поправте меня, если что.

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 19:37 
а данные выложить можете?

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 19:49 
Конечно, не может - он по модулю не больше 1. Приведите формулы, которые Вы использовали.

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:13 
deleted :?

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:32 
x y
35,6 10,1
37,6 10,3
31,8 9,9
35,6 10,1
28,7 9,4
34,3 9,9
35 9,7
36,4 10,2
34,1 10,6
34,5 9,4
34,7 9,7
35,1 10,7
36 9,5
32,3 10,3
35,2 9,9
33,5 9,9
34 10,5
36,4 10,1
34,1 10,2
34,9 10,6
34,4 9,8
32,1 9,5
36,5 10,5
35,6 9,8
34,4 10,2
37,6 10,2
35,4 10,3
37,3 10,2
35,8 10,8
35,8 9,8
37 10,1
34,8 10,2
35,2 10,1
34 10,3
36,1 10
35 9,9
32,8 10,3
32,7 9,9
35 10
36,7 10,8
36 9,7
35,4 10,1
32,8 9,3
36,7 10,6
33,5 10,7
34,4 9,9
35,6 10,1
34,3 9,3
35,7 8,8
40 10,4

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:37 
SHAZAM OUTPUT
*********************************************************************
* SHAZAM - FOR LINUX SITE NO. 1234 *
* *
* ** Copyright (C) 2000 by K.J. White - All Rights Reserved ** *
* *
* FOR USE ONLY BY: SHAZAM USERS *
* AT: ECONOMETRICS.COM *
* *
* *
* If this does not describe you then you have stolen this copy *
* and if you type anything except STOP or HELP SHAZAM you *
* agree to send payment within 7 days for a software license *
* *
* *
* *
* FOR USE ON SINGLE COMPUTER ONLY - NO COPIES PERMITTED *
*********************************************************************
Hello/Bonjour/Aloha/Howdy/G Day/Kia Ora/Konnichiwa/Buenos Dias/Nee Hau/Ciao
Welcome to SHAZAM - Version 10.0 - JUL 2004 SYSTEM=LINUX PAR= 781
|_ SAMPLE 1 50
|_ READ X Y
2 VARIABLES AND 50 OBSERVATIONS STARTING AT OBS 1

|_ stat x y / pcorrela
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
X 50 34.968 1.7940 3.2185 28.700 40.000
Y 50 10.052 0.42197 0.17806 8.8000 10.800

CORRELATION MATRIX OF VARIABLES - 50 OBSERVATIONS


X 1.00000
Y 0.29825 1.00000
X Y
|_ STOP



Выделено мной

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:53 
$\bar{x}=\frac{ x_1 \cdot d_1 + ..+x_n\cdot d_n}{h}$
где d_1 - количество повторений x_1
h - количество пар x и у
$\bar{y}=\frac{ y_1 \cdot p_1 + ..+y_n\cdot p_n}{h}$
где p_1 - количество повторений y_1
$\overline {x\cdot y}=\frac{x_1\cdot y_1\cdot k_1 + ... +x_n\cdot y_n\cdot k_n}{h}$
где k_1 - количество повторений x_1 и y_1
$\sigma_x=\sqrt{\frac{{x_1^2}\cdot d_1+ ... + x_n^2\cdot d_n}{h}  -{\bar{x}}^2}$
$\sigma_y=\sqrt{\frac{{y_1^2}\cdot d_1+ ... + y_n^2\cdot p_n}{h}  -{\bar{y}}^2}$

формул нам на паре не дале.. мы сразу числа подставляли с задачи с условия, считал по этим формулам

-- Чт янв 06, 2011 20:04:45 --

Формулы, по примеру, какой в тетрадке есть, написал. Поправте, меня. Считал с помощью Exsel по этим формулам.

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 21:06 
по Вашим выкладкам:
$323,90-34,97 \cdot 10,05=0,2213$
$1,78\cdot 0,42=0,76$
$\frac {\ 0,2213} {\ 0,76}$\approx 0,29$

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 21:11 
Формулы вроде правильные, но проверять уж извините лень - коэффициент корреляции не может быть больше по модулю чем 1.

Вообще, формулы такие обычно используются:
$$
\bar{x} = \frac{1}{N}\sum\limits_{i=1}^N x_i
$$
$$
\bar{y} = \frac{1}{N}\sum\limits_{i=1}^N y_i
$$
Вы здесь не считаете никаких повторений, $N$ - просто число наблюдений, $(x_i,y_i)$ - $i$-тое наблюдение. Далее

$$
\overline{xy} = \frac{1}{N}\sum\limits_{i=1}^N x_i y_i
$$
$$
\sigma_x =\sqrt{\frac{1}{N-1}\sum\limits_{i=1}^N (x_i - \bar{x})^2}
$$
$$
\sigma_y =\sqrt{\frac{1}{N-1}\sum\limits_{i=1}^N (y_i - \bar{y})^2}
$$
и наконец
$$
\rho = \frac{\overline{xy} - \bar{x}\bar{y}}{\sigma_x\sigma_y}.
$$

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 21:36 
Я не много не понимаю формулы, можете меня поправить, например
у меня два наблюдения
$x_1=2 x_2=3 $
$ y_1=4 y_2=5 $



Вообще, формулы такие обычно используются:
$$
\bar{x} = \frac{1}{N}\sum\limits_{i=1}^N x_i
$$
$\bar{x} =\frac {2+3}{2}=2,5$
$$
\bar{y} = \frac{1}{N}\sum\limits_{i=1}^N y_i
$$
$\bar{y} =\frac {4+5}{2}=4,5 $
Вы здесь не считаете никаких повторений, $N$ - просто число наблюдений, $(x_i,y_i)$ - $i$-тое наблюдение. Далее

$$
\overline{xy} = \frac{1}{N}\sum\limits_{i=1}^N x_i y_i
$$

$\overline{xy} = \frac{2\cdot 4 +3\cdot 5}{2}=11,5$

$$
\sigma_x =\sqrt{\frac{1}{N}\sum\limits_{i=1}^N (x^2_i - \bar{x})}
$$

$\sigma_x =\sqrt{\frac{{2^2-2,5}+{3^2-2,5}}{2}}= 2,83$

$$
\sigma_y =\sqrt{\frac{1}{N}\sum\limits_{i=1}^N (y^2_i - \bar{y})}
$$

$\sigma_y =\sqrt{\frac{{4^2-4,5}+{5^2-4,5}}{2}}= 5,66$
и наконец
$$
\rho = \frac{\overline{xy} - \bar{x}\bar{y}}{\sigma_x\sigma_y}.
$$
$\rho = \frac{11,5 - 2,5\cdot4,5}{2,83\cdot 5,66}=0,016$

Cпасибо большое за формулы :) Я правильно понял, что надо куда подставлять ?

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 22:06 
О, прошу прощения - где идут сигмы, там квадрат на всю скобку, не $(x_i^2 - \bar{x})$, а $(x_i-\bar{x})^2$.

А так все правильно. Пересчитайте и посмотрите - коэффициент корреляции для $x = 2,3$ и $y = 4,5$ должен быть близок к 1 потому как связь между величинами очевидно есть.

-- Чт янв 06, 2011 23:08:20 --

Все, исправил в свое предыдущем посте формулы, пользуйтесь. Еще исправил в сигмах $N$ на $N-1$. Если будет интересно почему - википедия, учебники и вперед :-)

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 22:45 
$x_1=2, x_2=3 $
$ y_1=4, y_2=5 $


$\bar{x} =\frac {2+3}{2}=2,5$

$\bar{y} =\frac {4+5}{2}=4,5 $

$\overline{xy} = \frac{2\cdot 4 +3\cdot 5}{2}=11,5$

$\sigma_x =\sqrt{\frac{{(2-2,5)}^2+{(3-2,5)}^2}{1}}= 0,707$


$\sigma_y =\sqrt{\frac{{(4-4,5)}^2+{(5-4,5)}^2}{1}}= 0,707$

$\rho = \frac{11,5 - 2,5\cdot4,5}{0,707\cdot 0,707}=0,5$

Теперь по правильным формулам коэффициент получился 0,5

-- Чт янв 06, 2011 21:57:55 --

Ура получилось .. 0,29. Спасибо Всем огромное и особенно пользователю Gortaur
С наступающим Рождеством Вас :)

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение07.01.2011, 00:11 
Аватара пользователя
Gortaur в сообщении #396111 писал(а):
Еще исправил в сигмах $N$ на $N-1$. Если будет интересно почему - википедия, учебники и вперед :-)

З.Ы. Напрасно исправили. В определении выборочного коэффициента корреляции участвуют обычные, а не несмещённые выборочные дисперсии. Хотя бы потому, что иначе он уже не между $-1$ и $1$.

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение07.01.2011, 10:56 
Спасибо, буду знать.

(Оффтоп)

Для меня все равно не очень ясен смысл сего действа, потому что сходимость метода Монте-Карло (да и ЗБЧ) вероятностая, точных границ все равно не будет - так что $N$ или $N-1$ - все равно шарлотанство.

 
 
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение07.01.2011, 12:03 
Gortaur в сообщении #396207 писал(а):
(...)

(Оффтоп)

Для меня все равно не очень ясен смысл сего действа, потому что сходимость метода Монте-Карло (да и ЗБЧ) вероятностая, точных границ все равно не будет - так что $N$ или $N-1$ - все равно шарлотанство.

Вы имели в виду смещенность дисперсии генеральной совокупности и несмещенность выборочной дисперсии, когда поправили свое исходное сообщение вчера вечером. Но если в формуле Вы используете в числителе средние арифметические произведения переменных и самих переменных, полученные делением на $n$, то и в знаменателе надо оставить $n$, т.к. $r=\frac {\ s_{xy}} {\ s_x \cdot s_y}=\frac {\ d_{xy}} {\ d_x \cdot d_y}.$

 
 
 [ Сообщений: 30 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group