2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 19:02 


06/01/11
22
Было у меня 50 значений х и соответствующих им 50 значений y
Я нашел с верхним подчеркиванием $x=34,97$, $y=10,05$, $xy=323,90$
$\sigma_x=1,78$ $\sigma_y=0,42$
По этой формуле я нашел коэффициент корреляции

$r=\frac{xy-x\cdot y}{\sigma_x\cdot\sigma_y}$

$r=\frac{323,90-34,97\cdot 10,05}{1,78\cdot0,42}=-37,21$

Может быть такой коэффициент корреляции ? Если такой коэффициент может быть, я думаю, что между x и y существует зависимость. Поправте меня, если что.

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 19:37 


30/05/10
59
а данные выложить можете?

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 19:49 


26/12/08
1813
Лейден
Конечно, не может - он по модулю не больше 1. Приведите формулы, которые Вы использовали.

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:13 


30/05/10
59
deleted :?

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:32 


06/01/11
22
x y
35,6 10,1
37,6 10,3
31,8 9,9
35,6 10,1
28,7 9,4
34,3 9,9
35 9,7
36,4 10,2
34,1 10,6
34,5 9,4
34,7 9,7
35,1 10,7
36 9,5
32,3 10,3
35,2 9,9
33,5 9,9
34 10,5
36,4 10,1
34,1 10,2
34,9 10,6
34,4 9,8
32,1 9,5
36,5 10,5
35,6 9,8
34,4 10,2
37,6 10,2
35,4 10,3
37,3 10,2
35,8 10,8
35,8 9,8
37 10,1
34,8 10,2
35,2 10,1
34 10,3
36,1 10
35 9,9
32,8 10,3
32,7 9,9
35 10
36,7 10,8
36 9,7
35,4 10,1
32,8 9,3
36,7 10,6
33,5 10,7
34,4 9,9
35,6 10,1
34,3 9,3
35,7 8,8
40 10,4

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:37 


30/05/10
59
SHAZAM OUTPUT
*********************************************************************
* SHAZAM - FOR LINUX SITE NO. 1234 *
* *
* ** Copyright (C) 2000 by K.J. White - All Rights Reserved ** *
* *
* FOR USE ONLY BY: SHAZAM USERS *
* AT: ECONOMETRICS.COM *
* *
* *
* If this does not describe you then you have stolen this copy *
* and if you type anything except STOP or HELP SHAZAM you *
* agree to send payment within 7 days for a software license *
* *
* *
* *
* FOR USE ON SINGLE COMPUTER ONLY - NO COPIES PERMITTED *
*********************************************************************
Hello/Bonjour/Aloha/Howdy/G Day/Kia Ora/Konnichiwa/Buenos Dias/Nee Hau/Ciao
Welcome to SHAZAM - Version 10.0 - JUL 2004 SYSTEM=LINUX PAR= 781
|_ SAMPLE 1 50
|_ READ X Y
2 VARIABLES AND 50 OBSERVATIONS STARTING AT OBS 1

|_ stat x y / pcorrela
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
X 50 34.968 1.7940 3.2185 28.700 40.000
Y 50 10.052 0.42197 0.17806 8.8000 10.800

CORRELATION MATRIX OF VARIABLES - 50 OBSERVATIONS


X 1.00000
Y 0.29825 1.00000
X Y
|_ STOP



Выделено мной

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 20:53 


06/01/11
22
$\bar{x}=\frac{ x_1 \cdot d_1 + ..+x_n\cdot d_n}{h}$
где d_1 - количество повторений x_1
h - количество пар x и у
$\bar{y}=\frac{ y_1 \cdot p_1 + ..+y_n\cdot p_n}{h}$
где p_1 - количество повторений y_1
$\overline {x\cdot y}=\frac{x_1\cdot y_1\cdot k_1 + ... +x_n\cdot y_n\cdot k_n}{h}$
где k_1 - количество повторений x_1 и y_1
$\sigma_x=\sqrt{\frac{{x_1^2}\cdot d_1+ ... + x_n^2\cdot d_n}{h}  -{\bar{x}}^2}$
$\sigma_y=\sqrt{\frac{{y_1^2}\cdot d_1+ ... + y_n^2\cdot p_n}{h}  -{\bar{y}}^2}$

формул нам на паре не дале.. мы сразу числа подставляли с задачи с условия, считал по этим формулам

-- Чт янв 06, 2011 20:04:45 --

Формулы, по примеру, какой в тетрадке есть, написал. Поправте, меня. Считал с помощью Exsel по этим формулам.

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 21:06 


30/05/10
59
по Вашим выкладкам:
$323,90-34,97 \cdot 10,05=0,2213$
$1,78\cdot 0,42=0,76$
$\frac {\ 0,2213} {\ 0,76}$\approx 0,29$

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 21:11 


26/12/08
1813
Лейден
Формулы вроде правильные, но проверять уж извините лень - коэффициент корреляции не может быть больше по модулю чем 1.

Вообще, формулы такие обычно используются:
$$
\bar{x} = \frac{1}{N}\sum\limits_{i=1}^N x_i
$$
$$
\bar{y} = \frac{1}{N}\sum\limits_{i=1}^N y_i
$$
Вы здесь не считаете никаких повторений, $N$ - просто число наблюдений, $(x_i,y_i)$ - $i$-тое наблюдение. Далее

$$
\overline{xy} = \frac{1}{N}\sum\limits_{i=1}^N x_i y_i
$$
$$
\sigma_x =\sqrt{\frac{1}{N-1}\sum\limits_{i=1}^N (x_i - \bar{x})^2}
$$
$$
\sigma_y =\sqrt{\frac{1}{N-1}\sum\limits_{i=1}^N (y_i - \bar{y})^2}
$$
и наконец
$$
\rho = \frac{\overline{xy} - \bar{x}\bar{y}}{\sigma_x\sigma_y}.
$$

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 21:36 


06/01/11
22
Я не много не понимаю формулы, можете меня поправить, например
у меня два наблюдения
$x_1=2 x_2=3 $
$ y_1=4 y_2=5 $



Вообще, формулы такие обычно используются:
$$
\bar{x} = \frac{1}{N}\sum\limits_{i=1}^N x_i
$$
$\bar{x} =\frac {2+3}{2}=2,5$
$$
\bar{y} = \frac{1}{N}\sum\limits_{i=1}^N y_i
$$
$\bar{y} =\frac {4+5}{2}=4,5 $
Вы здесь не считаете никаких повторений, $N$ - просто число наблюдений, $(x_i,y_i)$ - $i$-тое наблюдение. Далее

$$
\overline{xy} = \frac{1}{N}\sum\limits_{i=1}^N x_i y_i
$$

$\overline{xy} = \frac{2\cdot 4 +3\cdot 5}{2}=11,5$

$$
\sigma_x =\sqrt{\frac{1}{N}\sum\limits_{i=1}^N (x^2_i - \bar{x})}
$$

$\sigma_x =\sqrt{\frac{{2^2-2,5}+{3^2-2,5}}{2}}= 2,83$

$$
\sigma_y =\sqrt{\frac{1}{N}\sum\limits_{i=1}^N (y^2_i - \bar{y})}
$$

$\sigma_y =\sqrt{\frac{{4^2-4,5}+{5^2-4,5}}{2}}= 5,66$
и наконец
$$
\rho = \frac{\overline{xy} - \bar{x}\bar{y}}{\sigma_x\sigma_y}.
$$
$\rho = \frac{11,5 - 2,5\cdot4,5}{2,83\cdot 5,66}=0,016$

Cпасибо большое за формулы :) Я правильно понял, что надо куда подставлять ?

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 22:06 


26/12/08
1813
Лейден
О, прошу прощения - где идут сигмы, там квадрат на всю скобку, не $(x_i^2 - \bar{x})$, а $(x_i-\bar{x})^2$.

А так все правильно. Пересчитайте и посмотрите - коэффициент корреляции для $x = 2,3$ и $y = 4,5$ должен быть близок к 1 потому как связь между величинами очевидно есть.

-- Чт янв 06, 2011 23:08:20 --

Все, исправил в свое предыдущем посте формулы, пользуйтесь. Еще исправил в сигмах $N$ на $N-1$. Если будет интересно почему - википедия, учебники и вперед :-)

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение06.01.2011, 22:45 


06/01/11
22
$x_1=2, x_2=3 $
$ y_1=4, y_2=5 $


$\bar{x} =\frac {2+3}{2}=2,5$

$\bar{y} =\frac {4+5}{2}=4,5 $

$\overline{xy} = \frac{2\cdot 4 +3\cdot 5}{2}=11,5$

$\sigma_x =\sqrt{\frac{{(2-2,5)}^2+{(3-2,5)}^2}{1}}= 0,707$


$\sigma_y =\sqrt{\frac{{(4-4,5)}^2+{(5-4,5)}^2}{1}}= 0,707$

$\rho = \frac{11,5 - 2,5\cdot4,5}{0,707\cdot 0,707}=0,5$

Теперь по правильным формулам коэффициент получился 0,5

-- Чт янв 06, 2011 21:57:55 --

Ура получилось .. 0,29. Спасибо Всем огромное и особенно пользователю Gortaur
С наступающим Рождеством Вас :)

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение07.01.2011, 00:11 
Заслуженный участник
Аватара пользователя


23/11/06
4171
Gortaur в сообщении #396111 писал(а):
Еще исправил в сигмах $N$ на $N-1$. Если будет интересно почему - википедия, учебники и вперед :-)

З.Ы. Напрасно исправили. В определении выборочного коэффициента корреляции участвуют обычные, а не несмещённые выборочные дисперсии. Хотя бы потому, что иначе он уже не между $-1$ и $1$.

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение07.01.2011, 10:56 


26/12/08
1813
Лейден
Спасибо, буду знать.

(Оффтоп)

Для меня все равно не очень ясен смысл сего действа, потому что сходимость метода Монте-Карло (да и ЗБЧ) вероятностая, точных границ все равно не будет - так что $N$ или $N-1$ - все равно шарлотанство.

 Профиль  
                  
 
 Re: Найти коэффициент корреляции, между двумя величинами
Сообщение07.01.2011, 12:03 


30/05/10
59
Gortaur в сообщении #396207 писал(а):
(...)

(Оффтоп)

Для меня все равно не очень ясен смысл сего действа, потому что сходимость метода Монте-Карло (да и ЗБЧ) вероятностая, точных границ все равно не будет - так что $N$ или $N-1$ - все равно шарлотанство.

Вы имели в виду смещенность дисперсии генеральной совокупности и несмещенность выборочной дисперсии, когда поправили свое исходное сообщение вчера вечером. Но если в формуле Вы используете в числителе средние арифметические произведения переменных и самих переменных, полученные делением на $n$, то и в знаменателе надо оставить $n$, т.к. $r=\frac {\ s_{xy}} {\ s_x \cdot s_y}=\frac {\ d_{xy}} {\ d_x \cdot d_y}.$

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 30 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group