2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Вопрос по статистике
Сообщение11.04.2015, 17:06 
Аватара пользователя
Уважаемые математики, подскажите пожалуйста:

Коэффициент корреляции между двумя величинами, можно применять для выявления связи между ними только если имеется распределение близкое к нормальному?! или нет? А если заведомо неизвестно как распределены величины (или нужно строить графически и смотреть на получающийся рисунок? а как тогда соединять точки?)

Вот, к примеру, я беру два ряда

X: 1; 2; 3; 4; 5
Y: -1; -2; -3; -4; -5

Считаю мат. ожидание и среднеквадратическое отклонение $M(X)=3; M(Y)=-3; \sigma(X)=\sigma(Y)=4$

Считаю коэффициент корреляции $\rho =\frac{M[(Y-M(Y)
)\cdot(X-M(X))]}{\sigma(X)\cdot\sigma(Y)}$

У меня получается коэф. корреляции $-1/8$. А если я продолжу эти ряды, к примеру до 8 членов, то
коэф. корреляции будет уже $-0,0069107\approx -0,007$ и о чем это говорит?

Если вопрос покажется Вам слишком глупым или очень долго объяснять, тогда, может быть, порекомендуете какую-нибудь литературу. Но желательно, чтобы там было не слишком сложно и по существу. Я ознакомился с учебником и задачником Гмурмана и все-таки вопрос области применения мат. статистики (и в частности коэф корреляции) остается для меня неясным

 
 
 
 Re: Вопрос по статистике
Сообщение11.04.2015, 19:41 
Аватара пользователя
Не вопрос глупый, а вы считать не умеете. Все, кроме математического ожидания (точнее, выборочного среднего) посчитано неправильно. Коэффициент корреляции здесь равен единице.

 
 
 
 Re: Вопрос по статистике
Сообщение11.04.2015, 19:59 
Аватара пользователя
Да нет, вроде умею, просто перепутал, дисперсию со среднеквад. отклонением (и вместо извлечения корня $M(X)=\sqrt{2}$ возвел в квадрат зачем-то), там, конечно, во обоих случаях (-1) получается, это Вы правы. Но вопрос о применении остается открытым. Как-то можно там мои идиотские вычисления подчистить в первом посте?

Давайте все вместе забудем про неудачный пример с положительными и отрицательными числами из первого моего поста, он конечно же не вызывает никаких вопросов, и рассмотрим лучше другой пример (с вычислением корреляционного отношения)
X: 1; 2; 3; 4; 5
Y: 1; 4; 9; 16; 25

 
 
 
 Re: Вопрос по статистике
Сообщение11.04.2015, 20:57 
Аватара пользователя
Двумерное нормальное распределение важно в том смысле, что только для него из равенства нулю коэффициента корреляции следует независимость случайных величин. В общем случае бывают распределения, для которых коэффициент корреляции равен нулю, а зависимость есть, даже функциональная. Например, равномерное распределение точек на единичной окружности. Обычный коэффициент корреляции (Пирсона) предназначен для выявления не любой, а линейной зависимости. Когда предполагается такая модель, что есть какая-то прямая, а вокруг нее болтаются точки (в случае большого числа точек - вытянутое эллиптическое облако). На нелинейной зависимости он может буксовать. Поэтому желательно конечно сначала смотреть рисунок.

 
 
 
 Re: Вопрос по статистике
Сообщение11.04.2015, 21:12 
Аватара пользователя
Коэффициент корреляции, как уже сказали - указывает на тесноту именно линейной связи.
Вы привели квадратичную связь, то есть выборку из параболы.
КК здесь довольно большой 0.9811. Потому что этот кусок параболы не так уж и отличается от прямой ( с " точки зрения " КК).
Если добавите еще пару 6;36 , будет 0.9789 - чуть меньше.
В статье Википедии кстати очень понятные картинки есть. Про корреляционные поля.
[url]https://ru.wikipedia.org/wiki/Корреляция[/url]

 
 
 
 Re: Вопрос по статистике
Сообщение12.04.2015, 11:10 
Аватара пользователя
А если нужно выявить не линейную, а любую возрастающую зависимость (в том числе квадратичную), можно использовать коэффициенты Кендалла и Спирмена.

 
 
 
 Re: Вопрос по статистике
Сообщение13.04.2015, 08:30 
Аватара пользователя
Всем Спасибо большое! Стало понятнее, сейчас посмотрю приведенные ресурсы

 
 
 
 Re: Вопрос по статистике
Сообщение13.04.2015, 14:09 
Посмотрите книгу
Сато Ю. - Обработка сигналов. Первое знакомство
там в первой части хорошо, на примере объяснена корреляция(точнее один из взглядов на нее)

 
 
 
 Re: Вопрос по статистике
Сообщение14.04.2015, 05:22 
Аватара пользователя
Хорошо, спасибо. поищу в интернете или в библиотеке и почитаю

 
 
 [ Сообщений: 9 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group