2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Корреляция
Сообщение22.03.2013, 09:53 
Здравствуйте.
Дана корреляционная матрица $\Sigma$. Коэффициенты корреляции все равно какие - Пирсона, Спирмена и тд. Как определить "главную" переменную, которая больше всего со всеми коррелирует? Какие есть методы?

 
 
 
 Re: Корреляция
Сообщение22.03.2013, 18:23 
Какой ответ вы ожидаете получить в случае двух переменных?

 
 
 
 Re: Корреляция
Сообщение23.03.2013, 08:54 
Mikhail Sokolov в сообщении #699943 писал(а):
Какой ответ вы ожидаете получить в случае двух переменных?

Случай двух переменных не интересен.

 
 
 
 Re: Корреляция
Сообщение24.03.2013, 12:25 
Аватара пользователя
Посмотрите в сторону факторного или компонентного анализа. Но вообще - нужна более чёткая постановка задачи, чо именно понимается под "больше всех со всеми коррелирует".
Может быть, хватит тупого перебора по критерию минимакса (т.е. переменная, для которой минимум корреляций, вернее. абсолютных величин, этой переменной с прочими, максимален). Или то же, но максимизируя среднюю корреляцию (опять же - абсолютные величины усредняя, или лучше квадраты). Можно искать общий фактор, и выбрать переменную, которая имеет максимальную нагрузку. Можно идти от множественной регрессии, строя данную переменную на все прочие, и выбирая имеющую максимальный коэффициент множественной корреляции.
Вообще тут "затруднение от избытка", а не от недостатка подходов. Недостаток тут в целеполагании, что, собственно требуется от результата.

 
 
 
 Re: Корреляция
Сообщение25.03.2013, 14:25 
Евгений Машеров в сообщении #700710 писал(а):
Посмотрите в сторону факторного или компонентного анализа. Но вообще - нужна более чёткая постановка задачи, чо именно понимается под "больше всех со всеми коррелирует".
Может быть, хватит тупого перебора по критерию минимакса (т.е. переменная, для которой минимум корреляций, вернее. абсолютных величин, этой переменной с прочими, максимален). Или то же, но максимизируя среднюю корреляцию (опять же - абсолютные величины усредняя, или лучше квадраты). Можно искать общий фактор, и выбрать переменную, которая имеет максимальную нагрузку. Можно идти от множественной регрессии, строя данную переменную на все прочие, и выбирая имеющую максимальный коэффициент множественной корреляции.
Вообще тут "затруднение от избытка", а не от недостатка подходов. Недостаток тут в целеполагании, что, собственно требуется от результата.

Спасибо за наводку. Мне это в принципе и требовалось. Рассмотрю все эти методы.

 
 
 [ Сообщений: 5 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group