Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 Корреляция
Здравствуйте.
Дана корреляционная матрица $\Sigma$. Коэффициенты корреляции все равно какие - Пирсона, Спирмена и тд. Как определить "главную" переменную, которая больше всего со всеми коррелирует? Какие есть методы?

 Re: Корреляция
Какой ответ вы ожидаете получить в случае двух переменных?

 Re: Корреляция
Mikhail Sokolov в сообщении #699943 писал(а):
Какой ответ вы ожидаете получить в случае двух переменных?

Случай двух переменных не интересен.

 Re: Корреляция
Аватара пользователя
Посмотрите в сторону факторного или компонентного анализа. Но вообще - нужна более чёткая постановка задачи, чо именно понимается под "больше всех со всеми коррелирует".
Может быть, хватит тупого перебора по критерию минимакса (т.е. переменная, для которой минимум корреляций, вернее. абсолютных величин, этой переменной с прочими, максимален). Или то же, но максимизируя среднюю корреляцию (опять же - абсолютные величины усредняя, или лучше квадраты). Можно искать общий фактор, и выбрать переменную, которая имеет максимальную нагрузку. Можно идти от множественной регрессии, строя данную переменную на все прочие, и выбирая имеющую максимальный коэффициент множественной корреляции.
Вообще тут "затруднение от избытка", а не от недостатка подходов. Недостаток тут в целеполагании, что, собственно требуется от результата.

 Re: Корреляция
Евгений Машеров в сообщении #700710 писал(а):
Посмотрите в сторону факторного или компонентного анализа. Но вообще - нужна более чёткая постановка задачи, чо именно понимается под "больше всех со всеми коррелирует".
Может быть, хватит тупого перебора по критерию минимакса (т.е. переменная, для которой минимум корреляций, вернее. абсолютных величин, этой переменной с прочими, максимален). Или то же, но максимизируя среднюю корреляцию (опять же - абсолютные величины усредняя, или лучше квадраты). Можно искать общий фактор, и выбрать переменную, которая имеет максимальную нагрузку. Можно идти от множественной регрессии, строя данную переменную на все прочие, и выбирая имеющую максимальный коэффициент множественной корреляции.
Вообще тут "затруднение от избытка", а не от недостатка подходов. Недостаток тут в целеполагании, что, собственно требуется от результата.

Спасибо за наводку. Мне это в принципе и требовалось. Рассмотрю все эти методы.

 [ Сообщений: 5 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group