2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 восстановление уравнения регрессии по корреляционной матрице
Сообщение20.06.2018, 10:36 


15/04/10
985
г.Москва
Столкнулся с такой постановкой. (задача экзаменационного билета)
записать уравнение регрессии в показательной форме и привести к линейному виду. Сами исходные данные не даны, дана лишь
матрица межфакторной корреляции
$
\begin{bmatrix}
1 & 0.5 & 0.4 & 0.6\\
0.5 & 1 & 0.2 & 0.3\\
0.4 & 0.2 & 1 & 0.8 \\
0.6 & 0.3 & 0.8 & 1
\end{bmatrix}$ и вектор корреляции зависимой и факторных переменных $
\begin{bmatrix}
0.4 \\0.5 \\0.7 \\ 0.6
\end{bmatrix}$
Хорошо. Строим матрицу парной корреляции .
$
\begin{bmatrix}
1 & 0.4 & 0.5 & 0.7 & 0.6\\
0.4 &1 & 0.5 & 0.4 & 0.6\\
0.5 & 0.5  & 1 & 0.2 & 0.3 \\
0.7 & 0.4 & 0.2 & 1 & 0.8 \\
0.6 & 0.6 & 0.3 & 0.8 & 1
\end{bmatrix}$
Проверка на малость $r_{y,x_i} <0.5$ - исключаем признак X1
Проверяем на мультиколлинеарность факторов.
Исключаем один из двух признаков 3 или 4 дающих $r_{3,4}=0.8$ т е признак X3. Осталось 2 признака Х2,Х4. Но дальше как ни крути, все равно надо составлять систему нормальных уравнений чтоб получить коэф-ты модели. И где мне взять скажем, средние? да еще и данные по объясняемой переменной y надо логарифмировать

 Профиль  
                  
 
 Re: восстановление уравнения регрессии по корреляционной матрице
Сообщение20.06.2018, 11:49 


15/04/10
985
г.Москва
частично понял.дальше надо усечь корреляционную матрицу за счет исключеннных факторов и составить систему нормальных уравнений в стандартизованной форме
$\begin{bmatrix}
1 & 0.5 &  0.6\\
0.5 & 1 & 0.3\\
0.6 & 0.3  & 1
\end{bmatrix}$
и получить систему уравнений для нахождения коэфф регрессии
$0.5=b_1+0.3b_2$
$0.6=0.3b_1+b_2$
Но это не ответ на вопрос - у нас не линейная а показательная регрессия

 Профиль  
                  
 
 Re: восстановление уравнения регрессии по корреляционной матрице
Сообщение21.06.2018, 08:46 
Заслуженный участник
Аватара пользователя


11/03/08
10044
Москва
0. Очень странная постановка - нет исходных данных, а требуется преобразование. Если понимать так, что даны корреляции между исходными значениями, а нужно перейти к корреляциям логарифмов их (что, по всей видимости, понимается под "переходом от показательного вида к линейному"), то без исходных данных не получится. Простой сдвиг данных, не меняющий корреляции исходных значений, изменит корреляции логарифмов. Поэтому в дальнейшем предполагаю, что задание состоит из двух формально связанных частей, первая теоретическая, рассказать, как перейти от показательной модели к линейной (прологарифмировать?), вторая расчётная, вычислить коэффициенты регрессионной модели, полагая, что они уже даны для логарифмированной. Но это лишь предположение, что имел в виду преподаватель - знает лишь он.

(Оффтоп)

Это научная гипотенуза, и я в ней не копенгаген.

1. Коэффициенты регрессии вычисляются, как $\hat{a}=(X^TX)^{-1}X^Ty$, при этом заданы и первый сомножитель $X^TX$ и второй $X^Ty$, то есть надо обратить корреляционную матрицу и умножить результат на вектор корреляций регрессоров с регрессандом. Однако тут возникает два если не затруднения, то сомнения. В указанной формуле предполагаются не корреляции, нормированные делением на стандартные отклонения величины, а ковариации. Либо в задании требуют "нормированные коэффициенты регрессии", рассчитанные в предположении, что единицы измерения всех величин приняты равными их СКО (это иногда используют для оценки "силы влияния переменных"), либо условно принято, что для все величин СКО=1, либо в условии есть значения СКО, но они отчего-то Вами не приведены. Второе затруднение связано с оценкой свободного члена. Обычная практика упрощения вычислений (а также повышения их точности) состоит в том, что перед расчётом из всех величин вычитают их средние значения, получают так оценку для всех регрессоров, кроме свободного члена, а потом вычисляют его, как $\hat{a}_0=\bar{y}-\Sigma_1^n \hat{a}_i\bar{x}_i$. Впрочем, можно рассматривать его, как обычную переменную, просто тождественно равную 1, и вести расчёт обычным образом. Но тогда у нас точно не корреляции. Ещё один вариант - что рассматривается модель без свободного члена. Для полноценного ответа на этот вопрос надо разрешить эти два затруднения.
2. Без такого уточнения я бы лично разделил бы ответ на две части, рассказ о том, как просто от степенной или экспоненциальной модели перейти к линейной, прологарифмировав (а то, что на самом деле здесь много сложностей - опустил бы), и расчёт по приведенной выше формуле. Но, повторюсь, лучше всё же понять, чего от Вас хотят.
3. Полагаю, что исключения переменных из модели не ожидают, скорее всего должны войти все, хотя упомянуть преподавателю красивое и внушительное слово "мультиколлинеарность" было бы неплохо

(Оффтоп)

Мадемуазель Собак слыла культурной девушкой: в ее словаре было около ста восьмидесятти слов. При этом ей было известно одно такое слово, которое Эллочке не могло даже присниться. Это было богатое слово: гомосексуализм. Фима Собак, несомненно, была культурной девушкой.

но исключать переменные на основании его вряд ли стоит, максимум - упомянуть о возможной целесообразности этого.

 Профиль  
                  
 
 Re: восстановление уравнения регрессии по корреляционной матрице
Сообщение21.06.2018, 09:09 


15/04/10
985
г.Москва
вот примеры этих билетов. Под ними стоит подпись проф.Еленева, Москва, СТАНКИН
Изображение
Изображение
Изображение

 Профиль  
                  
 
 Re: восстановление уравнения регрессии по корреляционной матрице
Сообщение21.06.2018, 10:05 
Заслуженный участник
Аватара пользователя


11/03/08
10044
Москва
По тексту - корреляции для исходных значений. И про преобразованную модель можно лишь "пеший по конному", обозначить операцию, а не выполнить её в реале (или вообще как в анекдоте: "А вот так они, Василий Иванович, рукой могут!"), логарифмирование корреляции меняет, как и любое нелинейное преобразование.
Реально тут можно считать для представленных данных, как для линейной модели, и отдельно рассказать про преобразование нелинейных к линейным.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group