Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 Исключение незначимых переменных из регрессии
Здравствуйте!

При оценке линейной регрессии с помощью МНК, получено уравнение, в котором некоторые оценки коэффициентов незначимы. Однако, при их исключении увеличиваются доверительные интервалы и дисперсии других переменных и уменьшается R-squared.

Предположил, что возможно присутствует мультиколлинеарность, но показатели вздутия VIF оказались довольно малы (~1).

О чем этом может говорить?

 Re: Исключение незначимых переменных из регрессии
Я взял число регрессоров равным числу наблюдений и получил $R^2=1$. Нужно ли мне исключить незначимые?

 Re: Исключение незначимых переменных из регрессии
Аватара пользователя
Обязательно.

 Re: Исключение незначимых переменных из регрессии
Александрович

(Оффтоп)

Это был ответ к вопросу ТС :mrgreen:

 Re: Исключение незначимых переменных из регрессии
Аватара пользователя
R-квадрат растёт даже при добавлении случайных чисел в качестве регрессора (ну, строго говоря, неубывает, но случай, когда вектор случайных чисел ортогонален зависимой переменной, маловероятен). Им руководствоваться не стоит.
В качестве "совета на первый раз" посмотрите на изменение F-отношения, если оно при исключении растёт - правильно исключили.
Более серьёзный анализ может опираться на "скользящий экзамен" (когда, поочерёдно отбрасывая наблюдения по одному, строят модель на оставшихся и смотрят на её прогностическую способность для отброшенного), или же на содержательные соображения, которые могут потребовать оставить даже наблюдения с незначимым коэффициентом (в последнем случае возможно полезной будет перепараметризация, в простейшем случае переход от исходных переменных к их разностям, снижающий корреляцию между ними)

 [ Сообщений: 5 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group