2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 точность регрессионной оценки
Сообщение02.12.2013, 16:13 
Чего-то опять запутался.
Построена регрессионная модель, линейная по параметрам $g(x)=a_0+\sum_{i=1}^m a_i f_i(x)$, где $f_i(x)$ - некоторые нелинейные функции от $x$, при этом $x$ - вектор. Насколько я помню при обыкновенной линейной регрессии предполагается, что все компоненты вектора $x$ задаются точно, и вся невязка модели связана с неточностью в определении отклика $y$, т.е. $y_i=G(x_i)+\varepsilon$, где $G(x_i)$- истинная зависимость, $\varepsilon$ подчиняется нормальному распределению с центром 0 и стандартом $\sigma$. Оценка $\sigma$ может быть получена как $\hat{\sigma}=s=\sqrt{\frac{SS_{res}}{n-m-1}}$, где $n$-объем обучающей выборки, $SS_{res}=\sum_{k=1}^n (y_k-g(x_k))^2$. Тогда для оценки точности предсказания $y$ при известном $x$ можно использовать $$y(x)=g(x) \pm t_{n-m-1}s \sqrt(1+Z(x))$$ $$Z(x)=(1+(F(x)-\bar {F}).C^{-1}.(F(x)-\bar {F}))/n$$где $t_{n-m-1}$-квантиль распределения Стьюдента для требуемой вероятности, $F(x)$-вектор размерности $m$, состоящий из $f_i(x), i=1..m$, $\bar {F}$-вектор средних $f_i(x_k)$ по обучающей выборке, $C$-их ковариационная матрица.
Вопрос первый: как определить точность оценки $y$, если некоторые компоненты вектора $x$ известны с ошибкой? Т.е. в обучающей выборке они известны точно, а вот при использовании регрессии в практических расчетах на вход функции $g(x)$ некоторые компоненты вектора $x$ подаются с известной ошибкой.
Вопрос второй: как определить точность оценки $x_j$ по этой модели. Опять-же $y$ и $x_{i \ne j}$ подаются с известной ошибкой.

 
 
 
 Re: точность регрессионной оценки
Сообщение04.12.2013, 09:46 
Аватара пользователя
В простейшем случае, когда ошибки значений регрессоров независимы, умножаем их (ошибок) дисперсии на квадрат коэффициента регрессии, и всё прибавляем к ошибке прогноза по регрессии.

 
 
 
 Re: точность регрессионной оценки
Сообщение04.12.2013, 10:08 
Так похоже? $$y(x)=g(x) \pm t_{n-m-1}s \sqrt{1+Z(x)}+\sqrt{\sum_{j=1}^L \left( \Delta x_j \frac{\partial g}{\partial x_j}\right)^2}$$
Или вот так лучше$$y(x)=g(x) \pm t_{n-m-1}s \sqrt{1+Z(x)}+\sum_{j=1}^L \left| \Delta x_j \frac{\partial g}{\partial x_j}\right|$$

 
 
 
 Re: точность регрессионной оценки
Сообщение04.12.2013, 11:28 
Или так? $$y(x)=g(x) \pm t_{n-m-1} \left(s \sqrt{1+Z(x)}+\sqrt{\sum_{j=1}^L \left( \Delta x_j \frac{\partial g}{\partial x_j}\right)^2 \right)}$$если $\Delta x_j $ - стандарт по $ x_j $
Или вот так$$y(x)=g(x) \pm t_{n-m-1} \left(s \sqrt{1+Z(x)}+\sum_{j=1}^L \left| \Delta x_j \frac{\partial g}{\partial x_j}\right| \right)$$

 
 
 [ Сообщений: 4 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group