2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Поиск параметров модели
Сообщение23.09.2012, 11:20 
Для имеющейся модели $z=ae^{-b/x}y$, используя экспериментальные данные $(x_i,y_i,z_i), i=1..N$ нужно найти параметры этой модели a,b. Я так понимаю, что нужно использовать функцию фитинга в матлабе и найти коэффициенты a,b. Но меня мучает другой вопрос, если я запишу систему из N уравнений
$z_i=ae^{-b/x_i}y_i,$  $i=1..N$
и попытаюсь их решить явно, исключая неизвестные $a,b$. Я смогу найти N значений параметра $a$ и $N/2$ значений $b$. Потом найти средние значение и доверительный интервал на уровне $95$%. Вопрос, такой, что правильней использовать для поиска параметров регрессию или просто находить параметры?

 
 
 
 Re: Поиск параметров модели
Сообщение23.09.2012, 14:39 
Аватара пользователя
Из "просто находить параметры" вряд ли получится что-то хорошее.
Лучше провести линейную регрессию, предварительно прологарифмировав уравнение.

 
 
 
 Re: Поиск параметров модели
Сообщение23.09.2012, 22:27 
Вопрос такой, что брать в качестве начального приближения?

 
 
 
 Re: Поиск параметров модели
Сообщение24.09.2012, 06:11 
Аватара пользователя
Для линейной регрессии не нужно никакого начального приближения.

 
 
 
 Re: Поиск параметров модели
Сообщение24.09.2012, 09:56 
Аватара пользователя
Существенный момент здесь - спецификация ошибки. Если она аддитивна и имеет нормальное распределение, то логарифмирование приведёт к непостоянству дисперсии (гетероскедастичности) и изменению вида распределения, и как результат - к смещению оценок параметров.
Однако для моделей, представляющих собой произведение функций, зачастую ошибка имеет логарифмически нормальное распределение (или хорошо им приближается). Кроме того, логарифмирование в этом случае стабилизирует дисперсию ошибок.
Поэтому подход с логарифмированием модели (и, в данном случае, введением новых переменных, равных $\frac 1 x$ и $\log z$) в большинстве случаев работает лучше. Модель сводится к линейной, решается даже просто на бумаге, и дисперсии оценок параметров получаются легко.
Если же ошибка заведомо аддитивна, то надо использовать какой-либо метод нелинейной регрессии (Левенберга-Марквардта, скажем). Здесь уже нужно начальное приближение (которое, кстати, можно получить вышеописанным способом, логарифмированием).
Что же до предложенного Вами подхода - очевидно, что для получения оценок параметров надо взять два наблюдения, и для каждой из возможных пар будут свои значения a и b. То есть либо Вы произвольно выбираете порядок расчёта и тем искажаете результат, либо повторяете расчёт для всех $\frac {N(N-1)} 2$ возможных пар, что достаточно затратно, причём нет никакой гарантии, что усреднение по полученным значениям даст Вам несмещённую оценку параметров (достаточно одной пары наблюдений такой, что x и z отличаются на величину порядка ошибки хранения данных, то есть практически совпадают, а y различны, и оценки параметров у Вас могут улететь в бесконечность, соответственно исказив среднее), а уж о свойствах оценки дисперсии можно лишь фантазировать.

 
 
 [ Сообщений: 5 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group