Поиск параметров модели

alexey007 · 29/12/09 370

Для имеющейся модели $z=ae^{-b/x}y$ , используя экспериментальные данные $(x_i,y_i,z_i), i=1..N$ нужно найти параметры этой модели a,b. Я так понимаю, что нужно использовать функцию фитинга в матлабе и найти коэффициенты a,b. Но меня мучает другой вопрос, если я запишу систему из N уравнений
$z_i=ae^{-b/x_i}y_i,$ $i=1..N$
и попытаюсь их решить явно, исключая неизвестные $a,b$ . Я смогу найти N значений параметра $a$ и $N/2$ значений $b$ . Потом найти средние значение и доверительный интервал на уровне $95$ %. Вопрос, такой, что правильней использовать для поиска параметров регрессию или просто находить параметры?

alisa-lebovski · 05/12/09 1813 Москва

Из "просто находить параметры" вряд ли получится что-то хорошее.
Лучше провести линейную регрессию, предварительно прологарифмировав уравнение.

alexey007 · 29/12/09 370

Вопрос такой, что брать в качестве начального приближения?

alisa-lebovski · 05/12/09 1813 Москва

Для линейной регрессии не нужно никакого начального приближения.

Евгений Машеров · 11/03/08 10217 Москва

Существенный момент здесь - спецификация ошибки. Если она аддитивна и имеет нормальное распределение, то логарифмирование приведёт к непостоянству дисперсии (гетероскедастичности) и изменению вида распределения, и как результат - к смещению оценок параметров.
Однако для моделей, представляющих собой произведение функций, зачастую ошибка имеет логарифмически нормальное распределение (или хорошо им приближается). Кроме того, логарифмирование в этом случае стабилизирует дисперсию ошибок.
Поэтому подход с логарифмированием модели (и, в данном случае, введением новых переменных, равных $\frac 1 x$ и $\log z$ ) в большинстве случаев работает лучше. Модель сводится к линейной, решается даже просто на бумаге, и дисперсии оценок параметров получаются легко.
Если же ошибка заведомо аддитивна, то надо использовать какой-либо метод нелинейной регрессии (Левенберга-Марквардта, скажем). Здесь уже нужно начальное приближение (которое, кстати, можно получить вышеописанным способом, логарифмированием).
Что же до предложенного Вами подхода - очевидно, что для получения оценок параметров надо взять два наблюдения, и для каждой из возможных пар будут свои значения a и b. То есть либо Вы произвольно выбираете порядок расчёта и тем искажаете результат, либо повторяете расчёт для всех $\frac {N(N-1)} 2$ возможных пар, что достаточно затратно, причём нет никакой гарантии, что усреднение по полученным значениям даст Вам несмещённую оценку параметров (достаточно одной пары наблюдений такой, что x и z отличаются на величину порядка ошибки хранения данных, то есть практически совпадают, а y различны, и оценки параметров у Вас могут улететь в бесконечность, соответственно исказив среднее), а уж о свойствах оценки дисперсии можно лишь фантазировать.

Научный форум dxdy

Правила форума

Поиск параметров модели

Кто сейчас на конференции