Да я и забанил!
Ну если только Вы, тогда еще ладно...
Реально остается самый главный вопрос: о сводимости к линейной модели.
Это не самый главный вопрос. Во многих случаях достаточно успешно можно идентифицировать нелинейные модели, представленные, например, в виде системы дифференциальных уравнений. А самый главный вопрос, который надо задать себе перед началом построения любой модели -- это вопрос "зачем". Другими словами, какие задачи мы собираемся с помощью этой модели решать. И от ответа на этот вопрос уже зависят и вид модели, и требования к точности, и методы идентификации.
рассмотрим точки типа (0,0), (1,1), (2,2), (3,3), (4,0), (5,5). Зададимся вопросом построения такой функции
(линейной!!!), что какая-та приятная функция от отклонений минимальна. Если "приятная функция" будет суммой квадратов отклонений, то прямая будет гадкой и непохожей на очевидный график, а вот если "приятная функция" - это сумма модулей отклонений (еще проще, но недифференцирума), то ответом будет функция
, только вот как вы выразились "тупо просто" применить какой-либо очевидный метод не получицца
Тут встает вопрос, в чем причина значительного отклонения от прямой в точке (4, 0). Если это просто выброс, то его надо корректировать
до использования данных для построения аппроксимирующей зависимости (на стадии предварительной обрабоки). Если же он отражает существенную характеристику процесса, то, отрезав его за счет выбора критерия в виде суммы модулей, можно выплеснуть воду вместе с ребенком.
Ну а вид функционала невязки (сумма квадратов, сумма модулей или еще что-нибудь) определяется нашими предположениями о законе распределения ошибок. В частности, если мы предполагаем нормальный вид распределения, то наилучшие оценки по методу наибольшего правдоподобия дает именно МНК. Да и с вычислительной точки зрения он проще (за счет специфической структуры гессиана).