При построении регрессионной модели требуется задать спецификацию ошибки. Нелинейные преобразования регрессанда её меняют. Если мы задали ошибку, как аддитивную и полагаем независимыми одинаково (или даже нормально с одинаковыми параметрами) распределёнными случайными величинами
то преобразование
такое, что
, приводящее к линейности, спецификацию ошибки изменит.
Эффект различен, в пределах от появления разных дисперсий ошибок в разных наблюдениях (гетероскедастичности) до полной неработоспособности модели.
Однако возможно и иная спецификация ошибки, в которой как раз такое преобразование даст нам обычные условия применения регрессионного анализа.
Кажется, я уже такой пример приводил - оценивание "производственной функции Кобба-Дугласа"
выражающей зависимость продукции P от наличия труда L и капитала K. Логарифмирование приводит её к линейному виду. При этом на результат влияют неучтённые факторы, которые рассматриваются, как случайная помеха. И для экономистов естественно выражать их влияние в процентах и совместное действие считать мультипликативным. Тогда распределение эффекта от неучтённых факторов можно приблизить логнормальным распределением (можно даже при некоторых дополнительных условиях доказать, что в пределе это и будет логнормальное), логарифм от него будет нормальным, и после логарифмирования мы вполне соблюдаем условия применения линейной регрессии, даже ошибка нормальная, и нам доступны соответствующие тесты, оценка максимально правдоподобна и т.п.
Однако если в модели того же вида, произведение двух факторов, возведённых в подлежащие оценке степени, ошибка аддитивна (ну, скажем, порождена ошибкой измерения, а та связана с дискретностью шкалы прибора и погрешностями съёма с неё)
то логарифмирование исказит спецификацию ошибки. Как минимум, станет различной дисперсия, а где-то под логарифмом окажется отрицательное число. В этом случае надо оценивать без линеаризации, общими нелинейными методами оптимизации или приспособленными к такой задаче (например, Левенберга-Марквардта). Если ошибки малы - линеаризация даст дешёвое приближённое решение, но если не совсем уж малы, порядка вычислительной погрешности - такое решение годится для грубой оценки или в качестве начального приближения для общего метода.
Там, где рекомендуют просто линеаризовать - либо, исследовав модель, пришли к выводу, что линеаризация не только упрощает вид модели, но и приводит спецификацию ошибки к нужному виду, либо принимают, что ошибка очень мала. Третий вариант - бездумно повторяют рекомендацию старых учебников, которые исходили из того, что так можно получить приближённое решение, когда другое получить невозможно. Прогресс вычтехники позволил оценивать достаточно сложные нелинейные модели, так что следовать этой рекомендации не слишком обосновано.