Он возникает потому, что действительная зависимость почти всегда нелинейна, но достаточно часто в области данных приближаема линейной зависимостью удовлетворительно (поправка на нелинейность мала в сравнении с возмущающими факторами).
Да, это известная вещь, формулы основного обмена типа Кэннингхема (таких много) линейна в зависимости от тощей массы, но при 0 массы дает странное значение порядка 500-700 ккал. Это хорда степенной зависимости со степенью порядка 0,65-0,75.
-- 25.03.2020, 11:52 --Касательно смысла свободного члена. Он крайне редко означает именно "уровень при нулевом значении всех регрессоров", поскольку в большинстве практических задач точка, в которой все регрессоры равны нулю, лежит вне области интереса и не представлена в данных.
Да, но смысл был обобщения данных, полученных на порциях пищи 240 ккал. Хотелось бы там, где возможно, интерполяцию делать в диапазоне 0-240 ккал, а не экстраполяцию. А нулевая точка при равенстве нулю предикторов и свободного члена фиксируется надежно, как и точка 240 ккал.
Что же касается экстраполяции на большие порции, тут срабатывает то, что среди порций на 240 ккал встречаются близкие к монопродукту, т.е. преимущественно жировые, белковые или углеводные. И тогда порция пищи в 720 ккал смешанного состава по предикторам не выходит за пределы уже проверявшихся их количеств.
Ислледователи ведь не задавались целью установить количественную зависимость ИИ и ГИ от компонентов. при такой цели план эксперимента наверняка был бы иным. И попытки устанвоить эту зависимость по этим данным мне неизвестны. Но, что интересно, тут данные хоть получены путем измерения. Они же оценивали сытность продуктов по этим же продуктам, данные более рыхлые, поскольку получены путем опроса, измерять тут было нечего. Но попытка вывести регрессию, притом невероятно сложную, была сделана. Вот она, выкладываю оригинал записи, как у авторов этой формулы, картинкой по первоисточнику
https://nutritiondata.self.com/topics/fullness-factor 
Здесь CAL- калорийностиь порции, PR белки, DF клетчатка, TF жиры.
Смущает уже наличие ограничений по минимуму и максиму, т.е. результат некоторых вычислений выносит за реальные границы, и смущают кубы предикторов - это ни в какие ворота не лезет. Но они же приводят рисунок соотвествия оценке фактам - достаточно приемлемо. Но вот выйти за пределы эксперимента - тут к гадалке не ходи, разнесет. Зачем такие регрессии?
Я делала то же самое, линейная регрессия

.
Обозначения EC - единиц сытности, M - масса продукта, P - белки, F - жиры, K - крахмал, C - клетчатка.
Все вменяемо, белки насышают, жиры нет, сахар даже отсутствует (коэф. 0), поскольку сытность определялась через 2 часа, а через 2 часа после сахарного завтрака не сытность, а муки голода вследствие гипогликемии; в среднем насыщают крахмал и клетчатка. Механизм насыщения разный, но коэффициенты (случайно) близки. И насыщает сам вес еды, с коэффициентом 0,22. Что тоже работает - при одинаковой калорийности более объемная еда кажется более сытной.
Эта формула убедила меня, что множ. регрессия на наборе данных исследования работает, все коэффициенты соответствуют известным зависимостям, выражавшимся лингвистическими переменными типа белки насыщают, а жиры нет, и пр. А также известному мему, девизу анорексичек "хочешь есть, попей воды".
Ниже рисунок, точки - сытность продуктов по оценке формулы линейной регрессии, столбики - оценка по австр. эксперименту +/- 1 сигму. Видно, что за пределами коридора в 2 сигмы 5 оценок ниже, и 4 выше, итого 9 оценок, или 25% всех оценок. По нормальному распределению может быть 31,7%. Куда лучше?
Да, вспомнилось, меня спрашивали, проверяла ли я остатки на нормальность. Осознанно по обсуждавшимся выше формулам нет, но вот оценка по выпавшим за пределы +/- 1 сигмы значений для формулы сытности тоже ведь своего рода оценка.

P.S. Моя формула в карантине исправлена, первую в виде картинки прошу оставить - она принадлежит не мне, именно в виде такой картинки была выложена на первоисточнике
https://nutritiondata.self.com/topics/fullness-factor