Подобный подход, принудительно задать соотношение между коэффициентами, используя вместо исходных регрессоров их линейную комбинацию с заданными априори коэффициентами, формально решая поставленную задачу, может оказаться лишь имитацией решения. Дело в том, что (взяв для примера задачу оценки ОО по измерениям тела, приведенную топикстартером), на ОО может влиять не только общий размер (который можно охарактеризовать и весом, и ростом), но и форма тела (характеризуемая, в частности, соотношением веса и роста). И отрицательный коэффициент при росте может быть следствием не только игры ошибок на высококоррелированных регрессорах, но и отражением, например, того, что низкий индекс массы тела свидетельствует о недостатке питания или о болезнях (ну, или всё в норме, просто индивидуальная особенность, астеническое сложение).
Формально идеальное решение - переход к ортогональным переменным, например, к главным компонентам. В этом случае оценки одного коэффициента не влияют на оценки другого. Увы, главные компоненты плохо интерпретируемы. Возможным решением могут быть "содержательные компоненты" - комбинации переменных такие, что, не быв строго ортогональны меж собой, они всё же мало скоррелированы. Не обязательно линейные. Скажем, в данной задаче могло оказаться полезным использовать вес и индекс массы тела
, которые могут быть скоррелированы слабее, чем вес и рост.
Для данной частной задачи использование именно линейной модели представляется неоправданным. Её достоинство - простота, но это "фонарь, под которым ищем, поскольку там, где потеряли, темно и ничего не видать". Лучше использовать модель, хотя бы частично отражающую физику процесса и/или очевидные свойства (скажем, если вес и/или рост нулевые, ОО, очевидно, тоже ноль, и мультипликативная модель, в отличие от обычной линейной, этот факт использует). Впрочем, никто не мешает прологарифмировать, сведя для вычислений к линейной (тут есть тонкости в связи со спецификацией ошибки, о них не стоит забывать, но и зацикливаться на них не стоит).