Мне два подхода видятся (не утверждаю, что это всё возможное).
1. Критерий, учитывающий, помимо близости линии регрессии к наблюдениям, также количество регрессоров, и при чрезмерном увеличении числа регрессоров показывающий ухудшение.
Это может быть F-отношение,
, информационный критерий Акаике,
и другие (некоторые перечислены в книге Себера).
2. Разделение выборки на обучающую и экзаменующую, оценка модели по первой и проверка по второй, так что берётся то число регрессоров (степень полинома), на которой результат экзамена наилучший. Разновидность такого подхода - "скользящий экзамен", когда поочерёдно одна точка рассматривается, как экзаменационная, а модель строится по остальным.