0. Не претендую на роль эксперта по матстатистике, просто прикладник, тут есть куда более квалифицированные люди. Но именно как прикладник хотел бы потребовать чёткости определений. "Моделей регрессии" много, есть с детерминированными регрессорами, есть со случайными. Нужно оговорить строго, какая.
1. В наиболее часто применимой модели

регрессоры X и коэффициенты a принимаются детерминированными. Случайными величинами являются

и Y. В дальнейшем буду говорить только о ней.
2. Именование

"ошибками измерений" не более, чем оборот речи. Иногда достаточно адекватный реальности (если наша модель полна, никаких неучтённых факторов нет, и единственный источник отклонения - то, что Y мы измеряем с ошибкой; астрономия, геодезия, физика...), иногда не слишком (на самом деле действуют неучтённые факторы, но поскольку мы о них ничего не знаем, то принимаем их случайными; медицина, экономика...). Причём случайность во всех случаях постулируется.
3. В ходе оценивания у нас появляется вектор невязок

, являющийся оценкой вектора

. Иногда его тоже именуют "ошибками измерения". Для заданных X и Y это детерминированная величина, но если мы рассматриваем модель порождения Y, то и e оказывается случайной величиной, зависящей от случайной величины

Бывает полезно различать посчитанную для данного набора регрессоров и регрессанда невязку и невязку, как случайную величину.