Я же хочу найти такую прямую, чтобы сумма квадратов расстояний до всех точек была минимальна (то есть мы имеем экспериментальные точки и нам нужна "линия тренда"
Это
две разные задачи. Когда говорят о "линии тренда" -- имеют в виду, что пары чисел
отвечают некоторой экспериментальной зависимости
, которую мы приближаем линейной функцией
; тогда нужен действительно МНК, а то, что эти пары чисел задают ещё и точки на плоскости -- всего лишь некоторая условность. Если же речь именно о точках как геометрических объектах, то тут, напротив, условностью являются координатные оси, и минимизировать надо расстояния именно по нормали.
Различие между этими задачами проявляется, в частности, и в том, что у них разные инварианты. Если минимизируются расстояния по вертикали, то решение инвариантно относительно растяжений по любой из осей (в том смысле, что прямая растягивается ровно так же), но не инвариантно относительно поворотов картинки. Если минимизируются расстояния по нормали, то всё в точности наоборот.