Популярность метода наименьших квадратов связана с двумя его преимуществами, и оба они не являются абсолютными.
Квадратичная целевая функция - это линейные производные от неё, так что нахождение экстремума сводится к решению линейных уравнений. Что просто, быстро, но главное - однозначно (ну, есть ещё мультиколлинеарность, но это настолько мелкая проблема сравнительно с наличием множества локальных оптимумов в задаче оптимизации общего вида...)
Другое преимущество состоит в том, что для нормально распределённой ошибки МНК оптимален во многих смыслах (максимально правдоподобный, эффективно несмещённый и ещё в нескольких). Вопрос о том, насколько нормально пользоваться лишь нормальными моделями - лежит вне математики, и должен решаться исключительно на основе знаний о содержательной постановке. Скажем, если у нас есть основания ожидать двустороннего распределения Лапласа
то оптимальность убегает к методу наименьших модулей.
Реальное распределение будет, надо ожидать, отлично от любого аналитически выразимого, и вопрос о том, довериться ли ЦПТ и постулировать нормальный закон или заложиться на "тяжёлые хвосты", остаётся на совести исследователя. Зачастую это выбор между тем, чтобы в предположении нормальности получить быстрый, однозначный и почти всегда наиболее точный ответ, но с некоторой малой вероятностью нарваться на большой выброс, получив бред, или же, отказавшись от гипотезы нормальности, получить ответ менее точный, но устойчивый к выбросам.
Часто предпочитают по-прежнему использовать МНК, однако в обязательном порядке исследуя регрессионные остатки для выявления возможных выбросов, содержательного их анализа и принятия на основе такого анализа решения либо об отбрасывании этих наблюдений, как грубых ошибок (измерения ли, или включения данных наблюдений в выборку), либо об отказе от МНК в пользу МНМ или иного метода, либо о признании выборки и результатов расчёта вполне валидными.
Выбор между обычной постановкой регрессионной модели
и моделью с ошибками в обеих переменных также должен делаться не на основании общематематических соображений, а исключительно содержательных. Возможно, тут потребуется и более сложный подход, скажем, популярные в эконометрике структурные уравнения или относительно недавний метод частных наименьших квадратов
http://www.twirpx.com/file/1097635/Что до регуляризации, то этот подход более общий, применяется не только в МНК, он может быть приложен и к МНМ, и к другим методам оценивания моделей, и к задачам другого рода.