Интересует, есть ли где-нибудь доказательство сходимости метода градиентного спуска ( про минимизацию ф-ии многих переменных ) в предположении
и выпукла. И вообще, верно ли это?
Рассуждения в этой ветке применимы к любой функции с ограниченными множествами уровня и единственной стационарной точкой.
Если нет условия единственности стационарной точки, то все предельные точки последовательности являются стационарными точками целевой функции.
По поводу правильного выбора шага по градиенту см. "Armijo rule" (правило Армихо).