Вместо того, чтобы говорить, что производная – это штука, которую в каждой точке можно посчитать или померить, вводят какую-то громоздкую функцию двух переменных.
Никто не делает этого, просто сначала, чтоб понять почему многочлен с положительной производной возрастает, используется простая оценка, которая потом берётся за определение Липшицевой дифференцируемости, которая работает для всех аналитических и даже достаточно гладких функций. Это совершенно естественное обобщение.
-- 07.06.2014, 16:18 --переносятся на гладкие функции по теореме Вейерштрасса об аппроксимации непрерывных функций многочленами.
Чтобы переносились, надо доказывать теорему Вейерштрасса об аппроксимации в классе

. Подождите,... в каком таком классе? Его же сначала определить надо.
Да ничего не надо "определять сначала," я просто говорю, что все формулы остаются в силе, и переучивать ничего не понадобится.