Тогда Вы крутой. Советую в таком случае подход с матрицами. Там не надо дифференцировать вектор по вектору. Там надо продифференцировать скаляр

по

. А чтобы здесь не столкнуться с дифференцированием вектора по вектору, это можно сделать по определению, а не по правилу дифференцирования произведения. Просто распишите

как

, где

--- постоянный вектор,

--- всё, что убывает "быстрее", чем

при

. Тогда

будет искомой производной (градиентом). В случае с данной

это делается очень легко (в одну строчку).