Столкнулся с таким выражением:
![$$\xi=E[d^2]+W^TRW-2P^TW,$$ $$\xi=E[d^2]+W^TRW-2P^TW,$$](https://dxdy-03.korotkov.co.uk/f/2/e/8/2e8b1559463add14a59d8c644074e96282.png)
при этом W - вектор, P - вектор, R - матрица. Теперь мы хотим вычислить градиент:
![$$\nabla=\frac{\partial\xi}{\partial W}=[\frac{\partial\xi}{\partial w_0} \text{ } \frac{\partial\xi}{\partial w_1} \text{ } ... \text{ } \frac{\partial\xi}{\partial w_L}]^T=2RW-2P$$ $$\nabla=\frac{\partial\xi}{\partial W}=[\frac{\partial\xi}{\partial w_0} \text{ } \frac{\partial\xi}{\partial w_1} \text{ } ... \text{ } \frac{\partial\xi}{\partial w_L}]^T=2RW-2P$$](https://dxdy-04.korotkov.co.uk/f/b/e/9/be9914e86d91ae931a5b0279d067325582.png)
Вот я совершенно не понимаю, как вообще вычислять этот градиент. Третье слагаемое ещё более-менее понятно, только не очень ясно, куда в

теряется транспонирование. Первое слагаемое понятно - от

не зависит, значит производные равны нулю. Второе - вообще ноль понимания. Мне кажется я чего-то фундаментально не понимаю, но я с таким впервые сталкиваюсь...