есть ли уместное применение дифференциальных уравнений в машинном обучении
Конечно, и еще какое! Есть такая вещь, называется нейродинамика. Она основывается на теории устойчивости Ляпунова и сводит обучение нейронной сети к интегрированию некоторой системы дифференциальных уравнений, вместо оптимизации классическими способами. Польза такого подхода в том, что теория устойчивости дает теоремы о сходимости. Почитать об этом можете у Хайкина "Нейронные сети", Bertsekas "Neuro-dynamic programming", статье Wang C. "Learning from Neural Control" 2006 года и др. статьях, гуглите.