Ответ а-ля "потому что так мы получим правильные законы движения из варьирования действия" не годится, ибо тривиален.
Это, по сути, экспериментальный факт.
Из законов Ньютона, понятно, что
А сами законы Ньютона откуда? Они тоже основаны на экспериментальных фактах. Из одних и тех же фактов можно вывести законы Ньютона, принцип наименьшего действия с лагранжианом от производных не выше первой, и из этих теоретических моделей - одну из другой, в обе стороны.
Заглянем теперь в ЛЛ1
Загляните в Арнольда "Математические методы классической механики". Он явно проговаривает, что это экспериментальный факт.
разьве это равенство не говорит, что вариация скорости и вариация координат НЕ независимы?
На самом деле, фокус не здесь. Фокус чуть выше. На самом деле, конечно, 

 не функция 

 (которая каждому числу 

 сопоставляет число 

). На самом деле, 

 - 
оператор, который берёт 
функцию 
 и выдаёт в результате новую функцию 
.$ $L[q(t)](t).$](https://dxdy-02.korotkov.co.uk/f/1/9/8/198c07f4d11bbc35ef93aa35e4eb4d2d82.png)
 Но работать с операторами всерьёз - довольно сложно. Поэтому мы 
замечаем, что этот оператор имеет довольно простой вид: он включает в себя взятие производной, 

 причём только в первой степени - то есть фактически, берёт значения самой функции 

 и её первой производной 

 и от них уже ведёт себя просто как функция. Потом, обращаясь к вариационному исчислению, мы выясняем, что для таких операторов выполняется
 как будто для него 

 и 

 - независимые аргументы. Всё, после использования этой формулы мы можем обратиться уже к реальному смыслу 

 и заметить, что она, конечно, не независима от 

 и их вариации тоже не независимы. Говорить об их якобы-независимости нужно было только для получения (*).
А Бёрке - замечательный автор, и довольно глубоко глядящий, но на первых этапах стоит ознакомиться с более общепринятым изложением предмета. А то Бёрке уведёт в дебри дифференциальной геометрии и бесконечномерных пространств, и поминай как звали.