Ответ а-ля "потому что так мы получим правильные законы движения из варьирования действия" не годится, ибо тривиален.
Это, по сути, экспериментальный факт.
Из законов Ньютона, понятно, что
А сами законы Ньютона откуда? Они тоже основаны на экспериментальных фактах. Из одних и тех же фактов можно вывести законы Ньютона, принцип наименьшего действия с лагранжианом от производных не выше первой, и из этих теоретических моделей - одну из другой, в обе стороны.
Заглянем теперь в ЛЛ1
Загляните в Арнольда "Математические методы классической механики". Он явно проговаривает, что это экспериментальный факт.
разьве это равенство не говорит, что вариация скорости и вариация координат НЕ независимы?
На самом деле, фокус не здесь. Фокус чуть выше. На самом деле, конечно,

не функция

(которая каждому числу

сопоставляет число

). На самом деле,

-
оператор, который берёт
функцию 
и выдаёт в результате новую функцию
.$ $L[q(t)](t).$](https://dxdy-02.korotkov.co.uk/f/1/9/8/198c07f4d11bbc35ef93aa35e4eb4d2d82.png)
Но работать с операторами всерьёз - довольно сложно. Поэтому мы
замечаем, что этот оператор имеет довольно простой вид: он включает в себя взятие производной,

причём только в первой степени - то есть фактически, берёт значения самой функции

и её первой производной

и от них уже ведёт себя просто как функция. Потом, обращаясь к вариационному исчислению, мы выясняем, что для таких операторов выполняется
как будто для него

и

- независимые аргументы. Всё, после использования этой формулы мы можем обратиться уже к реальному смыслу

и заметить, что она, конечно, не независима от

и их вариации тоже не независимы. Говорить об их якобы-независимости нужно было только для получения (*).
А Бёрке - замечательный автор, и довольно глубоко глядящий, но на первых этапах стоит ознакомиться с более общепринятым изложением предмета. А то Бёрке уведёт в дебри дифференциальной геометрии и бесконечномерных пространств, и поминай как звали.