SNet, постараюсь объяснить развернуто, как мне кажется, лучше всего вам это сейчас воспринимать:
Какое определения дифференциала?
Дифференциал функции 

 в точке 
 есть функция
 есть функция 
, где 

 - любое число. 
Для красоты и удобства можно ввести 

 - "дифференциал аргумента в точке 

" и записать:
 
 И далее уже не важно, чему именно равно это 

, дифференциалы используются тут как связанные переменные ( называя их переменными, я подразумеваю их значение, формально они функции) и 
никогда явно не приравниваются к конкретным числам!Часто, особенно в физике, нет разделения на функцию 

 и аргумент 

, а есть просто различные величины ,зависящие друг от друга.
(в данном случае 
я расписываю все для одномерного случая, когда величина явно выражается через одну другую
*).
И в этом смысле совершенно не важно, что изначально было принятно за 

, а что за "дифференциал функции". 
Поэтому можно так же (если такая функция 

 есть) положить и 

, 

, так или иначе мы придем 
к конкретной линейной связи между переменными 

 и 

.
Можно записывать связь с третьей (при параметризации) : 
 
   
 Зачем это нужно? 
В первую очередь введение дифференциалов позволяет нам комфортнее работать с производными. Например, мы можем сокращать их (значения - это же просто числа!): 

 Ничего нового мы тут не получили (формула для производной композиции известна, а условия эквивалентны условиям на возможность введения такого определения), но согласитесь, это выглядит нагляднее и приятнее.
Также мы можем теперь вести записи выражений с производными в виде 

 (поделить на нужный дифференциал и получить соответствующую производную всегда успеем!).
И так далее.
Но если дифференциалы принимают значения в виде обычных чисел,  то почему их часто неформально называют "бесконечно малыми"?
1)Во-первых, с точки зрения физики, если мы говорим о величине вроде скорости 

, то, подразумевая, что измерить время и расстояние можно не сколько угодно малыми (нас ограничивает шкала линейки и часов), можем записать 

 ( 

 и 

 - маленькие, насколько возможно, значения изменений расстояния и времени).
Чем более мелкое изменение этих величин мы можем измерить, тем формула точнее. В этом смысле можно  неформально трактовать запись 

 как случай "предельно точного измерения".
То есть когда 

 и 

  "
бесконечно малые". 
В физике порой их можно условно считать очень малыми, но конечными значениями (в зависимости от задачи).
2) Часто допускается "слишком вольное" обращение с дифференциалом: 
Например, если нужно найти производную от 

 , то мы должны формально взять предел 

 выражения 

 (хотя бы интуитивно вы эту операцию уже понимаете).
И тут "возникает соблазн" после подставления определения 

 приравнять числитель сразу к 

: 

, что 
неверно (ведь 

)!
Однако, если мы положим 

, то равенство станет верным (интуитивно должно быть понятно, почему в таких случаях так получается)!
Поэтому, удобно при всех таких вычислениях записывать и нелинейную связь между дифференциалами, "пренебрегая" (просто убирая их) величинами "другого порядка" (чтобы получить правильную 
линейную связь).
В этом смысле можно сказать так же, что 

 - "бесконечно малая величина" и выражения типа 

 есть на самом деле 

 (т.к "прибавление  бесконечно малой к числу ничего не изменит", 

)
Поэтому имеет место быть и такое понимание-определение, но повторюсь, что 
оно неформальное.
Что насчет интегрирования?
Смысл значка 

 в записи 

 вовсе не соответствует введенному определению,
 он именно 
неразделимый с значком интеграла значок !
Но все же, например, при замене переменных, оказывается, что он ведет себя точно также:

И вообще, с этим обозначением нам становится психологически более комфортнее переходить от дифференциальной записи 

 к 

 (обоснование которого совсем не связано с понятием дифференциала)
Мы как-бы можем теперь воспринимать это как формальное навешивание 

 на выражение

Поэтому целесообразно условно обобщить определение:
И просто подразумевать, что мы можем свободно выполнять с дифференциалом все подобные манипуляции (раз математически это же корректно!) и это есть суть одно и тоже.
* В многомерном случае все также обобщается, дифференциал 

 в 

 есть 

. 
С ним работаем в этом же духе, не забывая различать отношение дифференциалов и частные производные.
Аналогично с многомерным интегрированием по 

, там дифференциалы при замене переменных ведут себя "как положено"...
Так же уже должно быть понятно, что такое дифференциал вектора 

 (можно определить хотя бы по компонентам), что используется в физике.
Часто бывает удобно ставить дифференциал перед большим выражением типа 

 (понятно что это есть),  поэтому окончательно обобщаем:
Этого общего неформального понимания для работы с выражениями в физике должно быть вам достаточно.