Во-первых, интегралы должны легко браться. Как мы можем найти распределение

-й порядковой статистики? Обозначим плотность распределения через

, функцию распределения через

. Тогда плотность

-й порядковой статистики устно вычисляется как
Здесь

означает число способов среди

наблюдений выбрать одно, которое попадет "в точку"

и среди оставшихся

, которые будут левее. Далее,

есть вероятность для этих

наблюдений попасть левее точки

. Величина

есть вероятность для оставшихся

наблюдений попасть правее точки

. Ну и, наконец,

есть "вероятность выделенного одного наблюдения попасть в точку

".
На самом деле более строго рассуждая, нужно найти вероятность попадания в некоторую малую окрестность точки

, выделить член, пропорциональный длине этой окрестности, и коэффициент при нем как раз и будет плотностью. В общем, это все без особых трудов пишется аккуратно.
В данном случае из тех же соображений легко написать совместную плотность статистик

и

. В точке

она будет равна (с точностью до постоянного множителя, дающего способы выбора)
Далее заменяем

и интегрируем по области
Это будет ровно вероятность того, что разница между статистиками не превысит

, т.е. функция распределения. Интегралы разбиваются в произведение. Второй явно берется. А первый есть константа, которую можно не считать, так как она ищется из условия нормировки.
Второй способ проще, но он немного "на пальцах", хотя не очень сложно и аккуратно все обосновать через условные распределения. Он основан на свойстве отсутствия последействия для экспоненциального закона. Если переменная распределена экспоненциально на

и известно, что она приняла значение больше

, то при этом условии ее условное распределение также экспоненциальное на

.
Таким образом, мы знаем, что

наблюдений попали правее

-й порядковой статистики. При условии, что

, они распределены экспоненциально на отрезке

. Вероятность, что разница

будет больше

, есть вероятность того, что ни одно из этих наблюдений не попадет в интервал длины

. Эта вероятность равна

. Таким образом, функция распределения искомой разности равна

, и плотность получается именно такой, как нужно.