Почему нельзя?
Что тогда имеют ввиду Бьёркен и Дрелл под фразой, идущей ниже формулы (1.19) "если разложить корень в ряд, мы получим уравнение, содержащее все степени оператора дифференцирования; следовательно теория нелокальна"?
Посмотрим на ряд Тейлора

Коэффициенты найти легко, но даже и без этого из того, что особенности в

следует, что они порядка

(ну, м.б. чуть похуже или получше). Поэтому этот ряд примененный к функции

будет сходится только на функциях, аналитических с радиусом сходимости

. А для таких функций понятие носителя отсутствует: если она равна

на маленьком интервальчике, то она равна

всюду.
Что имеют в виду ? Не знаю, но не вполне правы. Почему? Рассмотрим

Он содержит все производные, но он сходится на функциях, производные которых растут как

(или грубо

). И такие функции не обязаны быть аналитическими, они принадлежат классу Жевре с показателем

, и для них понятие носителя имеет смысл: есть такие функции, отличные от

на сколь угодно малом отрезке, и равные

вне его.
А вот
является оператором сдвига, и потому нелокален.
Впрочем, можно показать, что оператор конечного порядка

(т.е. такой, что

) либо нелокален, либо дифференциальный порядка

).
Цитата:
Что нужно знать из математики, чтобы осмыслить Ваше утверждение о дельта-функции и её производных?
Локальность в квантовой физике - это синоним слов "причинность, обуславливаемая близкодействием" или нет?
Элементы теории обобщенных функций.
Локальный оператор (в математике): если

на множестве

, то и

на множестве

. Если говорить об операторах конечного порядка, то такими будут только обычные дифференциальные операторы. Для операторов бесконечного порядка возможны примеры типа (*) (считайте их дифференциальными бесконечного порядка),.