Тут еще вот что можно сказать... Когда речь идет о радиотехнических приложениях, то, как известно, основная форма представления низкочастотного сигнала - это комплекснозначное представление (
baseband signal в англоязычной литературе).
И соответственно аргументами оптимизируемых целевых функций при этом являются комплекснозначные величины - комплекснозначные векторы (а в примере выше обычные квадратичные формы заменяются
эрмитовыми квадратичными формами). Естественно, что при этом сама целевая функция по прежнему остается вещественнозначной! Т.е. перед нами вещественнозначная функция комплекснозначного аргумента:
![$\mathbb{C}^n\to\mathbb{R}$ $\mathbb{C}^n\to\mathbb{R}$](https://dxdy-02.korotkov.co.uk/f/9/b/d/9bd6e25f66bc9880e177b12b3e59f15d82.png)
. Но эту функцию можно рассматривать и как вещественнозначную функцию вещественнозначных аргументов - вещественных и мнимых частей изначального комплекснозначного вектора:
![$\mathbb{R}^n\times\mathbb{R}^n\to\mathbb{R}$ $\mathbb{R}^n\times\mathbb{R}^n\to\mathbb{R}$](https://dxdy-02.korotkov.co.uk/f/d/2/6/d267d04f9580c6047146e9992479523982.png)
. Ограничения могут быть тоже изначально сформулированы в комплекснозначном виде. И естественно одно комплекснозначное ограничение эквивалентно двум вещественнозначным (относительно мнимых и вещественных частей исходного). Т.е. надо понимать, что оптимизационная задача, в которой фигурируют комлекснозначные аргументы и комплекснозначные ограничения - это на самом деле оптимизационная задача с вещественнозначными аргументами и вещественнозначными ограничениямми!
Однако!!!! Однако, ввиду удобства целесообразней все же работать с комплекснозначными агрументами и ограничениями (помня, что на самом деле речь идет о вещественнозначных аргументах и ограничениях)! Для этого необходимо выработать некий
ФОРМАЛИЗМ, который бы делал комплекснозначное представление (и все манипуляции с комплекснозначными величинами) эквивалентным вещественнозначному. Этот формализм естественно уже давно выработан и состоит из двух ингредиентов:
1)
Исчисление Виртингера [1]
2) Небольшая модификация в методе множителей Лагранжа для инкорпорирования (корректным образом) комплекснозначных ограничений.
Целевая функция, будучи вещественнозначной функцией комплекснозначного аргумента, является функцией НЕГОЛОМОРФНОЙ, т.е. в смысле
Коши-Римана недифференцируемой, т.е. обычная "комплексная производная" тут вообще не имеет никакого смысла. А если целевую функцию рассматривать, как вещественнозначную функцию вещественнозначных аргументов (вещественных и мнимых частей) и дифференцировать по ним (по вещественным и мнимым частям), то такие производные имеют обычный смысл (смысл обычных частных производных). Так вот, исчисление Виртингера - это по сути формализм, позволяющий (формальным образом) вычислять эти обычные частные производные (по вещественным и мнимым частям), но при этом оставаясь в рамках удобного комплекснозначного представления и оперируя комплекснозначными аргументами. Если
![$z=x+j y$ $z=x+j y$](https://dxdy-02.korotkov.co.uk/f/5/a/b/5abb3f37c972ebfaedf3696879523d2e82.png)
и имеется функция
![$f(z)=f(z,\bar{z})=f(x,y)$ $f(z)=f(z,\bar{z})=f(x,y)$](https://dxdy-01.korotkov.co.uk/f/0/2/4/024c8de23e15a4125b9b0093dca93a2682.png)
, то
пара производных Виртингера ![$\frac{\partial f}{\partial z}, \frac{\partial f}{\partial \bar{z}}$ $\frac{\partial f}{\partial z}, \frac{\partial f}{\partial \bar{z}}$](https://dxdy-04.korotkov.co.uk/f/3/0/e/30ecd4c29aecf075c25cfa09a6e411d282.png)
определяется следующим образом:
![$\frac{\partial f}{\partial z}=\left.\frac{\partial f(z,\bar{z})}{\partial z}\right|_{\bar{z}=\operatorname{const}}=\frac{1}{2}(\frac{\partial f(x,y)}{\partial x} - j \frac{\partial f(x,y)}{\partial y})$ $\frac{\partial f}{\partial z}=\left.\frac{\partial f(z,\bar{z})}{\partial z}\right|_{\bar{z}=\operatorname{const}}=\frac{1}{2}(\frac{\partial f(x,y)}{\partial x} - j \frac{\partial f(x,y)}{\partial y})$](https://dxdy-04.korotkov.co.uk/f/3/5/4/354ef5a15efe31512e82576030226ddd82.png)
![$\frac{\partial f}{\partial \bar{z}}=\left.\frac{\partial f(z,\bar{z})}{\partial \bar{z}}\right|_{z=\operatorname{const}}=\frac{1}{2}(\frac{\partial f(x,y)}{\partial x} + j \frac{\partial f(x,y)}{\partial y})$ $\frac{\partial f}{\partial \bar{z}}=\left.\frac{\partial f(z,\bar{z})}{\partial \bar{z}}\right|_{z=\operatorname{const}}=\frac{1}{2}(\frac{\partial f(x,y)}{\partial x} + j \frac{\partial f(x,y)}{\partial y})$](https://dxdy-03.korotkov.co.uk/f/6/c/6/6c6b6fdd5059f146456ca0f7e413bf7282.png)
Обратите внимание, как связаны обычные частные производные, берущиеся по вещественной и мнимой частям, с производными Виртингера. Для многомерного случая все аналогично. И что еще из всего этого следует? А следует из всего сказанного то, что
НЕОБХОДИМОЕ УСЛОВИЕ ЛОКАЛЬНОГО ЭКСТРЕМУМА может быть записано как равенство нулю одной из двух (любой на выбор) производных Виртингера! В многомерном случае - одного из двух градиентов (на выбор). Но обычно предпочитают
![$\frac{\partial f}{\partial \bar{z}}=0 \Leftrightarrow \left\lbrace \frac{\partial f(x,y)}{\partial x} =0, \frac{\partial f(x,y)}{\partial y} =0 \right\rbrace$ $\frac{\partial f}{\partial \bar{z}}=0 \Leftrightarrow \left\lbrace \frac{\partial f(x,y)}{\partial x} =0, \frac{\partial f(x,y)}{\partial y} =0 \right\rbrace$](https://dxdy-01.korotkov.co.uk/f/8/1/7/81755ba9ca5d5bc73c26da6e0af346a982.png)
, чтобы иметь в итоге дело с выражениями относительно обычных
![$z$ $z$](https://dxdy-04.korotkov.co.uk/f/f/9/3/f93ce33e511096ed626b4719d50f17d282.png)
, а не комплексно сопряженных
![$\bar{z}$ $\bar{z}$](https://dxdy-03.korotkov.co.uk/f/2/5/b/25bf7d306bcdadffd1ce898f3eb380c582.png)
величин.
ПримерЕсли
![$f(z,\bar{z})=z\bar{z}$ $f(z,\bar{z})=z\bar{z}$](https://dxdy-03.korotkov.co.uk/f/a/b/5/ab5ba4ee04e1b2b7e482aa4b124eae6582.png)
, то для (формального) вычисления
![$\frac{\partial f}{\partial z}$ $\frac{\partial f}{\partial z}$](https://dxdy-04.korotkov.co.uk/f/f/4/6/f46ee0b5d4cb83e25bf8c03071f8e22082.png)
переменная
![$\bar{z}$ $\bar{z}$](https://dxdy-03.korotkov.co.uk/f/2/5/b/25bf7d306bcdadffd1ce898f3eb380c582.png)
принимается константой, не зависящей от
![$z$ $z$](https://dxdy-04.korotkov.co.uk/f/f/9/3/f93ce33e511096ed626b4719d50f17d282.png)
, и дальше производная вычисляется по обычным правилам (как будто
![$z$ $z$](https://dxdy-04.korotkov.co.uk/f/f/9/3/f93ce33e511096ed626b4719d50f17d282.png)
обычная вещественная переменная):
![$\frac{\partial f}{\partial z}=\bar{z}$ $\frac{\partial f}{\partial z}=\bar{z}$](https://dxdy-01.korotkov.co.uk/f/8/a/8/8a8c5b6c1fde1fc8499d6c4a74cda96b82.png)
. Аналогично
![$\frac{\partial f}{\partial \bar{z}}=z$ $\frac{\partial f}{\partial \bar{z}}=z$](https://dxdy-03.korotkov.co.uk/f/a/c/1/ac163d92e79791731e81303c4dd317d782.png)
. В этом и состоит суть и удобство формализма.
Осталось слегка модифицировать метод множителей Лагранжа. Рассмотрим для примера оптимизационную задачу с одним комплекснозначным ограничением:
![$\min\limits_{}f(z), c(z)=0, z\in \mathbb{C}^n; f(z)\in\mathbb{R}, c(z)\in \mathbb{C}$ $\min\limits_{}f(z), c(z)=0, z\in \mathbb{C}^n; f(z)\in\mathbb{R}, c(z)\in \mathbb{C}$](https://dxdy-02.korotkov.co.uk/f/9/a/2/9a200132642bf5c1c459b5c4936515f782.png)
C учетом того, что одно комплекснозначное ограничение эквивалентно двум вещественным, (стандартная) функция Лагранжа запишется в виде:
![$L(z)=L(x,y)=f(z)-\lambda_1 Re(c(z)) - \lambda_2 Im(c(z))=f(z)-Re(\bar{\lambda} c(z))=$ $L(z)=L(x,y)=f(z)-\lambda_1 Re(c(z)) - \lambda_2 Im(c(z))=f(z)-Re(\bar{\lambda} c(z))=$](https://dxdy-01.korotkov.co.uk/f/8/7/8/8787a3c447e11304c5a0fd388ce4519e82.png)
![$=f(z)-\frac{1}{2}(\bar{\lambda} c(z)+\lambda \overline{c(z)})$ $=f(z)-\frac{1}{2}(\bar{\lambda} c(z)+\lambda \overline{c(z)})$](https://dxdy-04.korotkov.co.uk/f/7/1/5/715af950cb71374cee335d585d1becc182.png)
, где
![$\lambda=\lambda_1+j\lambda_2$ $\lambda=\lambda_1+j\lambda_2$](https://dxdy-02.korotkov.co.uk/f/9/b/d/9bd456c8b5bbaf44a840967d13bdf68782.png)
В последней строке множитель
![$1/2$ $1/2$](https://dxdy-02.korotkov.co.uk/f/d/5/d/d5d5564ce0bb9999695f32da6ba7af4282.png)
можно запихнуть в
![$\lambda$ $\lambda$](https://dxdy-04.korotkov.co.uk/f/f/d/8/fd8be73b54f5436a5cd2e73ba9b6bfa982.png)
, т.е. в итоге иметь дело с выражениями вида
![$L(z)=L(x,y)=f(z)-\bar{\lambda} c(z)-\lambda \overline{c(z)}$ $L(z)=L(x,y)=f(z)-\bar{\lambda} c(z)-\lambda \overline{c(z)}$](https://dxdy-01.korotkov.co.uk/f/8/0/c/80c5c92ef4b16b94770a742fa120568582.png)
, но это как говорится "на вкус и цвет". Собственно говоря, мы привели функцию Лагранжа к виду, пригодному для применения исчисления Виртингера и записи необходимых условий экстремума:
В случае нескольких ограничений все аналогично!
1.
Ken Kreutz-DelgadoThe Complex Gradient Operator and the CR-Calculushttps://arxiv.org/abs/0906.4835