2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Оптимизация случайных величин
Сообщение14.07.2019, 21:32 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
Пусть случайные величины $U$ и $V$ равномерно распределены на $[0,1]$ и их коэффициент корреляции $\rho$, тогда
$${\bf E}UV=\frac{3+\rho}{12}.$$
Требуется найти максимум ${\bf E}\min\{U,V\}$ при этих условиях. Или хотя бы содержательную оценку сверху, зависящую от $\rho$.

Пока понятно, что ${\bf E}\min\{U,V\}\le 1/2$, и получила оценку снизу
$${\bf E}\min\{U,V\}={\bf E}\frac{U+V}{2}-{\bf E}\frac{|U-V|}{2}\ge \frac{1}{2}-\frac{1}{2}({\bf E}(U-V)^2)^{1/2}=
\frac{1}{2}\left(1-\sqrt{\frac{1-\rho}{6}}\right),$$
она точная при $\rho=+1$ ($V=U$), но заниженная при $\rho=-1$ ($V=1-U$).

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение14.07.2019, 22:58 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
Придумала еще оценку сверху
$${\bf E}\min\{U,V\}\le {\bf E}\sqrt{UV}\le \sqrt{{\bf E}UV}=\sqrt{\frac{3+\rho}{12}},$$
но она оказывается содержательной только при $\rho<0$, и конечно не является точной.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение15.07.2019, 23:37 


01/11/14
195
Для смеси векторов $(U,U)$ и $(U,1-U)$ (СВ $U$ равномерно распределена на $[0,1]$), если не ошибаюсь, $E \min \{U,V\}= (3+\rho)/8$.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение16.07.2019, 12:49 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
Спасибо, отличная идея. Это проходит как нижняя оценка для верхней границы. Причем точная на концах. Но является ли это верхней границей, это вопрос.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение18.07.2019, 20:19 


01/11/14
195
Для этой же смеси легко подсчитать и $E\max \{U,V\}$.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение18.07.2019, 21:45 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
Это понятно. Я говорю о верхней границе (или максимуме) возможных значений ${\bf E}\min\{U,V\}$ при данных условиях. На данный момент доказано, что
$$\frac{3+\rho}{8}\le\max_{U,V}{\bf E}\min\{U,V\}\le\min\left\{\frac{1}{2},\sqrt{\frac{3+\rho}{12}\right\}.$$
При этом верхняя оценка (моя) явно не является точной, про нижнюю оценку (Вашу) пока непонятно.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение20.07.2019, 16:11 


01/11/14
195
Похоже (highly likely :)), что граница точная. Посмотрел (доводить пока не планирую) 2 варианта доказательства, громоздко и нужно прорабатывать множество деталей.
1. 1). Разбиваем квадрат на 4 квадрата.
2). В каждом задаем значения: $p_i, m_i, \sigma_i^2, EU_iV_i, M_i = E \min \{U_i,V_i\}.$
3). Связываем соответствующие параметра соотношениями, следующими из условия задачи, а также условиями
$8M_i -\rho_i <3$.
4). Выражаем параметры $EUV, M=E \min \{U,V\}$ исходного квадрата через заданные в п.2.
5). В ограничениях п. 3 решаем оптимизационную задачу: $Q(p_i, m_i,...| \rho)=8M-\rho \to \max$.
Ясно, что $Q \ge 3$. Если получили $ \max Q =3$, то хорошо – получена точная граница, причем в этом случае экстремальное распределение не зависит от $\rho$. Если же max $Q >3$ , тоже хорошо – получен механизм построения последовательности улучшаемых распределений.
Другой вариант.
2. 1). Разбиваем квадрат на $n^2$ квадратиков (точек).
2). Устанавливаем, что в экстремальном случае число ненулевых точек не более $2n$.
3). Оптимизируем систему этих точек (непосредственно или при наращивании квадрата) и показываем, что Х-конструкция – одна из оптимальных.

alisa-lebovski, если у Вас будет продвижение по задаче, то просьба дать информацию.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение21.07.2019, 02:40 


01/11/14
195
Вспомнил про идею, которую обозначил в пред-предыдущем посте - привожу ниже.
Обозначим
$  Q_-[ F]= E_F \min \{U,V\}, Q^-[ F]= E_F \max \{ U,V \},$
$Q_-(\rho)=\max_F Q_-[ F], Q^-(\rho)=\min_FQ_-[ F].$
Ясно, что $Q_-[ F]+ Q^-[ F]=1,  Q_-(\rho)+ Q^-(\rho)=1,$ т. е. границы $Q_-(\rho),  Q^-(\rho) $ различаются на константу, причем $Q_-(\rho) $ выпукла вверх, а $Q^-(\rho)$ - вниз. Т.о., эти зависимости линейны и по известным значениям на концах отрезка получаем: $Q_-(\rho)=(3+\rho)/8,  Q^-(\rho)= (5-\rho)/8.$

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение22.07.2019, 10:26 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
Спасибо большое, буду думать. Я все-таки надеюсь, что найдется более изящное решение.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение22.07.2019, 22:00 


01/11/14
195
alisa-lebovski, по сформулированной задаче имеем решение, состоящее из трех ключевых и по существу элементарных посылок: 1) искомая зависимость (граница) выпукла вверх; 2) она же выпукла (т. е. вниз), и, следовательно, линейна; 3) эта зависимость (как линейная) определена по значениям в двух заданных крайних точках отрезка. Выражение записано.
Если уточните, что понимается под «более изящным решением», возможно, его поиски заинтересуют и других. Готов буду подключиться.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение26.07.2019, 17:11 
Заслуженный участник
Аватара пользователя


05/12/09
1769
Москва
Я пока не понимаю. Если есть две оптимальные пары $(U_1,V_1)$ для $\rho_1$ и $(U_2,V_2)$ для $\rho_2$, то для промежуточного значения $\rho=\alpha\rho_1+(1-\alpha)\rho_2$, $\alpha\in (0,1)$, возьмем их соответствующую смесь, которую обозначим через $(U_3,V_3)$ и получим
$${\bf E}\min\{U_3,V_3\}=\alpha{\bf E}\min\{U_1,V_1\}+(1-\alpha){\bf E}\min\{U_2,V_2\},$$
$${\bf E}\max\{U_3,V_3\}=\alpha{\bf E}\max\{U_1,V_1\}+(1-\alpha){\bf E}\max\{U_2,V_2\},$$ так что отсюда (из первого уравнения) следует вогнутость $\max_{U,V}{\bf E}\min\{U,V\}$, но не выпуклость.

И может существовать такая пара $(U_0,V_0)$, что
$${\bf E}\min\{U_0,V_0\}\ge\alpha{\bf E}\min\{U_1,V_1\}+(1-\alpha){\bf E}\min\{U_2,V_2\},$$
$${\bf E}\max\{U_0,V_0\}\le\alpha{\bf E}\max\{U_1,V_1\}+(1-\alpha){\bf E}\max\{U_2,V_2\},$$ почему нет?

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение26.07.2019, 17:51 


01/11/14
195
alisa-lebovski, тысяча извинений... Плотно займусь и доведу до кондиционного решения.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение30.07.2019, 16:17 


01/11/14
195
Описываются подходы и примеры, которые могут быть полезны для решения задачи.
Распределения на $[0,1]\times[0,1]$-квадрате для простоты и наглядности будем представлять плотностью распределения вероятностей $f(x,y)$, имея в виду возможность использования $\delta$-функции Дирака. Впрочем, все нижеизложенное легко перевести на язык функций распределения или вероятностной меры.
Задача:
$M=\int _0^1  \int _0^1  \min \{x,y\}  f(x,y)dy dx \to \max_{f \in \Omega_2 (\rho) }⁡ $ ,
где множество $\Omega_2 (\rho)$ определено условиями:
$ \int _0^1  \int _0^1    xyf(x,y)dy dx= \rho/4; $ $ f_X(x) =\int _0^1   f(x,y)dy=1  (x\in [0,1]) , f_Y(y) =\int _0^1    f(x,y) dx =1  (y\in [0,1])  $.

Учитывая, что
$f(y|x)=f(x|y)=f(x,y) $,
можно записать эквивалентные постановки задачи:
$ \int _0^1 \int _0^1 \min \{x,y\} f(y|x)dy dx \to \max_{f \in \Omega_2 (\rho)} $ ;⁡
$\int_0^1[\int _0^x  yf(y|x)+x\int _x^1  f(y|x)]dy dx \to \max_{f \in \Omega_2 (\rho)} $ .

Пусть $\rho’ =  \rho’(x)$ (не производная), причем $\rho =\int _0^1  \rho ' (x)  dx $, тогда
$\max M=\max_{ \rho'(x)}  \int _0^1  \max_{ f(y|x)\in  \Omega_1 (\rho')} \min \{x,y\} f(y|x) dy dx=$
=\max_{ \rho'(x)}  \int _0^1 \max_{ p,,y_1,y_2}   [(1-p(x)) \min \{x,y_1(x)\} +p(x) \min \{x,y_1(x)\} ] dx$,
где $(1-p(x)) y_1+p(x)y_2=\rho'(x)/4x$
(максимумы достигаются).

Переход к последнему соотношению сделан на основе теоремы Каратеодори, при этом механизм нахождения точек $y_1,y_2$ в принципе понятен.
Мы видим, что при каждом значении $x$ оптимальная в классе $\Omega_1 (\rho')$ функция распределения $F^* (y|x)$ (по крайней мере, одна из) дискретна и имеет не более двух точек роста (распределение двухатомное). Другими словами, если на $[0,1]\times [0,1]$-квадрате отметить точки с ненулевой плотностью вероятности, то они образуют такие множества, которые будут пересекаться не более чем в двух точках с любой «вертикальной» прямой и с любой «горизонтальной» прямой.

Теперь, если разбить квадрат на $2n\times 2n$ квадратиков (называем точками), к такому же заключению можно придти относительно числа ненулевых точек в каждом столбце и каждой строке квадрата. Множество из $4n$ точек может быть разбито на $n$ прямоугольников, в каждом из которых диагональные вершины (пусть главной диагонали) имеют одинаковые вероятности $p/2$, а побочной диагонали $(p-1)/2.$
Этот же факт непосредственно может быть установлен из теоремы Каратеодори (с учетом теоремы Рисса о распределениях): имеем множество распределений с $4n$ ограничениями ($2n$ по вертикали, $2n-1$ по горизонтали и одно на корреляцию), а также из рассмотрения сформулированной задачи как задачи ЛП. Следовательно, искомый максимум достигается на $4n$-атомном распределении. Анализ свойств экстремального распределения подсказывает, что в экстремальном случае точки будут расположены на диагоналях квадрата (такую конфигурацию точек будем называть - диагональной) Это в перспективе, конечно, нужно проверять.
Вместо этого далее делается попытка оптимизировать распределение вероятностей на диагональной конфигурации и проверить возможность улучшения за счет этого нижней границы.
Предварительно определим параметры квадрата, расположенного на диагонали и содержащего вершину на главной диагонали с вероятностью $p/2$:
$\rho'(p,x)=(2p-1) (2x-1)^2 ;$
$M'(p,x)=\frac p 2+(1-p)x $.

Таким образом, подбирая для диагональной конструкции зависимость $ p(x)= p(x,x)$ и вычисляя параметры $\rho, M$, можно попытаться поднять нижнюю границу.
Чтобы ускорить процесс, я не стал оптимизировать линейные, квадратичные и пр. зависимости, а просто выбрал два «крайних» варианта: 1)$\ p_1(x)=2x$ и 2)$ p_2(x)=1-2x$, для которых $p_i(x)=p_i(1-x)$.
1.$ p_1=2x \to  \rho_1=-1/12 , M_1=\frac {1} {6}.$
В соответствии с имеющейся нижней границей при $\rho_1=-1/12$ имеем $M^*=\frac {35} {96}$ ,т. е.
$M_1<M^*$ , значение $M_1$ ниже границы.
2. $p_2=1-2x \to  \rho _2=1/4  , M_2=\frac {5} {24}$.
В соответствии с имеющейся нижней границей при $\rho _2=1/4$ имеем $M^*=\frac {13} {32}$ ,т. е.
$M_2<M^*$ , значение $M_2$ ниже границы.

Если все-таки имеющаяся нижняя граница неулучшаема, то решение задачи, таким образом, можно свести к следующим этапам: 1)установить факт оптимальности диагональной конструкции и 2)доказать оптимальность для таких конструкций распределения с $ \rho'(x)=\operatorname{const}t= \rho$.

Рассуждения, формулы и вычисления нужно проверить.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение30.07.2019, 21:11 


01/11/14
195
alisa-lebovski, не удивляйтесь погрешностям при записи коэф. корреляции. Сначала записывал для центрированного квадрата, а потом что-то сдвинулось. Поправлю и можем сверить результаты.

 Профиль  
                  
 
 Re: Оптимизация случайных величин
Сообщение30.07.2019, 22:19 


01/11/14
195
Да и идея построения диагональных распределений была не такой. В общем беру паузу для исправлений.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 17 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group