2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Оптимальная стратегия
Сообщение15.08.2020, 17:59 
Аватара пользователя


26/03/13
326
Russia
Даны точные функции поведения динамической системы со случайной ошибкой - error term в каждой функции. Управлять можно только одной переменной $X$, от которой зависят все данные функции. В каждом периоде $t$ при воздействии на переменную $X$, получается какой-то выигрыш $y_t$, $t\in[0,T]$. Обозначим $y_t = F(f_1,f_2,f_3,\dots)$, где $f_i=f(X)+error_i$, допустим $error_i$ распределены одинаково. Нужно получить оптимальную динамическую стратегию управления переменной $X$, чтобы максимизировать выигрыш $Y=\Sigma_{t=0}^Ty_t$. Как изменится ответ, если X - вектор?

Думаю можно для начала предположить, что функция одна $f_1$ и линейно зависит от X, то есть $f_1 = A_1X_t+B_1+error_1$ и $y_t$ линейно зависит от $f_1$ , тогда имеем линейную регрессию. Допустим $X$, тогда выбираем первые несколько раз наугад, затем оцениваем коэффициенты на каждом шаге и определяем какой $X_{t+1}$ использовать.
Если функций больше и зависимости линейные, то $y_t$ можно представить в виде $y_t = AX_t + B + error$, где $A=\Sigma_{i=1}^nA_i, B = \Sigma_{i=1}^nB_i,error = \Sigma_{i=1}^nerror_i$. Таким образом снова имеем линейную регрессию.
Если функции $f_i$ нелинейные, но $y_t$ линейно зависит от них, то имеем $y_t=\Sigma_{i=1}^na_if_i(X) + b + error, error = \Sigma_{i=1}^n a_i\cdot error_i$. В данном случае палагаю нужно использовать алгоритмы ML, затрудняюсь сказать какие.
Если $y_t$ нелинейно зависит от функций и функции нелинейно зависят от $X$, то наверное тоже нужно использовать ML.

Верно ли изложил подход, подскажите, пожалуйста?

 Профиль  
                  
 
 Re: Оптимальная стратегия
Сообщение15.08.2020, 21:46 
Заслуженный участник
Аватара пользователя


01/09/13
4770
Joe Black в сообщении #1479318 писал(а):
тогда имеем линейную регрессию

Зачем? - всякий раз надо брать максимальный/минимальный $X$...

 Профиль  
                  
 
 Re: Оптимальная стратегия
Сообщение16.08.2020, 23:59 
Аватара пользователя


26/03/13
326
Russia
Спасибо, с линейным случаем понял, вопрос есть с нелинейным. Еще не совсем понятное условие, известны ли функции или нет. Если функции известны и нормально дифференциируемы, то ищем максимум аналитически, если нет то используем метод конечных разностей и ищем его численно. Если известен только вид функций, то думаю можно использовать Gradient Descent.

 Профиль  
                  
 
 Re: Оптимальная стратегия
Сообщение17.08.2020, 00:09 
Заслуженный участник
Аватара пользователя


01/09/13
4770
Joe Black в сообщении #1479525 писал(а):
то ищем максимум аналитически,

Вот только максимум чего?

-- 17.08.2020, 00:11 --

Joe Black в сообщении #1479318 писал(а):
Верно ли изложил подход, подскажите, пожалуйста?

Вообще, есть ощущение, что Вы задачу изложили не вполне верно...

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: YandexBot [bot]


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group