2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Задача оптимального быстродействия на примере тележки
Сообщение29.01.2014, 23:21 
Здравствуйте!

Нужно разобраться в такой задаче, решение которой переписывается с методички. Все непонятные места помечаются.

Пусть имеется тележка, движущаяся прямолинейно без трения по горизонтальным рельсам. Тележка управляется некоторой внешней силой, которую можно изменять в определенных пределах. Нужно остановить тележку в определенной точке, причем сделать это за кратчайшее время.

Дана следующая математическая модель задачи:

Пусть масса тележки равна $m$, ее начальная координата $x_0$, а начальная скорость $v_0$. Силу, которая воздействует на тележку, обозначим через $u$ (причем $u \in [u_1,u_2]$), а текущую координату тележки через $x(t)$, где $t$ - текущий момент времени. Из второго закона Ньютона известно, что $m\ddot{x}=u$.

Представим тележку как материальную точку. Пусть эта материальная точка имеет массу $m$ и движется по прямой в соответствии с законом $m\ddot{x}=u$, где $x$ - ее координата. Необходимо найти такую функцию управления $u(t)$, которая переводила бы точку из начального положения $x_0$ в начало координат за минимальное время $T$. Более формально:
$$\left\{ \begin{align}
& T \to \min , \\ 
& m\ddot{x}=u, u \in [u_1,u_2], \\ 
& x(0)=x_0,\dot{x}(0)=V_0,x(T)=\dot{x}(T)=0. \\ 
\end{align} (1)$$

Упростим эту задачу. Чтобы уменьшить число ее параметров, выполним следующую замену:
$$x(t)=a\xi (t)+b(t-T)^2,$$
где $a$ и $b$ - некоторые действительные параметры. Имеем:
$ma\ddot{\xi }(t)+2mb=u$, $\ddot{\xi }(t)=\frac{u-2mb}{ma}$
Выберем параметры $a$ и $b$ так, чтобы при $u_1\leqslant u\leqslant u_2$
$-1\leqslant \frac{u-2mb}{ma}\leqslant +1$
Получим
$a=\frac{u_2-u_1}{2m},$ $b=\frac{u_1+u_2}{4m}$
Тогда $\ddot{\xi}(t)={w_0}, w \in [-1,+1]$.
Переобозначив $\xi ( t )$ через $x( t )$, $w$ - через $u$ получим задачу вида (1) (но с другими значениями параметров ${{x}_{0}}, {V_0}, {{m}_{0}}={{1,}_}{u_1}=-{{1,}_}{{u}_{2}}=1$). Обозначив $x={{x}_{1}}, \dot{x}={{x}_{2}}$, имеем:
$$\left\{ \begin{align}
  & T=\int\limits_{0}^{T}{1\cdot dt}\to \min , \\ 
 & {{{\dot{x}}}_{1}}={{x}_{2}}, {{{\dot{x}}}_{2}}=u, u\in [ -1,1 ], \\ 
 & {{x}_{1}}( 0 )=x_{1}^{0}, {{x}_{2}}( 0 )=x_{2}^{0}, {{x}_{1}}( T )={{x}_{2}}( T )={{0,}_}t\in [ 0,T ]. \\ 
\end{align} (2)$$
(Вопрос 1)
Применим к задаче (2) принцип максимума Понтрягина. Начальное положение $( x_{1}^{0},x_{2}^{0} )$ при $t=0$ и конечное положение $(0,0)$ при $t=T$ фиксированы, а сам конечный момент времени $T$ не фиксирован.
Функция Гамильтона для задачи (2) имеет вид:
$$H(x_{1} ,x_{2} ,u,\psi _{0} ,\psi _{1} ,\psi _{2} )=\psi _{0} +\psi _{1} x_{2} +\psi _{2} u.$$
Решая сопряженную систему
$\dot{\psi}_1=H_{x_1}'$, $\dot{\psi}_2=H_{x_2}'$, ($H_{x_1}'=0$, $H_{x_2}'=\psi_1$), получаем в явном виде общее решение
${{\psi }_{1}}( t )=C, {{\psi }_{2}}( t )=-Ct+D,$ (Вопрос 2)
где $C$, $D$ - константы.
Очевидно, что максимум функции $H$ по $u\in U$ достигается при
$$u( t )=\left\{ \begin{align}
  & {{1,}_}{_}{{\psi }_{2}}( t )>0, \\ 
 & -{{1,}_}{_}{{\psi }_{2}}( t )<0. \\ 
\end{align}$$
Таким образом, оптимальное управление $u$ может принимать лишь два значения: $u=+1$ или $u=-1$, и имеет (в силу линейности функции ${{\psi }_{2}}$) не более одной точки переключения (Вопрос 3), т.е. такой точки, в которой функция $u$ меняет знак.
a) Сначала, для определенности, рассмотрим случай, когда $x_{1}^{0}={{1,}_}x_{2}^{0}=0$. Убедимся, что управления $u( t )\equiv {{1,}_}u( t )\equiv -1$ и
$$u( t )=\left\{ \begin{align}
  & {{1,}_}{_}0\leqslant t\leqslant {{t}_{1}}, \\ 
 & -{{1,}_}{_}{{t}_{1}}\leqslant t\leqslant T. \\ 
\end{align}$$
не могут перевести фазовую точку из положения $( 1,0 )$ в начало координат.
Действительно, если $u( t )\equiv 1,$ то $\ddot{x}=1$. Отсюда $x( t )=1+\frac{{{t}^{2}}}{2}>{{0}_}\forall t\in [ 0,T ]$ (Вопрос 4) и мы никогда не можем попасть в начало координат. Если $u( t )\equiv -1$, то $\ddot{x}=-{{1,}_}x( t )=1-\frac{{{t}^{2}}}{2}=0$ при $t=\sqrt{2}$, т.е. $T=\sqrt{2}$. Но $\dot{x}( \sqrt{2} )=-\sqrt{2}\ne 0$, т.е мы можем попасть в начало координат, но при этом скорость будет отлична от нуля (в рассматриваемом случае $x_{1}^{0}={{1,}_}x_{2}^{0}=0$ скорость равна $x_{2}^{0}=0!$). Аналогично и для третьего уравнения $u( t )=1$ $( t\in [ 0,{{t}_{1}} ] )$, $u( t )=-1$ $( t\in [ {{t}_{1}},T ] )$. Имеем
$\ddot{x}={{1}_}( 0\leqslant t\leqslant {{t}_{1}} )\Rightarrow \dot{x}( t )=\dot{x}( 0 )+t=t\Rightarrow x( t )=1+\frac{{{t}^{2}}}{2},$ (Вопрос 5)
$\ddot{x}=-{{1}_}( {{t}_{1}}\leqslant t\leqslant T )\Rightarrow \dot{x}( t )=\dot{x}( {{t}_{1}} )-( t-{{t}_{1}} )\,\,\Rightarrow x(t)+\dot{x}( {{t}_{1}} )(t-{{t}_{1}})-\frac{{{(t-{{t}_{1}})}^{2}}}{2}$,
где ${{x}_{1}}=1+\frac{t_{1}^{2}}{2}$ (Вопрос 6), $\dot{x}( {{t}_{1}} )={{t}_{1}}$. Отсюда видно, что не существует момента времени $T$, для которого выполнялись бы условия $x( T )={{0,}_}\dot{x}( T )=0$, (всегда мы имеем $\dot{x}( T )<0!$).
Остается управление
$$u( t )=\left\{ \begin{align}
  & -{{1,}_}{_}0\leqslant t\leqslant {{t}_{1}}, \\ 
 & {{1,}_}{_}{{t}_{1}}\leqslant t\leqslant T. \\ 
\end{align}$$
Такому управлению и начальным условиям ${{x}_{1}}( 0 )={{1,}_}{{x}_{2}}( 0 )=0$ соответствует траектория (выкладки аналогичны проведенным выше)
$${{x}_{1}}( t )=\left\{ \begin{align}
  & 1-\frac{{{t}^{2}}}{2}, {_}0\leqslant t\leqslant {{t}_{1}}, \\ 
 & \frac{{{t}^{2}}}{2}-2{{t}_{1}}t+t_{1}^{2}+{{1,}_}{_}{{t}_{1}}\leqslant t\leqslant T, \\ 
\end{align}$$
$${{x}_{2}}( t )=\left\{ \begin{align}
  & -t, {_}0\leqslant t\leqslant {{t}_{1}}, \\ 
 & t-2t, {_}{{t}_{1}}\leqslant t\leqslant T. \\ 
\end{align}$$
Из условий ${{x}_{1}}( T )={{x}_{2}}( T )=0$ находим ${{t}_{1}}={{1,}_}T=2.$
Итак, принцип максимума позволил нам выделить единственное управление
$$u( t )=\left\{ \begin{align}
  & -{{1,}_}{_}0\leqslant t\leqslant {{t}_{1}}, \\ 
 & {{1,}_}{_}{{t}_{1}}\leqslant t\leqslant T. \\ 
\end{align}$$
Это есть и оптимальное управление, так как из физических соображений ясно, что решение исходной задачи существует. Следовательно, оптимальна и соответствующая траектория
$${{x}_{1}}( t )=\left\{ \begin{align}
  & 1-\frac{{{t}^{2}}}{2}, {_}0\leqslant t\leqslant 1, \\ 
 & \frac{{{( t-2 )}^{2}}}{2}, {_}1\leqslant t\leqslant 2. \\ 
\end{align}$$
$${{x}_{2}}( t )=\left\{ \begin{align}
  & -t, {_}0\leqslant t\leqslant 1, \\ 
 & t-{{2,}_}{_}1\leqslant t\leqslant 2. \\ 
\end{align}$$
Вообще, нужно еще рассмотреть случай (б), когда начальное положение $(x_{1}^{0},x_{2}^{0})$ не фиксировано, но это требует более сложных выкладок, поэтому я не буду набирать его из книги и постараюсь разобраться с пунктом (а).

Теперь вопросы:

1) Почему у нас при замене $\dot{x}_2=u$, и откуда берется условие ${{x}_{1}}( 0 )=x_{1}^{0}, {{x}_{2}}( 0 )=x_{2}^{0}, {{x}_{1}}( T )={{x}_{2}}( T )=0$? И вообще, почему мы можем сводить задачу оптимального быстродействия к эквивалентной? Возникает аналогия с определенным интегралом: заменили переменную и соответствующие пределы, а результат не изменился. Но как это объяснить для задачи оптимального быстродействия?

2) Почему ${{\psi }_{2}}( t )=-Ct+D$? Ведь должно быть ${{\psi }_{2}}( t )=Ct+D$, ведь $C$ - общая константа для двух решений.

3) Как показать, что у функции $u$ не более одной точки переключения, и как используется точка переключения в принципе максимума Понтрягина?

4) Непонятны выкладки. Почему $x(t)=1+\frac{{{t}^{2}}}{2}$? Если мы решим диф. уравнение, то получим ответ $x(t)=C+\frac{{{t}^{2}}}{2}$, где $C$ - любая, в том числе отрицательная константа.

5) Совсем неясно, почему $\dot{x}( t )=\dot{x}( 0 )+t=t$.

6) Наверное, здесь опечатка: ${{x}_{1}}=1+\frac{t_{1}^{2}}{2}$, так как у нас в задача даже нет $x_1$. Но что должно быть вместо него, я так и не понял.

Спасибо за внимание!

 
 
 
 Re: Задача оптимального быстродействия на примере тележки
Сообщение30.01.2014, 07:08 
Для начала поймите, как от уравнения второго порядка переходить к системе двух уравнений первого порядка. Несколько вопросов после этого решатся сами собой.

 
 
 
 Re: Задача оптимального быстродействия на примере тележки
Сообщение30.01.2014, 13:39 
Аватара пользователя
А разве не очевидно, что тележка пройдёт заданное расстояние за кратчайшее время, при максимальном по модулю ускорении? Осталось только удачно выбрать момент, в который поменять направление ускорения, чтобы тележка остановилась в заданной точке. Или я не прав?

 
 
 
 Re: Задача оптимального быстродействия на примере тележки
Сообщение30.01.2014, 14:00 
Аватара пользователя
topic80645.html

 
 
 [ Сообщений: 4 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group