Здравствуйте!
Нужно разобраться в такой задаче, решение которой переписывается с методички. Все непонятные места помечаются.
Пусть имеется тележка, движущаяся прямолинейно без трения по горизонтальным рельсам. Тележка управляется некоторой внешней силой, которую можно изменять в определенных пределах. Нужно остановить тележку в определенной точке, причем сделать это за кратчайшее время.
Дана следующая математическая модель задачи:
Пусть масса тележки равна
, ее начальная координата
, а начальная скорость
. Силу, которая воздействует на тележку, обозначим через
(причем
), а текущую координату тележки через
, где
- текущий момент времени. Из второго закона Ньютона известно, что
.
Представим тележку как материальную точку. Пусть эта материальная точка имеет массу
и движется по прямой в соответствии с законом
, где
- ее координата. Необходимо найти такую функцию управления
, которая переводила бы точку из начального положения
в начало координат за минимальное время
. Более формально:
Упростим эту задачу. Чтобы уменьшить число ее параметров, выполним следующую замену:
где
и
- некоторые действительные параметры. Имеем:
,
Выберем параметры
и
так, чтобы при
Получим
Тогда
.
Переобозначив
через
,
- через
получим задачу вида (1) (но с другими значениями параметров
). Обозначив
, имеем:
(Вопрос 1)Применим к задаче (2) принцип максимума Понтрягина. Начальное положение
при
и конечное положение
при
фиксированы, а сам конечный момент времени
не фиксирован.
Функция Гамильтона для задачи (2) имеет вид:
Решая сопряженную систему
,
, (
,
), получаем в явном виде общее решение
(Вопрос 2)где
,
- константы.
Очевидно, что максимум функции
по
достигается при
Таким образом, оптимальное управление
может принимать лишь два значения:
или
, и имеет (в силу линейности функции
)
не более одной точки переключения (Вопрос 3), т.е. такой точки, в которой функция
меняет знак.
a) Сначала, для определенности, рассмотрим случай, когда
. Убедимся, что управления
и
не могут перевести фазовую точку из положения
в начало координат.
Действительно, если
то
. Отсюда
(Вопрос 4) и мы никогда не можем попасть в начало координат. Если
, то
при
, т.е.
. Но
, т.е мы можем попасть в начало координат, но при этом скорость будет отлична от нуля (в рассматриваемом случае
скорость равна
). Аналогично и для третьего уравнения
,
. Имеем
(Вопрос 5),
где
(Вопрос 6),
. Отсюда видно, что не существует момента времени
, для которого выполнялись бы условия
, (всегда мы имеем
).
Остается управление
Такому управлению и начальным условиям
соответствует траектория (выкладки аналогичны проведенным выше)
Из условий
находим
Итак, принцип максимума позволил нам выделить единственное управление
Это есть и оптимальное управление, так как из физических соображений ясно, что решение исходной задачи существует. Следовательно, оптимальна и соответствующая траектория
Вообще, нужно еще рассмотреть случай (б), когда начальное положение
не фиксировано, но это требует более сложных выкладок, поэтому я не буду набирать его из книги и постараюсь разобраться с пунктом (а).
Теперь вопросы:
1) Почему у нас при замене
, и откуда берется условие
? И вообще, почему мы можем сводить задачу оптимального быстродействия к эквивалентной? Возникает аналогия с определенным интегралом: заменили переменную и соответствующие пределы, а результат не изменился. Но как это объяснить для задачи оптимального быстродействия?
2) Почему
? Ведь должно быть
, ведь
- общая константа для двух решений.
3) Как показать, что у функции
не более одной точки переключения, и как используется точка переключения в принципе максимума Понтрягина?
4) Непонятны выкладки. Почему
? Если мы решим диф. уравнение, то получим ответ
, где
- любая, в том числе отрицательная константа.
5) Совсем неясно, почему
.
6) Наверное, здесь опечатка:
, так как у нас в задача даже нет
. Но что должно быть вместо него, я так и не понял.
Спасибо за внимание!