9889

Оптимальное управление

Реферат

Математика и математический анализ

Оптимальное управление ВВЕДЕНИЕ Задачи оптимального управления относятся к теории экстремальных задач, то есть задач определения максимальных и минимальных значений. Развитие теории экстремальных задач привело в XX веке к созданию линейного программ...

Русский

2013-03-18

291 KB

53 чел.

Оптимальное управление

ВВЕДЕНИЕ

Задачи оптимального управления относятся к теории экстремальных задач, то есть задач определения максимальных и минимальных значений.

Развитие теории экстремальных задач привело в XX веке к созданию линейного программирования, выпуклого анализа, математического программирования, теории минимакса и некоторых иных разделов, одним из которых является теория оптимального управления. Эта теория подобно другим направлениям теории экстремальных задач, возникла в связи с актуальными задачами автоматического регулирования в конце 40-х годов (управление лифтом в шахте с целью наискорейшей остановки его, управление движением ракет, стабилизация мощности гидроэлектростанций и др.).

Заметим, что постановки отдельных задач, которые могут быть интерпретированы как задачи оптимального управления, встречались и ранее, например, в "Математических началах натуральной философии" И. Ньютона (1687). Сюда же относятся и задача Р. Годдарда (1919) о подъеме ракеты на заданную высоту с минимальными затратами топлива и двойственная ей задача о подъеме ракеты на максимальную высоту при заданном количестве топлива.

За прошедшее время были установлены фундаментальные принципы теории оптимального управления: принцип максимума и метод динамического программирования. Указанные принципы представляют собой развитие классического вариационного исчисления для исследования задач, содержащих сложные ограничения на управление. Сейчас теория оптимального управления переживает период бурного развития как в связи с наличием трудных и интересных математических проблем, так и в связи с обилием приложений, в том числе и в таких областях, как экономика, биология, медицина, ядерная энергетика и др.

  1.  Постановка задачи

Мы будем предполагать, что закон движения объекта (и закон воздействия «рулей» на это движение) записывается в виде системы дифференциальных уравнений

 (1)

или, в векторной форме

    (2)

где f(x, u) – вектор с координатами f 1(x, u), f 2(x, u),  f n(x, u). Функции f i определены для любых значений векторной переменной хХ и для значений u, принадлежащих области управления U. Они предполагаются непрерывными по совокупности переменных х1, х2,, хn, u и непрерывно дифференцируемыми по х1, х2,, хn. Иначе говоря, функции

определены и непрерывны на прямом произведении XU.

Заметим, что система (1) автономна, т. е. правые ее части не зависят от времени t. Случай, когда правые части зависят от t, мы рассмотрим позже (п. 10).

Если задан закон управления, т. е. выбрано некоторое допустимое управление u=u(t), то уравнение (2) принимает вид

    (3)

откуда (при любых начальных условиях x(t0)=x0) однозначно определяется закон движения объекта x=x(t), т. е. решение уравнения (3), определенное на некотором отрезке времени. Это решение является абсолютно непрерывной вектор–функцией, почти всюду (на отрезке своего определения) удовлетворяющей соотношению (3).

Мы будем говорить, что допустимое управление u(t) переводит точку х0 в точку х1, если решение x(t0) уравнения (3), удовлетворяющее начальному условию x(t0)=x0, проходит в некоторый момент t1 через точку х1, т. е. удовлетворяет также конечному условию x(t1)=x1.

Предположим теперь, что задана функция f 0(х1, х2, …, хn; u)=f 0(x, u), определенная и непрерывная вместе со своими частными  на всем пространстве ХU. Тогда основная задача (отыскание оптимальных управлений) может быть сформулирована следующим образом:

В фазовом пространстве X даны две точки x0 и х1. Среди всех допустимых управлении u= u(t), переводящих точки x0 в точку х1 (если такие управления существуют), найти такое, для которого функционал

    (4)

принимает наименьшее возможное значение; здесь x(t) – решение уравнения (3) с начальным условием x(t0)=x0, a t1 – момент прохождения этого решения через точку x1.

Отметим, что (при фиксированных t0, x0, х1) верхний предел t1 в интеграле (4) не является фиксированным числом, а зависит от выбора управления u(t), переводящего точку х0 в точку x1 (этот верхний предел определяется из соотношения х(t1)1). О решении задачи для случая закрепленного верхнего предела мы будем говорить в п. 11.

Управление u(t), дающее решение поставленной выше задачи, называется оптимальным управлением, соответствующим переходу из точки х0 в точку х1, а соответствующая траектория x(t) – оптимальной траекторией. Таким образом, основная задача заключается в отыскании оптимальных управлений (и соответствующих оптимальных траекторий).

Важным частным случаем поставленной выше оптимальной задачи является случай, когда f 0(x, u)1. В этом случае функционал (4) принимает вид

     (5)

и оптимальность управления u(t) означает минимальность времени перехода из точки х0 в точку х1. Задачу отыскания оптимальных управлений (и траекторий) в этом случае мы будем называть задачей об оптимальном быстродействии.

  1.  Классификация задач оптимального управления динамическими системами

Запишем формулировку задачи оптимального управления. Дана система, объект, процесс. Система описывается дифференциальным уравнением:

,

где  x – вектор фазовых координат (далее будем все вектора рассматривать как векторы – столбцы), u – вектор управления, t – время.

На вектора x и u наложены ограничения x X, uU.

Система рассматривается на интервале t[0, T].

Требуется определить вектор–функции u(t), x(t) доставляющие минимум функционалу J=J(x, u) при переводе из начального состояния (x(0), 0) в конечное  состояние (x(T), T).

Задачи оптимального управления классифицируются по способу задания функционала, по способу задания ограничений вдоль траектории и по способу задания краевых условий.

Способы задания функционала:

Интегральный функционал.

 F – дифференцируемая функция своих аргументов.

При отсутствии ограничений на x и u задача называется задачей Лагранжа и является классической задачей вариационного исчисления. В качестве примера можно рассмотреть агрегат, который должен дать максимальное количество продукции. При этом функция F (x, u, t) имеет смысл мгновенной производительности, а интеграл – полную выработку продукции.

Задача Майера.

Минимизируется функционал

J(x, u)=[x(T), T].

Например, задача о достижении наибольшей дальности ракетой.

Формально задача Майера является более общей, чем задача Лагранжа. Любая задача Лагранжа может рассматриваться как частный случай задачи Майера.

Действительно, достаточно ввести новую скалярную переменную

xn+1=F(x, u, t),

 новый фазовый вектор

и вектор

тогда система будет описываться уравнением:

а минимизации подлежит функционал

Задача Больца. Функционал смешанного типа.

Можно усмотреть, что задача Больца также может быть сведена к задаче Майера.

Задача на быстродействие.

Этим термином объединяются задачи, в которых функционалом является время, т.е. требуется перевести систему из одного состояния в другое за минимальное время.

Способы задания ограничений

а) ограничения только на управление.

Например,

u(t)U или u(t) (t).

При наличии ограничений на управление классические методы оказываются непригодными.

б) ограничения на фазовые переменные.

Например,

x(t)X.

Могут быть ограничения типа равенств:

,

или типа неравенств:

.

в) совместные ограничения на управление и фазовые переменные. Бывают случаи, когда ограничение на управление и фазовые координаты не могут быть разделены (в экономике).

Здесь также ограничения типа равенств:

, j=1, , kn+m

и неравенств:

, j=1, , kn+m

г) изопериметрическая задача (задача с интегральными ограничениями)

где   j – скалярные функции,

L j – числа.

Название этому классу задач дала следующая историческая задача, изучавшаяся в конце XVII века. Определить кривую данной длины, которая ограничивает максимальную площадь.

Класс изопермических задач играет большую роль, как в технике, так и в экономике, когда задан суммарный объем некоторого ресурса, которым мы вправе распоряжаться.

Изопермическая задача может быть сведена к задаче Лагранжа или Майера увеличением размерности фазового вектора x

Xn+ j = j (x, u, t), (j=1, …, k),

с граничными условиями

xn+ j(0)=0,

xn+ j(T)=L j.

Способы задания краевых условий.

а) задача с фиксированными концами, когда х(0) и х(T) заданы. В данном случае задачи подразделяются на задачи с фиксированным и нефиксированным временем.

б) задача со свободным концом, когда х(0) или х(T) не задано. Здесь также задачи с фиксированным и нефиксированным временем

г) задача с подвижными концами, Т фиксировано, а х(0) и х(T) лежат на некоторых гиперповерхностях:

l[x(0)]=0,  j=1, , p,

где .

Задачи с дискретным временем.

С такими задачами мы сталкиваемся, когда осуществляем дискретизацию задачи, т.е. заменяем дифференциальное уравнение конечно – разностным. Кроме того, существует обширный класс задач в технике и экономике, которые являются дискретными по существу. Поэтому будем также рассматривать системы, описываемые конечно – разностными уравнениями xn=fn(xn, un),  n=0, , N.

Функционал для таких задач будет иметь вид:

   – задача Лагранжа,

J(x, u)(xN)     – задача Майера,

  – задача Больца.

Например, изопериметрические ограничения записываются в виде:

  1.  Допустимые управления

Мы будем рассматривать поведение объекта, состояние которого в каждый момент времени характеризуется n переменными х1, х2,, хn (например, координатами и скоростями). Векторное пространство X векторной переменной х={х1, х2,, хn} является фазовым пространством рассматриваемого объекта. Поведение (движение) объекта заключается (с математической точки зрения) в том, что переменные х1, х2,, хn меняются с течением времени. Предполагается, что движением объекта можно управлять, т. е. что объект снабжен некоторыми «рулями», от положения которых зависит движение объекта. Положения «рулей» характеризуются точкой u некоторой области управления U, которая может быть любым топологическим хаусдорфовым пространством. В приложениях важен случай, когда U является замкнутой областью некоторого r – мерного евклидова пространства Е; в этом случае задание точки u=(u1, u2,, ur)U равносильно заданию системы числовых параметров u1, u2,, ur.

Каждую функцию u=u(t), определенную на некотором отрезке t0tt1 времени t и принимающую значения в пространстве U, мы будем называть управлением. В дальнейшем предполагается, что выбран некоторый класс D управлений; управления, принадлежащие этому классу, будут называться допустимыми. От класса D допустимых управлений требуется только, чтобы он удовлетворял следующим трем условиям.

1) Все управления u=u(t), принадлежащие классу D (т. е. допустимые), должны быть измеримыми и ограниченными. Управление u=u(t), t0tt1, называется измеримым, если для любого открытого множества OU множество тех значений t, для которых u(t)O, измеримо на отрезке t0tt1. Управление ограниченно, если множество всех точек u(t), t0tt1, имеет в пространстве U компактное замыкание. (Если, в частности, U есть замкнутое подмножество векторного пространства переменной u=(u1, u2,, ur), то измеримость и ограниченность имеют обычный смысл.)

2) Если u(t), t0tt1, – допустимое управление и если и v – произвольная точка пространства U, a t', t" – такие числа, что t0 t't"t1, то управление u1(t), t0tt1, определяемое формулой

также является допустимым.

3) Если отрезок t0tt1 можно разбить точками деления на конечное число частичных отрезков, на каждом из которых управление u(t) допустимо, то это управление допустимо и на всем отрезке t0tt1. Допустимое управление, рассматриваемое на частичном отрезке, также является допустимым. Управление, получающееся из допустимого управления u(t), t0tt1, сдвигом времени (т. е. управление u1(t)=u(t—), t0+<t<t1 + ), также является допустимым.

В качестве класса допустимых управлений можно взять, например, класс всех измеримых ограниченных управлений. Другим примером может служить множество всех кусочно – непрерывных управлений (т.е. таких управлений u=u(t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция u(t) может терпеть разрывы первого рода). Этот класс допустимых управлений, по – видимому, наиболее интересен для технических применений развиваемой здесь теории; такие управления соответствуют предположению о «безынерционности» рулей. Можно также рассматривать класс всех кусочно – постоянных управлений, класс кусочно – линейных управлений и т. п. В дальнейшем класс D допустимых управлений предполагается фиксированным.

  1.  Эквивалентная формулировка задачи

Для формулировки и доказательства необходимого условия оптимальности нам будет удобно переформулировать поставленную выше задачу следующим образом. Добавим к фазовым координатам х1, х2,, хn, меняющимся по закону (1), еще одну координату х0, закон изменения которой имеет вид

 

где f 0 – функция, участвующая в определении функционала J. Иначе говоря, будем рассматривать систему дифференциальных уравнений

 (6)

правые части которой не зависят от переменной х0. Введя в рассмотрение вектор

={x0, x1,, xn}={x0, x1}

(n+1) – мерного векторного пространства X, мы сможем систему (6) переписать в векторной форме:

    (7)

где f(х, u) – вектор пространства X, имеющий координаты f 0(х, u), …, f n(x, u). Заметим, что вектор не зависит от координаты х0 вектора .

Пусть теперь u(t) – некоторое допустимое управление, переводящее х0 в x1, a x=x(t) – решение уравнения (3) с начальным условием x(t0) =x0. Обозначим через точку (0, х0), т.е. точку в пространстве Х, имеющую координаты где – координаты точки х0 в пространстве X. Тогда ясно, что решение уравнения (7) с начальным условием имеет вид

В частности, при t = t1 мы получим

т. е. решение уравнения (7) с начальным условием проходит при t=t1 через точку =(J, x1). Иначе говоря, обозначив через П прямую линию, проходящую в пространстве X через точку =(0, х1) параллельно оси х0 (эта прямая образована всеми точками (, x1), где число произвольно), мы можем сказать, что решение проходит в момент t=t1, через точку, лежащую на прямой П и имеющую координату x0=J. Обратно, если u(t) – такое допустимое управление, что решение уравнения (7) с начальным условием =(0, х0) проходит в некоторый момент t1 через точку П с координатой x0=J, то управление u(t) переводит (в пространстве X) точку х0 в точку x1 причем функционал (4) принимает значение J.

Таким образом, мы можем сформулировать поставленную выше оптимальную задачу в следующем эквивалентном виде.

В (n+1) – мерном фазовом пространстве X даны точка =(0, x0) и прямая П, параллельная оси х0 и проходящая через точку (0,x1). Среди всех допустимых управлений u=u(t), обладающих тем свойством, что решение уравнения (7) с начальным условием , пересекает прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую координату х0.

Эту задачу мы и будем решать. Термины «оптимальное управление» и «оптимальная траектория» мы сохраним и для задачи в этой новой формулировке.

  1.  Сопряженная система уравнений

Пусть L0— некоторая гиперплоскость пространства X, проходящая через точку х0 (т. е. n – мерное подпространство пространства ). Линейное преобразование переводит гиперплоскость L0 в некоторую гиперплоскость Lt (проходящую через точку ). Таким образом, мы получаем семейство гиперплоскостей {Lt}, получающихся, как мы будем говорить, переносом гиперплоскости L0 вдоль траектории . Найдем дифференциальное уравнение таких семейств гиперплоскостей.

Мы можем записать уравнение гиперплоскости Lt в виде

    (12)

где х, = 0, 1, …, n, – текущие координаты, взятые в пространстве Xt, а (t) – коэффициенты уравнения этой гиперплоскости (свободный член отсутствует, так как гиперплоскость Lt проходит через начало координат пространства Xt). Мы хотим узнать, каковы должны быть функции (t), чтобы уравнение (12) определяло при различных значениях параметра t семейство гиперплоскостей, перенесенных вдоль траектории х(t). Оказывается, что такие функции (t) можно находить из системы дифференциальных уравнений:

  (13)

В самом деле, рассмотрим скалярное произведение

векторов (t)={0(t), 1(t),, n(t)} и  , где i(t), i=0, 1, …, n, – некоторое (абсолютно непрерывное) решение системы (13). Мы имеем (почти всюду на рассматриваемом отрезке)

(заметим, что , так как функции f не зависят от x0); следовательно, в силу абсолютной непрерывности рассматриваемого скалярного произведения, оно постоянно. Таким образом, справедлива следующая

Лемма 1. Если (t)={0(t), …, n(t)} – решение системы уравнений (13), рассматриваемое на некотором отрезке времени I, а 0 – произвольный вектор, заданный в точке х(t0), где t0 – начальная точка отрезка I, то на всем отрезке I выполнено соотношение

Если функции i(t), i = 0, 1, …, n, удовлетворяют системе (13) и если вектор 0 лежит в гиперплоскости (t)x=0 (т. е. скалярное произведение ((t0),0), обращается в ноль), то и при любом t скалярное произведение обращается в ноль, т.е. каждый вектор , получающийся из 0 переносом вдоль траектории х(t), лежит в соответствующей гиперплоскости (12). Так как это справедливо для любого вектора 0 лежащего в гиперплоскости (t)x=0, то мы и получаем, что если функции i(t), i = 0, 1, …, n, удовлетворяют системе (13), то гиперплоскости (12) получаются друг из друга переносом вдоль траектории .

  1.  Игольчатые вариации

Центральным понятием для определения необходимых условий достижения минимума J(x, u) в задаче Л.С. Понтрягина является понятие игольчатого варьирования управления.

Пусть u*(x) – оптимальное управление – есть кусочно-непрерывная функция, принадлежащая U, x(t) – соответствующая ей фазовая траектория.

Игольчатым варьированием управления будем называть следующую конструкцию:

    (1)

где – заданная точка непрерывности функции, l – заданное положительное число, – произвольное положительное число, такое, что , а постоянная v такова, что vU.

Разность и сеть игольчатая вариация управления.

Перейдем теперь от задачи (3.1),(3.2) с ограничениями uU, x(0)E0, x(T)ET к следующей задаче.

Введем расширенный фазовый вектор

где x0 определим уравнением

Введем также расширенный вектор правых частей

Тогда уравнение (3.1) в новой постановке задачи примет вид

     (2)

причем не зависит от x.

Пусть – фазовая траектория, соответствующая управлению u.

Найдем вариацию фазовой траектории

  (3)

Смысл вариации состоит в том, что при 0 выражение является главной линейной частью приращения фазовой траектории, возникающего вследствие игольчатого варьирования управления. Т.к. и удовлетворяют уравнениям связи

    (4)

     (5)

   (6)

   (7)

Вычитая из (6) (7) деля на , и переходя к пределу, получаем

 (8)

Из определения u(t) видно, что для любого t< 

следовательно, , если t[t0,).

При

Покажем, что для любого

    (9)

В самом деле, при t= 

Далее, на интервале [, +l] и изменяются, следуя уравнениям (4) и (5), где u(t)=v.

Тем не менее, т. к. интервал [,+l] имеет длину O() мы имеем на конце интервала, оценку (9).

На интервале [+l, t] изменение функций и происходит снова по одному и тому же уравнению, и поэтому вследствие теоремы о непрерывной зависимости решения системы дифференциальных уравнений от начальных условий для t>+l также справедлива оценка (9) (решение системы непрерывно зависит от начальных условий. Добавки, которые получают функции при малых изменениях начальных условий удовлетворяют системе в вариациях).

Тогда для , используя теорему Лагранжа о конечных приращениях получаем:

после перехода к пределу

 (10)

Так как при  то из (10) следует, что h(t) – разрывная функция.

При из (10) удовлетворяет уравнению

     (11)

с начальным условием

  (12)

Введем для уравнения (11) сопряженную систему

     (13)

Составим скалярное произведение

Ранее мы установили свойство сопряженной системы:

Каково же было бы решение уравнения (11), 

     (14)

  1.  Принцип максимума

Решение классической вариационной задачи Лагранжа сводится к тому, что оптимальное управление должно быть стационарной точкой функции Гамильтона, т.е. удовлетворять векторному уравнению:

При решении этого уравнения определяется управление u* и вариационная задача сводится к краевой для обыкновенных дифференциальных уравнений.

Основное предположение, которое делается в вариационном исчислении, состоит в том, что управление может принадлежать всему пространству, т.е. на управление не накладывается ограничений.

В практических задачах управление, как правило, ограничено и поэтому необходимые условия, которые были установлены в вариационном исчислении, оказываются непригодными.

Их дальнейшим и существенным расширением является замечательный результат, установленный Львом Семеновичем Понтрягиным, который формулируется в виде теоремы, получившей название "принцип максимума".

Благодаря принципу максимума вариационную задачу при наличии ограничений на управление удается свести к краевой.

Определение: Пусть дана модель объекта управления , и функционал . Функцией Гамильтона (гамильтонианом) будем называть функцию вида: 

H(, х, u)=(, f(x, u))=.

Запишем теперь системы уравнений (6) и (13) в более удобном виде.

Для этого рассмотрим гамильтониан – функцию H переменных х1,, хn; 0,, n.

Непосредственно проверяется, что написанные выше уравнения могут быть с помощью гамильтониана Н записаны в виде следующей гамильтоновой системы:

   (14)

   (15)

При фиксированных значениях и функция H становится функцией параметра u; верхнюю грань значений этой функции обозначим через М(, ):

Если верхняя грань значений непрерывной функции H достигается на U, то М(, ) есть максимум значений функции H при фиксированных и . Поэтому нижеследующую теорему 1 (необходимое условие оптимальности), главным содержанием которой является равенство (16), мы называем принципом максимума.

Теорема 1. Пусть u(t) – такое допустимое управление, что соответствующая ему траектория системы (6), исходящая в момент t0 из точки  , проходит в момент t1>t0 через некоторую точку прямой П. Для оптимальности управления u(t) и соответствующей ему траектории , t0<t<t1, необходимо существование такого ненулевого абсолютно непрерывного вектора (t)={0(t), 1(t),, n(t)}, что

1) величины , (t), u(t) удовлетворяют гамильтоновой системе (14), (15);

2) почти для всех t, t0<t<t1, функция H((t),  (t), u) переменного uU достигает в точке u=u(t) максимума (знак (=) обозначает равенство, справедливое почти всюду):

H((t),  , u(t))(=)M((t),  (t)),    (16)

3) в начальный момент t0 выполнены соотношения

0(t0)0, M((t0),  (t0))=0.    (17)

Если величины (t),  , u(t) удовлетворяют условиям (1) и (2), то функции 0(t) и М((t),  ) переменной t являются постоянными, так что проверку соотношений (17) можно проводить не обязательно в момент t0, а в любой момент t, t0<t<tt.

Выведем из теоремы 1 аналогичное необходимое условие для оптимальности по быстродействию. Для этого в теореме 1 следует положить f 0(х, u)=1. Функция H принимает в этом случае вид

H=0+v f v(x, u)

(суммирование по v от 1 до n). Вводя n – мерный вектор ={0, 1,,n}. И функцию

H(, х, u)=v f v(x, u),

мы сможем записать уравнения (1) и (13) (кроме уравнения (13) для i=0, которое теперь не нужно) в виде гамильтоновой системы

    (18)

   (19)

При фиксированных значениях и х функция H становится функцией параметра u; верхнюю грань значений этой функции мы обозначим через М(, х):

В силу соотношения

H(, х, u) = H(, , u) – 0

мы получаем

M(,x)=M(, ) – 0

и поэтому условие (16) принимает вид

H((t), x(t), u(t))(=)M((t),x(t))=00.

Таким образом, мы получаем следующую теорему.

Теорема 2. Пусть u(t) – допустимое управление, переводящее точку х0 в точку x1, a x(t) – соответствующая траектория, так что x(t0)=x0, x(t1)=x1. Для оптимальности по быстродействию управления u(t) и траектории х(t) необходимо существование такого ненулевого абсолютно непрерывного вектора (t)={(1(t), 2(t), …, n(t)}, что:

1) величины (t), x(t), u(t) удовлетворяют гамильтоновой системе (18), (19);

2) почти для всех t, t0 t t1, функция H((t), x(t), u) переменного uU достигает в точке u=u(t) максимума:

H((t), x(t), u(t))(=)M((t),x(t));    (20)

3) в начальный момент t0 выполнено соотношение

M((t0), x(t0)0.     (21)

Если величины (t), x(t), u(t) удовлетворяют условиям 1) и 2) то функция M((t), x(t)) переменного t постоянна, так что проверку соотношения (21) можно проводить не обязательно в момент t0, а в любой момент t, t0 t t1.

Пример1.

Дана модель объекта управления

где – 1  u  0, и функционал

Требуется найти оптимальную пару (x*(), u*()) на которой достигается минимум функционал.

Решение:

Сравнивая с общей постановкой задачи, имеем:

f = u, f 0 = x + u2, F 0. Решаем задачу Лагранжа.

Составляем гамильтониан:

H((t), x, u, t) = (t)u – (x + u2),  (t)=;

Выпишем уравнения принципа максимума:

Решаем краевую задачу

  1.  Обсуждение принципа максимума

Теорема 1 позволяет из всех траекторий, начинающихся в точке и кончающихся в некоторой точке прямой П, и соответствующих им управлений выделить лишь отдельные, вообще говоря, изолированные траектории и управления, удовлетворяющие всем сформулированным условиям. Действительно, мы имеем 2n+3 соотношений (14), (15), (16) между 2n +3 переменными  х, , и, т.е. имеем «полную систему соотношений» для определения всех этих переменных. Так как, далее, соотношение (16) конечно (не дифференциально), а число дифференциальных уравнений равно 2n+2 соотношения (14) и (15), то решения системы уравнений (14), (15), (16) зависят, вообще говоря, от 2n+2 параметров (начальных условий). Однако один из этих параметров является несущественным, так как функции (t) определены лишь с точностью до общего множителя (ибо функция Н однородна относительно ). Кроме того, один из параметров связан условием, что в начальный момент величина M((t),  (t)) обращается в ноль.

Итак, имеется 2n параметров, от которых зависит все многообразие решений системы (14), (15), (16). Этими 2n параметрами следует распорядиться так, чтобы траектория проходила при заданном t=t0 через точку  , а при каком–нибудь t>t0 через точку на прямой П. Число t1t0 также является параметром, так что всего у нас имеется 2n+1 существенных параметров. Условие прохождения через точку и прямую П дает 2n+l соотношений. Следовательно, можно ожидать, что имеются лишь отдельные, изолированные траектории, соединяющие точку с прямой П и удовлетворяющие условиям, указанным в теореме 1. Лишь эти отдельные, изолированные траектории и могут оказаться оптимальными (ибо указанные в теореме 1 условия необходимы для оптимальности).

Если, в частности, условиям теоремы 1 удовлетворяет лишь траектория, соединяющая точку х0 с точкой прямой П, а из технических соображений, приведших к постановке оптимальной задачи, ясно, что оптимальная траектория должна существовать, то можно надеяться, что найденная траектория как раз является оптимальной. Следует, однако, отметить, что математически вопрос о существовании оптимальной траектории представляется очень важным и трудным.

  1.   Условия трансверсальности

В этом пункте мы рассматриваем оптимальные задачи с подвижными концами. Пусть S0 и S1 – гладкие непересекающиеся многообразия (произвольных размерностей r 1, r 2, каждая из которых не превосходит n – 1), расположенные в пространстве X. Поставим задачу найти такое допустимое управление u(t), которое некоторую (заранее не заданную) точку х0S0 переводит в некоторую точку x1S1 и при этом придает функционалу (4) минимальное значение. Эту задачу мы и будем называть оптимальной задачей с подвижными концами. Если оба многообразия S0, S1 вырождаются в точки, то задача с подвижными концами обращается в прежнюю, уже решенную нами задачу (задачу с закрепленными концами). Ясно, что если бы точки х0, х1 были известны, то мы имели бы задачу с закрепленными концами. Отсюда следует, что управление u(t), оптимальное в смысле задачи с подвижными концами, оптимально и в прежнем смысле, т. е. принцип максимума (теоремы 1, 2) остается в силе и для задачи со свободными концами.

Однако в этом случае нужно иметь еще соотношения, из которых можно было бы определить положение точек х0, х1 на многообразиях S0, S1. Такими соотношениями и являются выводимые в этом пункте условия трансверсальности.

Пусть x0S0, x1S1 – некоторые точки, а Т0 и Т1 – касательные плоскости многообразий S0 и S1, проведенные в этих точках. Плоскости Т0 и Т1 расположены в пространстве X, а следовательно, и в пространстве X (мы считаем, что ХХ, отождествляя точку (х1, х2,, хn)X с точкой (0, х1, х2, …. хn)X). Пусть далее, u(t), x(t), t0  t  :t1, – решение оптимальной задачи с закрепленными концами х0 и х1. Обозначим через Т0 и T1 плоскости, параллельные Т0 и Т1 и проходящие через точки х(t0) и х(t1) соответственно. Наконец, пусть (t) – вектор, существование которого утверждается в теореме 1. Мы будем говорить, что вектор (t) удовлетворяет условию трансверсальности в правом конце траектории х(t) (т. е. в точке х(t1)), если плоскость T1 целиком содержится в гиперплоскости (t1)x = 0 (напомним, что эта гиперплоскость предполагается проходящей через точку х(t1),через которую также проходит и плоскость T1). Иначе говоря, условие трансверсальности означает, что для любого вектора ={0, 1, 2, …, n}, принадлежащего (или параллельного) плоскости T1, выполнено соотношение ((t1),)=0. Аналогичный смысл имеет условие трансверсальности в левом конце траектории x(t) (нужно лишь заменить t1, T1 и Т1 на t0, T0 и Т0 соответственно). Пользуясь условиями трансверсальности, можно сформулировать решение задачи с подвижными концами.

Теорема 3. Пусть u(t), t0  t t1 – допустимое управление, переводящее некоторую фиксированную точку х0 в точку х1S1 a – соответствующая траектория (исходящая из точки =(0, х0)). Для того чтобы u(t) и давали решение оптимальной задачи с подвижным правым концом, необходимо, чтобы существовал вектор (t), удовлетворяющий условиям, указанным в теореме 1, и, кроме того, условию трансверсальности в точке .

Разумеется, если многообразие S1 вырождается в точку, то условие трансверсальности заменяется условием прохождения траектории через эту точку.

Пример 1.

Дана модель объекта управления

где x  R, u  R, t[0, 1], и функционал

Требуется найти оптимальную пару (x*(), u*()), на которой достигается минимум функционала.

Решение.

Сравнивая с общей постановкой задачи, имеем

f(x, u, t) = u, f 0(x, u, t) = u2 + x2, F(x) 0.

Решается задача Лагранжа.

  1.  Составляем Гамильтониан H((t), x, u, t) = (t)u u2 x2.
  2.  Находим максимум гамильтониана по управлению. Так как ограничения на управление отсутствуют, можно применить необходимые условия безусловного экстремума

откуда . Найденное управление обеспечивает максимум функции H((t), x, u, t), так как удовлетворяются достаточные условия экстремума

  1.  Выписываем условия принципа максимума:

  1.  Проверяем условия трансверсальности: так как

F  0, то  F = 0 и .

Поскольку t1=1 и x(t1) заданы, то  t1 = 0 и  x = 0. Поэтому условия трансверсальности выполняются.

5. Решаем краевую задачу:

отсюда находится оптимальная пара:

Получаем оптимальную траекторию  

  1.   Принцип максимума для неавтономных систем

В этом и следующих пунктах мы рассмотрим некоторые оптимальные задачи, решение которых получается либо в качестве следствия из предыдущих результатов, либо при помощи незначительных видоизменений проведенных выше рассуждений. Прежде всего, рассмотрим оптимальную задачу такого же вида, как и (1), (4), но в случае, когда функции f явно зависят от времени (пространство U предполагается независящим от времени). Таким образом, закон движения объекта и функционал, минимум которого ищется, принимают в рассматриваемом случае вид

  (22)

   (23)

Введя, как и прежде, новую координату

мы сформулируем рассматриваемую задачу в следующей форме (ср. п. 3):

В (n+1) – мерном фазовом пространстве X даны точка =(0, х0) и прямая П, параллельная оси х0 и проходящая через почку (0, х1). Среди всех допустимых управлений u=u(t), обладающих тем свойством, что решение системы

  (24)

с начальным условием =x0 пересекает прямую П, найти такое, для которого точка пересечения с прямой П имеет наименьшую координату х0.

Для решения этой задачи введем еще одно вспомогательное неизвестное хп+1, изменяющееся по закону

Очевидно, что хп+1  t. С помощью неизвестного хп+1 система (24) может быть записана в виде следующей автономной системы (т. е. системы, у которой правые части не зависят от t):

При этом мы должны найти оптимальную траекторию, соединяющую точку с некоторой точкой прямой S1 проходящей через точку параллельно оси хп+1 (ибо конечное значение переменного хп+1, т.е. момент времени, когда движущаяся точка приходит в положение, не являются заранее заданным). Таким образом, мы получаем обычную оптимальную задачу с закрепленным левым и подвижным правым концом.

Напишем принцип максимума и условие трансверсальности для полученной задачи. Сопряженная система уравнений имеет вид (суммирование по от 0 до n)

  (25)

   (26)

Согласно теоремам 1 и 3, для решения рассматриваемой задачи нужно составить функцию

0 f 0(x, u, xn+1)+ 1 f 1(x, u, xn+1)+…+ n f n(x, u, xn+1)+ n+11.

Эту функцию мы обозначим через H*, (а не через H, как в теореме 1), сохранив обозначение H для функции

H(, x, u, t)=0f 0(x, u, t)+ 1 f 1(x, u, t)+…+ n f n(x, u, t).

Точно также максимум по u функции H* при фиксированных xi, i мы обозначаем через M*(, x, xn+1) (а не через M, как в теореме 1), сохранив обозначение M(, x, t) для максимума (по u) функции при фиксированных , x, t . Таким образом, учитывая соотношение xn+1 t, мы можем написать

H*=H+n+1,  M*=M+n+1,

и потому соотношение М*(=)М*0, выполняющееся вдоль оптимальной траектории (см. теорему 1), принимает вид

H((t), x(t), u(t), t)(=)M((t),x(t), t) n+1 (t).   (27)

Наконец, условие трансверсальности в правом конце траекторий показывает, что прямая S1 (параллельная оси хп+1) содержится в плоскости (t1)x=0 (суммирование по от 0 до n+1). Иначе говоря,

n+1(t1)=0.

Вместе с соотношениями (27), (26) это дает

Теорема 4. Пусть и(t) – такое допустимое управление, что соответствующая ему траектория х(t) системы (24) – исходящая в момент t0 из точки х0, проходит в момент t1>t0 через некоторую точку прямой П. Для оптимальности управления и(t) и соответствующей ему траектории х(t), t0 t t1, необходимо существование такого ненулевого абсолютно непрерывного вектора (t)={0(t), 1(t),…, n(t)}, что:

1) вершины х(t), (t), u(t) удовлетворяют гамильтоновой системе

или, что то же самое, системе (24), (25);

2) почти для всех t, t0 t t1, функция H((t), х(t), u, t) переменного uU достигает в точке u=u(t) максимума:

H((t), (t), u(t), t)(=)M((t),x(t), t),

3) выполнены соотношения

(28)

Если величины (t), x(t), u(t) удовлетворяют условиям 1) и 2), то функция 0(t) переменного t постоянна, а функция М((t), (t), t) может лишь на константу отличаться от интеграла, указанного в соотношениях (28), так что проверку соотношений (28) достаточно произвести лишь в какой – либо один момент времени t, t0 t t1; например, вместо (28) достаточно проверить соотношения

0(t1)  0, М((t1), (t1), t1)=0.    (29)

Если теперь предположить, что точка x1 в которую точка х0 должна переводиться с помощью управления u(t), не неподвижна, а перемещается, т. е. x1=x1(t), то формулировка теоремы 4 несколько меняется. Именно пусть u(t) – такое допустимое управление, которое точку х0, в некоторый момент времени t1 переводит в точку х1(t1), и пусть

– касательный вектор к кривой x1(t) в момент t1. Тогда, после введения вспомогательного переменного xn+1=t, мы получим, что многообразие S1, будет уже не прямой, параллельной оси xn+1, а линией , где – параметр. Касательная прямая к этой линии в точке =t1 определяется вектором {q1, q2,, qn, 1}, и потому условие трансверсальности принимает вид

v(t1)qv+ n+1(t1)1=0.

Отсюда, учитывая соотношение (27), находим

М((t1), (t1), t1)= – n+1(t1)= v(t1)qv.

Так как, согласно (27) и (26), функция М((t), (t), t) является первообразной для , то мы получаем

   (30)

Это и есть соотношение, которым заменяется равенство (28) в формулировке теоремы 4; в связи с этим соотношение (29) принимает вид

  (31)

В остальном формулировка теоремы 4 сохраняется.

Наконец, рассмотрим неавтономную оптимальную задачу с подвижными концами. Ограничимся случаем подвижного правого конца. Пусть S1(t) – перемещающееся многообразие, дифференцируемым образом зависящее от t и внутренних координат на этом многообразии. Задача заключается в отыскании такого допустимого управления u(t), что точка, движущаяся по закону (22) с начальным условием x(t0) = x0, попадает в некоторый момент t1 на многообразие S(t1), причем осуществляется минимум функционала (23) при этих условиях. Обозначим через Т1 касательную плоскость многообразия S(t1) в точке х(t1), а через Т1 – параллельную ей плоскость, проходящую через точку . Далее, обозначим через множество всех точек (n+1) – мерного пространства (х1, х2,, хn, t), для которых точка (х1, х2,, хn) принадлежит многообразию S(t). Ясно, что является (r1+1) – мерным многообразием (где r1 – размерность многообразия S(t)). Так как множество всех векторов, касательных к многообразию в точке (х(t1), t1) и имеющих вид {q1, q2, …, qn, 0}, имеет размерность r1 а многообразие имеет размерность > r1, то существуют такие числа q1, q2, . . ., qn, что вектор {q1, q2, . . ., qn, 1} касается многообразия (в точке (х(t1), t1)). Эти числа q1, q2, . . ., qn дадут нам возможность написать соотношения (30), (31), которым должен удовлетворять вектор (t). Наконец, как и в п. 18, будем говорить, что вектор (t)={0(t), 1(t), …, n(t)} удовлетворяет условию трансверсальности в точке t1, если плоскость Т1 расположена целиком в гиперплоскости (t1)x=0. При этих условиях имеет место следующее предложение (обобщение теоремы 3 на неавтономный случай):

Для того чтобы u(t) и давали решение оптимальной неавтономной задачи с подвижным правым концом, необходимо, чтобы существовал вектор (t), удовлетворяющий условиям, указанным в теореме 4, с заменой соотношений (28), (29) соотношениями (30), (31) и, кроме того, условию трансверсальности в точке t1.

Это утверждение легко вытекает из теоремы 3 после введения новой переменной xn+1=t (ср. доказательство теоремы 4).

Отметим, что если многообразие S1 неподвижно, то соотношение (30), (31) совпадают с (28), (29), так как в этом случае вектор {0, 0, …, 0, 1} касается многообразия .

  1.   Задача с закрепленным временем

Предположим теперь, что рассматривается такая же оптимальная задача, что и в п. 2 (или в п. 10, т. е. с зависимостью функции f от времени), но с условием, что время t0 начала движения точки (из положения х0) и время t1 ее попадания в точку x1 заданы заранее, так что время t1t0 закреплено. Решение этой задачи мы легко получим из предыдущих рассмотрении. Именно: мы условимся рассматривать лишь такие символы

={, vi, ,  ti,  t},

для которых t =0. Тогда все рассуждения предыдущих пунктов, приведшие нас к доказательству принципа максимума, сохраняются и даже несколько упрощаются.

Пусть u(t), t0 t t1 – допустимое управление, для которого соответствующая траектория x(t), исходящая в момент времени t0 из точки х0, удовлетворяет условию x(t1)=x1. Для того чтобы u(t) давало решение поставленной оптимальной задачи с закрепленным временем, необходимо, чтобы существовал такой абсолютно непрерывный вектор (t)={0(t), 1(t),…, n(t)}, что:

1) величины х(t), (t), u(t) удовлетворяют гамильтоновой системе

или, что то же самое, системе

2) почти для всех t, t0  t t1 функция H((t), x(t), u) переменного uU достигает в точке u=u(t) максимума:

H((t), , u(t))(=)M((t), );

3) Функция 0(t) положительна (что достаточно проверить лишь в какой либо одной точке отрезка t0  t t1, так как, на основании условия 1), 0=const).

Отметим, что эта теорема в такой же степени решает задачу с закрепленным временем, в какой теорема 1 решает задачу с незакрепленным временем. Уменьшение числа условий на одно (а именно отсутствие, по сравнению с теоремой 1, условия M((t1), )=0) компенсируется здесь тем, что и число неизвестных уменьшается на единицу, так как время t1 прохождения траектории через точку x1 теперь задано.

Пример 6.

Дана модель объекта управления

, и функционал

Решение:

f = u, f 0 = x cos t, F  0.

Составляем гамильтониан:


 

А также другие работы, которые могут Вас заинтересовать

12172. Диагностика работоспособности материнской карты с помощью POST card 35.25 KB
  Лабораторная работа № 16 Диагностика работоспособности материнской карты с помощью POST card 1. Цель работы Научиться пользоваться POST картой 2. Теоретические сведения POST карта тестер для диагностики и ремонта материнских плат ...
12173. Строение, принцип действия и тех.обеспечение ИБП 116.11 KB
  Лабораторная работа №19 Строение принцип действия и тех.обеспечение ИБП 1. Цель работы Изучение принципа работы ИБП 2. Теоретические сведения Составные части ИБП Реализация основной функции достигается работой устройства от аккумуляторов установленных в корпу...
12174. Сборка разборка ПК. Замена основных узлов 652.51 KB
  Лабораторная работа №20 Сборка разборка ПК. Замена основных узлов 1. Цель работы Научиться собирать и разбирать ПК 2. Теоретические сведения Подготовка к сборке компьютера Итак перед вами лежат все необходимые комплектующие вашего будущего системного блока. ...
12175. Работа операционной системы MS-DOS 99.52 KB
  Лабораторная работа № 21 Работа операционной системы MSDOS 1. Цель работы Изучение работы с операционной системой MSDOS 2. Теоретические сведения Работа в MSDOS Как компьютер хранит данные Вы должны знать как компьютер хранит данные в своей памяти. В первую очередь ...
12176. Установка операционной системы семейства Windows 270.69 KB
  Лабораторная работа №22 Установка операционной системы семейства Windows. 1. Цель работы Изучение процесса установки Windows XP 2. Теоретические сведения Windows XP – это одна из самых популярных операционных систем с удобным пользовательским интерфейсом. Она инсталлируетс...
12177. Установка операционной системы UNIX 64.74 KB
  Лабораторная работа № 23 Установка операционной системы UNIX 1. Цель работы Изучение процесса установки UNIX 2. Теоретические сведения Основы инсталляции UNIX Инсталляция UNIX на диск требует больше знаний и предварительного планирования чем инсталляция DOS или Microsoft Wi...
12178. Установка операционной системы Linux 65.23 KB
  Лабораторная работа №24 Установка операционной системы Linux 1. Цель работы Изучение процесса установки Linux OC 2. Теоретические сведения Процесс установки Linux на ваш компьютер во многом определяется используемым дистрибутивом и специальным программным обеспечение...
12179. Состав и назначение пакета офисных программ MS-Office 25.63 KB
  Лабораторная работа №25 Состав и назначение пакета офисных программ MSOffice 1. Цель работы Изучение пакетного офиса MSOffice 2. Теоретические сведения Microsoft Office Офисный пакет приложений созданных корпорацией Microsoft для операционных систем Microsoft Windows и Apple Mac OS X. В
12180. Работа с антивирусными программами 27.44 KB
  Лабораторная работа № 26 Работа с антивирусными программами 1. Цель работы Изучение работы с антивирусными программами 2. Теоретические сведения Антивирусная программа антивирус программа для обнаружения компьютерных вирусов а также нежелательных считаю