32230

Синтез оптимального управления при ограничениях на управляющее воздействие

Лекция

Информатика, кибернетика и программирование

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования принципа максимума предложенного в 1956 году академиком Л. Принцип максимума является дальнейшим развитием вариационного исчисления. Это условие положено в основу принципа максимума. Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Русский

2013-09-04

163 KB

4 чел.

Лекция №6

Синтез оптимального управления при ограничениях на управляющее воздействие

При реализации оптимального управления часто приходится  накладывать ограничения на управляющие воздействия,  обусловленные ограниченностью источника энергии или “прочность ” объекта  управления. Например, при синтезе оптимального по быстродействию управления необходимо, чтобы:

.                                         (6.1)

Очевидно, что на управляющее воздействие должно быть наложено ограничение:

,                                                    (6.2)

иначе получим очевидное, но не реализуемое решение: tк=0, при u = ∞.

Данная задача может быть решена методом классического вариационного исчисления. Идея заключается в том,  что в критерий (6.1) вводятся  дополнительная функция от “u”, называемая штрафной функцией. Эта функция должна вызывать  резкое увеличение критерия при превышении допустимого значения um. Даная функция задается следующим образом:

Рассмотрим применение штрафной функции на примере.

Определить алгоритм uопт(t) программного управления, обеспечивающий оптимальное по быстродействию изменение состояния объекта, описываемого передаточной функцией:

.                           (6.3)

В переменных состояниях динамика объекта описывается уравнениями:

.                                       (6.4)

где

Граничные условия:  x1(0)=х; х2(0)=0; х1(tк)=0;  x2(tк)=0.

В соответствии с общей задачей Лагранжа записываем функционал:

.     (6.5)

Находим экстремаль из уравнения Эйлера – Лагранжа:

.                              (6.6)

Из первых двух уравнений системы (6.6) получим:

.                                   (6.7)

График штрафной функции представлен на рисунке  6.1

Рис. 6.1. График штрафной функции L(u).

Решение третьего уравнения системы  (6.6) при  будет следующим:

.                 (6.8)

Из (6.8) следует, что оптимальное по быстродействию   управление uопт(t) представляет  кусочно-постоянную функцию (uum), имеющую два интервала и одно переключение управляющего воздействия.

Аналитически постоянные А1 и А2 определить крайне сложно. Поэтому решение краевой задачи решается методом припасовывания, т.е. стыковкой конечных и начальных значений решений дифференциальных уравнений.

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования  принципа максимума, предложенного в 1956 году академиком Л.С. Понтрягиным и его учениками.

Принцип максимума является дальнейшим развитием вариационного исчисления. В основе этого принципа лежит  идея игольчатой вариации. При бесконечно малом приращении dt получается бесконечно узкий  интервал конечной амплитуду um, но его действие на объект будет, очевидно, бесконечно малым и приращение функционала будет бесконечно малым. Оно обращается в нуль, когда берется относительно uопт(t). Это условие положено в основу принципа максимума.

Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Дана система дифференциальных уравнений, описывающих динамику объекта управления:

,                       (6.9)

где ;  U={u1,u2,…ur}.

Уравнение (6.9) представим в векторной форме:

.                              (6.10)

Управляющие воздействия ограничены по величине, т.е.  принадлежат замкнутому пространству:

.                                       (6.11)

Требуется найти закон управления , чтобы объект из состояния Х(0)=Хн перевести в конечное состояние X(tк)=Хк. так, чтобы функционал:

достиг экстремума.

Т.е. формулировка задачи такая же, как и при применении классического вариационного исчисления, за исключением  ограничения (6.11).

В частном случае для определения закона, оптимального по быстродействию f0=1 и J = tк.

Введем дополнительную переменную (координату)

.                (6.12)

Тогда

.                          (6.13)

В итоге получаем расширенную систему уравнений

.   (6.14)

или в векторной форме:

.                                   (6.15)

Критерий J=x0(tк) -  представляет в этом случае конечное  значение переменной (координаты) х0. Значит задача формулируется как достижение экстремума конечного значения координаты х0.

В (n+1) пространстве геометрически это можно представить как нахождение траектории изменение состояния объекта (нахождение экстремали) от Хн до Хк при которой изменение  координаты х0 будет минимальным (или максимальным), как показано на рис. 6.2, оптимальной является траектория 1, остальные траектории 2 и 3 дают большую величину координаты х0к10к2,3).

Рис. 6.2. Траектории изменения состояния объекта 1, 2, 3 и изменение величины критерия  Х0к. Оптимальной является траектория 1.

Сложность принципа максимума в том, что вводятся вспомогательные функции:

, i=1,2,...,n.    (6.16)

Эти функции аналогичны  функциям qi в каноническом представлении уравнения Эйлере – Лагранжа (см. 5.21).

Введение функции Гамильтона

  (6.17)

позволяет объединить  основную (6.14)и сопряженную (6.16) системы уравнений следующим образом:

.                                           (6.18)

Если уравнение u(t), и соответствующая ему траектория  Х(t) оптимальны, то найдется такая ненулевая вектор-функция , составляющие которой удовлетворяют системе (5.17), что функция  будет иметь максимальное значение в заданном интервале [tн, tк]. Т.е.

.   (6.19)

Выражение (6.18) для определения ,управление будет оптимальным, если оно обеспечивает максимум функции (6.19)

Если выполняются эти условия, то функции  являются постоянными. При этом ,а .

Т.е. выражение принципа максимума (6.17) в векторной форме будет:

.                                       (6.20)

Пример применения принципа максимума

Рассмотрим ранее решенную задачу методом Эйлера-Лагранжа для объекта с передаточной функцией

,                                       (п.6.1)

оптимального управления по критерию

.                                        (п.6.2)

Запишем модель объекта (п.6.1) в виде дифференциального уравнения:

,                                              (п.6.3)

где обозначено.

Кроме граничных условий - x1(0)=х; х1()=0, накладывается ограничение по управляющему воздействию:

.                                                       (п.6.4)

Поэтому данную задачу будем решать методом принципа максимума.

Запишем исходные уравнения, введем дополнительную переменную (координату) х0:

Сформулируем функцию Гамильтона (6.17) для применения принципа максимума:

,   (п.6.5)

у которой   вспомогательные переменные  определяются системой уравнений (6.18)

                         (п.6.6)

.                                (п.6.7)

Принимая  из (п.6.7) получим выражение для определения оптимального закона изменения управляющего воздействия:

.                                              (п.6.8)

Данное выражение совпадает с выражением для uопт(t) в предыдущем примере при замене .

Значение  с учетом  и соотношений (п.6.6) можно определить из системы уравнений (см. также (6.18)).

.                                  (п.6.9)

Решение этой системы (см. предыдущий пример) будет:

.                  (п.6.10)

Подставив (п.6.10) в (п.6.8) получим:

,                                   (п.6.11)

где, как и в аналогичном примере,

.                              (п.6.12)

Но еще необходимо учесть ограничение (п.6.4).

Выпишем слагаемые функции Н, которые зависят от управляющего воздействия u:

.                                   (п.6.13)

Функция Н достигает максимума по u одновременно с функцией . Учитывая, что ,  представим   в следующем виде:

.   (п.6.14)

Из (п.6.14) видно, что оптимальное управляющее воздействие uопт не будет переходить значения umax или  в случае, если:

.                          (п.6.15)

Из (п.4.15) следует, что оптимальный П-регулятор с коэффициентом, определенным выражением (п.6.12) должен иметь ограничение по выходному управляющему сигналу (см.рис.6.4).

Рис. 6.4. Структура оптимальной  по квадратичному интегральному критерию замкнутой САУ с ограничением по управляющему воздействию

Из рассмотренного примера следует, что каноническая  форма общей задачи Лагранжа и уравнения при применении принципа максимума совпадает. Благодаря этому  получается один и тот же закон оптимального управления, если . Но уравнения Эйлера-Лагранжа не позволяют учесть ограничения по u. Применение принципа максимума приводит к вполне понятному результату: к появлению звена насыщения.


 

А также другие работы, которые могут Вас заинтересовать

79629. ГОСУДАРСТВО И МЕСТНОЕ САМОУПРАВЛЕНИЕ В ЗАРУБЕЖНЫХ СТРАНАХ: ОТДЕЛЬНЫЕ АСПЕКТЫ ИЗ ВЗАИМООТНОШЕНИЙ 84 KB
  Тем самым, идея местного самоуправления в зарубежных государствах, зародившись и развиваясь теоретически, практически смогла воплотиться лишь в период буржуазных революций. Возможным объяснением этого может явиться то, что « само становление же местного самоуправления было связано с процессами перехода...
79630. ПЕРСПЕКТИВЫ РАЗВИТИЯ ИСПОЛНИТЕЛЬНОГО ПРОИЗВОДСТВА В РОССИЙСКОЙ ФЕДЕРАЦИИ 108.5 KB
  Принятие Федеральных законов О судебных приставах и Об исполнительном производстве предполагает необходимость существенного обновления нормативно-правовой базы исполнительного производства. Из статьи следует что законодательство Российской Федерации об исполнительном производстве состоит...
79631. ОБУСЛОВЛЕННОСТЬ И ОПЫТ УГОЛОВНО-ПРАВОВОЙ БОРЬБЫ С УКЛОНЕНИЯМИ ОТ ОТБЫВАНИЯ ЛИШЕНИЯ СВОБОДЫ В ЗАРУБЕЖНОМ ЗАКОНОДАТЕЛЬСТВЕ 131.5 KB
  В зависимости от типичных правовых систем мира сначала будет предпринята попытка рассмотреть наиболее показательный зарубежный опыт кратковременного пребывания осужденного к лишению свободы за пределами исправительного учреждения и отсрочки отбывания наказания либо исполнения приговора суда...
79632. ЗАКОННОСТЬ И ОБОСНОВАННОСТЬ СУДЕБНОГО ПРИГОВОРА 110.5 KB
  Цель уголовного процесса: установление истины по уголовному делу изобличение и наказание лица совершившего преступление и защита невиновного человека от необоснованного обвинения и осуждения достигается при постановлении судом правосудного приговора.
79633. ДОТАЛЬНЫЕ СОГЛАШЕНИЯ И DONATIO PROPTER NUPTIAS В РИМСКОМ ПРАВЕ 76 KB
  Поимущественные отношения супругов в римском праве определялись не браком, а переходом женщины во власть мужа, эффект которого подобен усыновлению. Брак сам по себе никак не сказывается на имущественных правах сторон: женщина по прежнему остается под опекой и не терпит никаких дополнительных...
79634. ЗАКОННЫЙ РЕЖИМ ИМУЩЕСТВА СУПРУГОВ 73.5 KB
  Имущество имеющееся у супругов состоит из имущества собственником которого является каждый из супругов личное имущество и имущества приобретенного во время брака совместное имущество супругов. Определяющим признаком правового режима является бездолевой характер поскольку доли супругов в их общем...
79635. ПЕРСПЕКТИВЫ РАЗВИТИЯ ОРГАНОВ ГОСУДАРСТВЕННОГО ФИНАНСОВОГО КОНТРОЛЯ 92.5 KB
  В 2002 году на IV Конференции Ассоциации контрольно-счетных органов Российской Федерации была принята Декларация принципов деятельности контрольно-счетных органов России что заложило основу для объединения усилий всех органов государственной власти и органов местного самоуправления усилий...
79636. ПОРЯДОК И ОСОБЕННОСТИ ОФОРМЛЕНИЯ ДОГОВОРА ИПОТЕКИ ЖИЛЫХ ПОМЕЩЕНИЙ 175 KB
  Договор о залоге недвижимого имущества договор об ипотеке это договор в котором одна сторона залогодержатель являющийся кредитором по обязательству обеспеченному ипотекой имеет право получить удовлетворение своих денежных требований к должнику по этому обязательству из стоимости...
79637. АДМИНИСТРАТИВНО-ПРАВОВОЙ РЕЖИМ СТРАХОВОЙ ДЕЯТЕЛЬНОСТИ В РОССИЙСКОЙ ФЕДЕРАЦИИ 159 KB
  В правовой научной литературе вопрос о природе правового режима вообще и административно-правового режима в частности поднимался неоднократно. Российский энциклопедический словарь определяет режим как установленный порядок жизни совокупность правил мероприятий норм для достижения...