32230

Синтез оптимального управления при ограничениях на управляющее воздействие

Лекция

Информатика, кибернетика и программирование

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования принципа максимума предложенного в 1956 году академиком Л. Принцип максимума является дальнейшим развитием вариационного исчисления. Это условие положено в основу принципа максимума. Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Русский

2013-09-04

163 KB

5 чел.

Лекция №6

Синтез оптимального управления при ограничениях на управляющее воздействие

При реализации оптимального управления часто приходится  накладывать ограничения на управляющие воздействия,  обусловленные ограниченностью источника энергии или “прочность ” объекта  управления. Например, при синтезе оптимального по быстродействию управления необходимо, чтобы:

.                                         (6.1)

Очевидно, что на управляющее воздействие должно быть наложено ограничение:

,                                                    (6.2)

иначе получим очевидное, но не реализуемое решение: tк=0, при u = ∞.

Данная задача может быть решена методом классического вариационного исчисления. Идея заключается в том,  что в критерий (6.1) вводятся  дополнительная функция от “u”, называемая штрафной функцией. Эта функция должна вызывать  резкое увеличение критерия при превышении допустимого значения um. Даная функция задается следующим образом:

Рассмотрим применение штрафной функции на примере.

Определить алгоритм uопт(t) программного управления, обеспечивающий оптимальное по быстродействию изменение состояния объекта, описываемого передаточной функцией:

.                           (6.3)

В переменных состояниях динамика объекта описывается уравнениями:

.                                       (6.4)

где

Граничные условия:  x1(0)=х; х2(0)=0; х1(tк)=0;  x2(tк)=0.

В соответствии с общей задачей Лагранжа записываем функционал:

.     (6.5)

Находим экстремаль из уравнения Эйлера – Лагранжа:

.                              (6.6)

Из первых двух уравнений системы (6.6) получим:

.                                   (6.7)

График штрафной функции представлен на рисунке  6.1

Рис. 6.1. График штрафной функции L(u).

Решение третьего уравнения системы  (6.6) при  будет следующим:

.                 (6.8)

Из (6.8) следует, что оптимальное по быстродействию   управление uопт(t) представляет  кусочно-постоянную функцию (uum), имеющую два интервала и одно переключение управляющего воздействия.

Аналитически постоянные А1 и А2 определить крайне сложно. Поэтому решение краевой задачи решается методом припасовывания, т.е. стыковкой конечных и начальных значений решений дифференциальных уравнений.

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования  принципа максимума, предложенного в 1956 году академиком Л.С. Понтрягиным и его учениками.

Принцип максимума является дальнейшим развитием вариационного исчисления. В основе этого принципа лежит  идея игольчатой вариации. При бесконечно малом приращении dt получается бесконечно узкий  интервал конечной амплитуду um, но его действие на объект будет, очевидно, бесконечно малым и приращение функционала будет бесконечно малым. Оно обращается в нуль, когда берется относительно uопт(t). Это условие положено в основу принципа максимума.

Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Дана система дифференциальных уравнений, описывающих динамику объекта управления:

,                       (6.9)

где ;  U={u1,u2,…ur}.

Уравнение (6.9) представим в векторной форме:

.                              (6.10)

Управляющие воздействия ограничены по величине, т.е.  принадлежат замкнутому пространству:

.                                       (6.11)

Требуется найти закон управления , чтобы объект из состояния Х(0)=Хн перевести в конечное состояние X(tк)=Хк. так, чтобы функционал:

достиг экстремума.

Т.е. формулировка задачи такая же, как и при применении классического вариационного исчисления, за исключением  ограничения (6.11).

В частном случае для определения закона, оптимального по быстродействию f0=1 и J = tк.

Введем дополнительную переменную (координату)

.                (6.12)

Тогда

.                          (6.13)

В итоге получаем расширенную систему уравнений

.   (6.14)

или в векторной форме:

.                                   (6.15)

Критерий J=x0(tк) -  представляет в этом случае конечное  значение переменной (координаты) х0. Значит задача формулируется как достижение экстремума конечного значения координаты х0.

В (n+1) пространстве геометрически это можно представить как нахождение траектории изменение состояния объекта (нахождение экстремали) от Хн до Хк при которой изменение  координаты х0 будет минимальным (или максимальным), как показано на рис. 6.2, оптимальной является траектория 1, остальные траектории 2 и 3 дают большую величину координаты х0к10к2,3).

Рис. 6.2. Траектории изменения состояния объекта 1, 2, 3 и изменение величины критерия  Х0к. Оптимальной является траектория 1.

Сложность принципа максимума в том, что вводятся вспомогательные функции:

, i=1,2,...,n.    (6.16)

Эти функции аналогичны  функциям qi в каноническом представлении уравнения Эйлере – Лагранжа (см. 5.21).

Введение функции Гамильтона

  (6.17)

позволяет объединить  основную (6.14)и сопряженную (6.16) системы уравнений следующим образом:

.                                           (6.18)

Если уравнение u(t), и соответствующая ему траектория  Х(t) оптимальны, то найдется такая ненулевая вектор-функция , составляющие которой удовлетворяют системе (5.17), что функция  будет иметь максимальное значение в заданном интервале [tн, tк]. Т.е.

.   (6.19)

Выражение (6.18) для определения ,управление будет оптимальным, если оно обеспечивает максимум функции (6.19)

Если выполняются эти условия, то функции  являются постоянными. При этом ,а .

Т.е. выражение принципа максимума (6.17) в векторной форме будет:

.                                       (6.20)

Пример применения принципа максимума

Рассмотрим ранее решенную задачу методом Эйлера-Лагранжа для объекта с передаточной функцией

,                                       (п.6.1)

оптимального управления по критерию

.                                        (п.6.2)

Запишем модель объекта (п.6.1) в виде дифференциального уравнения:

,                                              (п.6.3)

где обозначено.

Кроме граничных условий - x1(0)=х; х1()=0, накладывается ограничение по управляющему воздействию:

.                                                       (п.6.4)

Поэтому данную задачу будем решать методом принципа максимума.

Запишем исходные уравнения, введем дополнительную переменную (координату) х0:

Сформулируем функцию Гамильтона (6.17) для применения принципа максимума:

,   (п.6.5)

у которой   вспомогательные переменные  определяются системой уравнений (6.18)

                         (п.6.6)

.                                (п.6.7)

Принимая  из (п.6.7) получим выражение для определения оптимального закона изменения управляющего воздействия:

.                                              (п.6.8)

Данное выражение совпадает с выражением для uопт(t) в предыдущем примере при замене .

Значение  с учетом  и соотношений (п.6.6) можно определить из системы уравнений (см. также (6.18)).

.                                  (п.6.9)

Решение этой системы (см. предыдущий пример) будет:

.                  (п.6.10)

Подставив (п.6.10) в (п.6.8) получим:

,                                   (п.6.11)

где, как и в аналогичном примере,

.                              (п.6.12)

Но еще необходимо учесть ограничение (п.6.4).

Выпишем слагаемые функции Н, которые зависят от управляющего воздействия u:

.                                   (п.6.13)

Функция Н достигает максимума по u одновременно с функцией . Учитывая, что ,  представим   в следующем виде:

.   (п.6.14)

Из (п.6.14) видно, что оптимальное управляющее воздействие uопт не будет переходить значения umax или  в случае, если:

.                          (п.6.15)

Из (п.4.15) следует, что оптимальный П-регулятор с коэффициентом, определенным выражением (п.6.12) должен иметь ограничение по выходному управляющему сигналу (см.рис.6.4).

Рис. 6.4. Структура оптимальной  по квадратичному интегральному критерию замкнутой САУ с ограничением по управляющему воздействию

Из рассмотренного примера следует, что каноническая  форма общей задачи Лагранжа и уравнения при применении принципа максимума совпадает. Благодаря этому  получается один и тот же закон оптимального управления, если . Но уравнения Эйлера-Лагранжа не позволяют учесть ограничения по u. Применение принципа максимума приводит к вполне понятному результату: к появлению звена насыщения.


 

А также другие работы, которые могут Вас заинтересовать

10239. Наследование и защищенные элементы класса 79.5 KB
  Лекция 13. Наследование и защищенные элементы класса. 13.1. Наследование. Цель объектно-ориентированного программирования состоит в повторном использовании созданных классов. Если уже создан некоторый класс то возможны ситуации что новому классу нужны многие
10240. Основы объектно-ориентированного программирования 48.5 KB
  Основы объектноориентированного программирования. ООП: Инкапсуляция Абстракция данных Наследование Полиморфизм. Инкапсуляция свойство языка программирования позволяющее объединить и защитить данные и код в объект и скрыть реализацию объекта от пользоват
10241. Исторический характер образования и важнейшие этапы его развития 25.96 KB
  Исторический характер образования и важнейшие этапы его развития. Содержание образования носит исторический характер так как обусловливается целями образования на определенном этапе становления общества. Такой исторический характер определяет изменение содержания об...
10242. Реформы системы просвещения и цензуры 14.29 KB
  Реформы системы просвещения и цензуры В общем ряду реформ 60-80х годов существенное место занимали школьные и университетские реформы а также реформа цензуры. Развитие капитализма требовало отмены сословных ограничений для разночинной интеллигенции наиболее зажиточн...
10243. Яснополянская школа и педагогическая деятельность Л. Н. Толстого 24.4 KB
  Яснополянская школа и педагогическая деятельность Л. Н. Толстого. Работу подготовила Законщикова О.С. экономический факультет заочное отделение II курс Европейский институт экспертов Санкт-Петербург 1999 г. Педагогическая деятельность Л.Н. Толстого началась в 1849 г. когда...
10244. Экономические задачи таможенного дела и его назначение в развитии народного хозяйства 62.5 KB
  Экономические задачи таможенного дела и его назначение в развитии народного хозяйства В основных документах по организации таможенного дела в России перед таможенными органами поставлены следующие экономические задачи: участие в разработке таможенной политик
10245. Таможенная политика и методы регулирования внешнеэкономической деятельности 113.5 KB
  Таможенная политика и методы регулирования внешнеэкономической деятельности В России осуществляется единая таможенная политика являющаяся составной частью внутренней и внешней политики государства. Если проанализировать изменения таможенной политики за неско
10246. Экономическая интеграция в области таможенного дела 61 KB
  Экономическая интеграция в области таможенного дела Разделение труда производственная и научно-техническая специализация и кооперирование в международном масштабе превращают экономику отдельной страны в часть мирового производственного процесса. Усиливаются э...
10247. Проблемно-целевые программы в таможенном деле 63.5 KB
  Проблемноцелевые программы в таможенном деле Во всех сферах экономики в том числе и в таможенном деле различные виды деятельности развиваются или сокращаются неравномерно несогласованно. Это приводит к внутренним диспропорциям и снижению эффективности работы т