32230

Синтез оптимального управления при ограничениях на управляющее воздействие

Лекция

Информатика, кибернетика и программирование

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования принципа максимума предложенного в 1956 году академиком Л. Принцип максимума является дальнейшим развитием вариационного исчисления. Это условие положено в основу принципа максимума. Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Русский

2013-09-04

163 KB

3 чел.

Лекция №6

Синтез оптимального управления при ограничениях на управляющее воздействие

При реализации оптимального управления часто приходится  накладывать ограничения на управляющие воздействия,  обусловленные ограниченностью источника энергии или “прочность ” объекта  управления. Например, при синтезе оптимального по быстродействию управления необходимо, чтобы:

.                                         (6.1)

Очевидно, что на управляющее воздействие должно быть наложено ограничение:

,                                                    (6.2)

иначе получим очевидное, но не реализуемое решение: tк=0, при u = ∞.

Данная задача может быть решена методом классического вариационного исчисления. Идея заключается в том,  что в критерий (6.1) вводятся  дополнительная функция от “u”, называемая штрафной функцией. Эта функция должна вызывать  резкое увеличение критерия при превышении допустимого значения um. Даная функция задается следующим образом:

Рассмотрим применение штрафной функции на примере.

Определить алгоритм uопт(t) программного управления, обеспечивающий оптимальное по быстродействию изменение состояния объекта, описываемого передаточной функцией:

.                           (6.3)

В переменных состояниях динамика объекта описывается уравнениями:

.                                       (6.4)

где

Граничные условия:  x1(0)=х; х2(0)=0; х1(tк)=0;  x2(tк)=0.

В соответствии с общей задачей Лагранжа записываем функционал:

.     (6.5)

Находим экстремаль из уравнения Эйлера – Лагранжа:

.                              (6.6)

Из первых двух уравнений системы (6.6) получим:

.                                   (6.7)

График штрафной функции представлен на рисунке  6.1

Рис. 6.1. График штрафной функции L(u).

Решение третьего уравнения системы  (6.6) при  будет следующим:

.                 (6.8)

Из (6.8) следует, что оптимальное по быстродействию   управление uопт(t) представляет  кусочно-постоянную функцию (uum), имеющую два интервала и одно переключение управляющего воздействия.

Аналитически постоянные А1 и А2 определить крайне сложно. Поэтому решение краевой задачи решается методом припасовывания, т.е. стыковкой конечных и начальных значений решений дифференциальных уравнений.

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования  принципа максимума, предложенного в 1956 году академиком Л.С. Понтрягиным и его учениками.

Принцип максимума является дальнейшим развитием вариационного исчисления. В основе этого принципа лежит  идея игольчатой вариации. При бесконечно малом приращении dt получается бесконечно узкий  интервал конечной амплитуду um, но его действие на объект будет, очевидно, бесконечно малым и приращение функционала будет бесконечно малым. Оно обращается в нуль, когда берется относительно uопт(t). Это условие положено в основу принципа максимума.

Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Дана система дифференциальных уравнений, описывающих динамику объекта управления:

,                       (6.9)

где ;  U={u1,u2,…ur}.

Уравнение (6.9) представим в векторной форме:

.                              (6.10)

Управляющие воздействия ограничены по величине, т.е.  принадлежат замкнутому пространству:

.                                       (6.11)

Требуется найти закон управления , чтобы объект из состояния Х(0)=Хн перевести в конечное состояние X(tк)=Хк. так, чтобы функционал:

достиг экстремума.

Т.е. формулировка задачи такая же, как и при применении классического вариационного исчисления, за исключением  ограничения (6.11).

В частном случае для определения закона, оптимального по быстродействию f0=1 и J = tк.

Введем дополнительную переменную (координату)

.                (6.12)

Тогда

.                          (6.13)

В итоге получаем расширенную систему уравнений

.   (6.14)

или в векторной форме:

.                                   (6.15)

Критерий J=x0(tк) -  представляет в этом случае конечное  значение переменной (координаты) х0. Значит задача формулируется как достижение экстремума конечного значения координаты х0.

В (n+1) пространстве геометрически это можно представить как нахождение траектории изменение состояния объекта (нахождение экстремали) от Хн до Хк при которой изменение  координаты х0 будет минимальным (или максимальным), как показано на рис. 6.2, оптимальной является траектория 1, остальные траектории 2 и 3 дают большую величину координаты х0к10к2,3).

Рис. 6.2. Траектории изменения состояния объекта 1, 2, 3 и изменение величины критерия  Х0к. Оптимальной является траектория 1.

Сложность принципа максимума в том, что вводятся вспомогательные функции:

, i=1,2,...,n.    (6.16)

Эти функции аналогичны  функциям qi в каноническом представлении уравнения Эйлере – Лагранжа (см. 5.21).

Введение функции Гамильтона

  (6.17)

позволяет объединить  основную (6.14)и сопряженную (6.16) системы уравнений следующим образом:

.                                           (6.18)

Если уравнение u(t), и соответствующая ему траектория  Х(t) оптимальны, то найдется такая ненулевая вектор-функция , составляющие которой удовлетворяют системе (5.17), что функция  будет иметь максимальное значение в заданном интервале [tн, tк]. Т.е.

.   (6.19)

Выражение (6.18) для определения ,управление будет оптимальным, если оно обеспечивает максимум функции (6.19)

Если выполняются эти условия, то функции  являются постоянными. При этом ,а .

Т.е. выражение принципа максимума (6.17) в векторной форме будет:

.                                       (6.20)

Пример применения принципа максимума

Рассмотрим ранее решенную задачу методом Эйлера-Лагранжа для объекта с передаточной функцией

,                                       (п.6.1)

оптимального управления по критерию

.                                        (п.6.2)

Запишем модель объекта (п.6.1) в виде дифференциального уравнения:

,                                              (п.6.3)

где обозначено.

Кроме граничных условий - x1(0)=х; х1()=0, накладывается ограничение по управляющему воздействию:

.                                                       (п.6.4)

Поэтому данную задачу будем решать методом принципа максимума.

Запишем исходные уравнения, введем дополнительную переменную (координату) х0:

Сформулируем функцию Гамильтона (6.17) для применения принципа максимума:

,   (п.6.5)

у которой   вспомогательные переменные  определяются системой уравнений (6.18)

                         (п.6.6)

.                                (п.6.7)

Принимая  из (п.6.7) получим выражение для определения оптимального закона изменения управляющего воздействия:

.                                              (п.6.8)

Данное выражение совпадает с выражением для uопт(t) в предыдущем примере при замене .

Значение  с учетом  и соотношений (п.6.6) можно определить из системы уравнений (см. также (6.18)).

.                                  (п.6.9)

Решение этой системы (см. предыдущий пример) будет:

.                  (п.6.10)

Подставив (п.6.10) в (п.6.8) получим:

,                                   (п.6.11)

где, как и в аналогичном примере,

.                              (п.6.12)

Но еще необходимо учесть ограничение (п.6.4).

Выпишем слагаемые функции Н, которые зависят от управляющего воздействия u:

.                                   (п.6.13)

Функция Н достигает максимума по u одновременно с функцией . Учитывая, что ,  представим   в следующем виде:

.   (п.6.14)

Из (п.6.14) видно, что оптимальное управляющее воздействие uопт не будет переходить значения umax или  в случае, если:

.                          (п.6.15)

Из (п.4.15) следует, что оптимальный П-регулятор с коэффициентом, определенным выражением (п.6.12) должен иметь ограничение по выходному управляющему сигналу (см.рис.6.4).

Рис. 6.4. Структура оптимальной  по квадратичному интегральному критерию замкнутой САУ с ограничением по управляющему воздействию

Из рассмотренного примера следует, что каноническая  форма общей задачи Лагранжа и уравнения при применении принципа максимума совпадает. Благодаря этому  получается один и тот же закон оптимального управления, если . Но уравнения Эйлера-Лагранжа не позволяют учесть ограничения по u. Применение принципа максимума приводит к вполне понятному результату: к появлению звена насыщения.


 

А также другие работы, которые могут Вас заинтересовать

84329. Расчет и проектирование основных подразделений технической службы ГПС 920 KB
  Эффективное использование пожарной техники, ее надежная работа возможны только при условии отличного знания устройства пожарных автомобилей, их технических характеристик, особенностей обеспечения их боевой готовности и высокой оперативной подвижности.
84330. Спутниковые и наземные системы радиосвязи: Методические указания 6.15 MB
  В настоящее время значительная часть телевизионных, телефонных и сетей передачи данных в развитых странах мира реализованы на основе радиорелейных систем передачи. Поэтому вопросам проектирования и строительства новых РРЛ уделяется большое внимание.
84331. Организация процесса приготовления и разработка ассортимента гусиной и утиной печени 1.72 MB
  Прежде всего под фуа-гра подразумевается особым образом приготовленная гусиная печень. Однако, современные повара-умельцы наловчились готовить фуа-гра и из утиной печени, и из печени перепелов, и даже из более привычной нам свиной и говяжьей печени.
84332. Роль и место организационного поведения в процессах, протекающих в организации 391 KB
  Актуальность темы заключается в том, что в управлении организацией важно всё контролировать, необходимо управлять всеми составляющими организации, поэтому современный руководитель должен иметь представление о роли и месте организационного поведения в процессах, протекающих в организации.
84333. Комплексное использование статистических методов при анализе основных экономических показателей деятельности тридцати крупнейших банков РФ 2.93 MB
  Познавательные, обучающие и профессиональные цели выполнения курсовой работы - дать дополнительные теоретические знания и развить необходимые практические навыки по изучению основ статистического наблюдения, сводки и группировки статистических данных...
84334. Театрально-игровая деятельность в системе художественно-эстетического воспитания дошкольников 376.77 KB
  Объект исследования: театрально-игровая деятельность детей дошкольного возраста. Предмет исследования: художественно-эстетическое воспитание в театрально-игровой деятельности детей. Определить особенности реализации художественно-эстетического воспитания детей в условиях реализации...
84335. Расчет и проектирование металлоконструкции мостового электрического крана балочного типа 519.5 KB
  Мостовой кран предназначен для транспортировки и перемещения грузов. Конструкция является ответственной. Работает мостовой кран при переменных нагрузках. Нагрузками являются ручные или электрические тельферы, ходовые колеса которых перемещаются по нижнему поясу балки.
84336. Оценка стоимости бизнеса на примере ОАО АГРАРИЙ-РАНОВА 290.76 KB
  Расчет рыночной стоимости собственного капитала методом капитализации потоков выгод к владельцам вложенного и собственного капитала. Расчет рыночной стоимости бизнеса и собственного капитала методом дисконтирования чистых денежных потоков к владельцам вложенного капитала. На данном этапе определяется нормализованная балансовая стоимость вложенного капитала и собственного капитала по объекту оценки...
84337. Розробка зв’язного радіоприймача УКХ діапазону 808.89 KB
  В результаті проектування були розкриті наступні питання, які стосуються перспективи розвитку курсового проекту. При вивченні методів побудови аналогів проектованого пристрою і порівняння їх переваг та недоліків, були сформовані технічні умови для радіоприймача КХ діапазону