32230

Синтез оптимального управления при ограничениях на управляющее воздействие

Лекция

Информатика, кибернетика и программирование

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования принципа максимума предложенного в 1956 году академиком Л. Принцип максимума является дальнейшим развитием вариационного исчисления. Это условие положено в основу принципа максимума. Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Русский

2013-09-04

163 KB

7 чел.

Лекция №6

Синтез оптимального управления при ограничениях на управляющее воздействие

При реализации оптимального управления часто приходится  накладывать ограничения на управляющие воздействия,  обусловленные ограниченностью источника энергии или “прочность ” объекта  управления. Например, при синтезе оптимального по быстродействию управления необходимо, чтобы:

.                                         (6.1)

Очевидно, что на управляющее воздействие должно быть наложено ограничение:

,                                                    (6.2)

иначе получим очевидное, но не реализуемое решение: tк=0, при u = ∞.

Данная задача может быть решена методом классического вариационного исчисления. Идея заключается в том,  что в критерий (6.1) вводятся  дополнительная функция от “u”, называемая штрафной функцией. Эта функция должна вызывать  резкое увеличение критерия при превышении допустимого значения um. Даная функция задается следующим образом:

Рассмотрим применение штрафной функции на примере.

Определить алгоритм uопт(t) программного управления, обеспечивающий оптимальное по быстродействию изменение состояния объекта, описываемого передаточной функцией:

.                           (6.3)

В переменных состояниях динамика объекта описывается уравнениями:

.                                       (6.4)

где

Граничные условия:  x1(0)=х; х2(0)=0; х1(tк)=0;  x2(tк)=0.

В соответствии с общей задачей Лагранжа записываем функционал:

.     (6.5)

Находим экстремаль из уравнения Эйлера – Лагранжа:

.                              (6.6)

Из первых двух уравнений системы (6.6) получим:

.                                   (6.7)

График штрафной функции представлен на рисунке  6.1

Рис. 6.1. График штрафной функции L(u).

Решение третьего уравнения системы  (6.6) при  будет следующим:

.                 (6.8)

Из (6.8) следует, что оптимальное по быстродействию   управление uопт(t) представляет  кусочно-постоянную функцию (uum), имеющую два интервала и одно переключение управляющего воздействия.

Аналитически постоянные А1 и А2 определить крайне сложно. Поэтому решение краевой задачи решается методом припасовывания, т.е. стыковкой конечных и начальных значений решений дифференциальных уравнений.

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования  принципа максимума, предложенного в 1956 году академиком Л.С. Понтрягиным и его учениками.

Принцип максимума является дальнейшим развитием вариационного исчисления. В основе этого принципа лежит  идея игольчатой вариации. При бесконечно малом приращении dt получается бесконечно узкий  интервал конечной амплитуду um, но его действие на объект будет, очевидно, бесконечно малым и приращение функционала будет бесконечно малым. Оно обращается в нуль, когда берется относительно uопт(t). Это условие положено в основу принципа максимума.

Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Дана система дифференциальных уравнений, описывающих динамику объекта управления:

,                       (6.9)

где ;  U={u1,u2,…ur}.

Уравнение (6.9) представим в векторной форме:

.                              (6.10)

Управляющие воздействия ограничены по величине, т.е.  принадлежат замкнутому пространству:

.                                       (6.11)

Требуется найти закон управления , чтобы объект из состояния Х(0)=Хн перевести в конечное состояние X(tк)=Хк. так, чтобы функционал:

достиг экстремума.

Т.е. формулировка задачи такая же, как и при применении классического вариационного исчисления, за исключением  ограничения (6.11).

В частном случае для определения закона, оптимального по быстродействию f0=1 и J = tк.

Введем дополнительную переменную (координату)

.                (6.12)

Тогда

.                          (6.13)

В итоге получаем расширенную систему уравнений

.   (6.14)

или в векторной форме:

.                                   (6.15)

Критерий J=x0(tк) -  представляет в этом случае конечное  значение переменной (координаты) х0. Значит задача формулируется как достижение экстремума конечного значения координаты х0.

В (n+1) пространстве геометрически это можно представить как нахождение траектории изменение состояния объекта (нахождение экстремали) от Хн до Хк при которой изменение  координаты х0 будет минимальным (или максимальным), как показано на рис. 6.2, оптимальной является траектория 1, остальные траектории 2 и 3 дают большую величину координаты х0к10к2,3).

Рис. 6.2. Траектории изменения состояния объекта 1, 2, 3 и изменение величины критерия  Х0к. Оптимальной является траектория 1.

Сложность принципа максимума в том, что вводятся вспомогательные функции:

, i=1,2,...,n.    (6.16)

Эти функции аналогичны  функциям qi в каноническом представлении уравнения Эйлере – Лагранжа (см. 5.21).

Введение функции Гамильтона

  (6.17)

позволяет объединить  основную (6.14)и сопряженную (6.16) системы уравнений следующим образом:

.                                           (6.18)

Если уравнение u(t), и соответствующая ему траектория  Х(t) оптимальны, то найдется такая ненулевая вектор-функция , составляющие которой удовлетворяют системе (5.17), что функция  будет иметь максимальное значение в заданном интервале [tн, tк]. Т.е.

.   (6.19)

Выражение (6.18) для определения ,управление будет оптимальным, если оно обеспечивает максимум функции (6.19)

Если выполняются эти условия, то функции  являются постоянными. При этом ,а .

Т.е. выражение принципа максимума (6.17) в векторной форме будет:

.                                       (6.20)

Пример применения принципа максимума

Рассмотрим ранее решенную задачу методом Эйлера-Лагранжа для объекта с передаточной функцией

,                                       (п.6.1)

оптимального управления по критерию

.                                        (п.6.2)

Запишем модель объекта (п.6.1) в виде дифференциального уравнения:

,                                              (п.6.3)

где обозначено.

Кроме граничных условий - x1(0)=х; х1()=0, накладывается ограничение по управляющему воздействию:

.                                                       (п.6.4)

Поэтому данную задачу будем решать методом принципа максимума.

Запишем исходные уравнения, введем дополнительную переменную (координату) х0:

Сформулируем функцию Гамильтона (6.17) для применения принципа максимума:

,   (п.6.5)

у которой   вспомогательные переменные  определяются системой уравнений (6.18)

                         (п.6.6)

.                                (п.6.7)

Принимая  из (п.6.7) получим выражение для определения оптимального закона изменения управляющего воздействия:

.                                              (п.6.8)

Данное выражение совпадает с выражением для uопт(t) в предыдущем примере при замене .

Значение  с учетом  и соотношений (п.6.6) можно определить из системы уравнений (см. также (6.18)).

.                                  (п.6.9)

Решение этой системы (см. предыдущий пример) будет:

.                  (п.6.10)

Подставив (п.6.10) в (п.6.8) получим:

,                                   (п.6.11)

где, как и в аналогичном примере,

.                              (п.6.12)

Но еще необходимо учесть ограничение (п.6.4).

Выпишем слагаемые функции Н, которые зависят от управляющего воздействия u:

.                                   (п.6.13)

Функция Н достигает максимума по u одновременно с функцией . Учитывая, что ,  представим   в следующем виде:

.   (п.6.14)

Из (п.6.14) видно, что оптимальное управляющее воздействие uопт не будет переходить значения umax или  в случае, если:

.                          (п.6.15)

Из (п.4.15) следует, что оптимальный П-регулятор с коэффициентом, определенным выражением (п.6.12) должен иметь ограничение по выходному управляющему сигналу (см.рис.6.4).

Рис. 6.4. Структура оптимальной  по квадратичному интегральному критерию замкнутой САУ с ограничением по управляющему воздействию

Из рассмотренного примера следует, что каноническая  форма общей задачи Лагранжа и уравнения при применении принципа максимума совпадает. Благодаря этому  получается один и тот же закон оптимального управления, если . Но уравнения Эйлера-Лагранжа не позволяют учесть ограничения по u. Применение принципа максимума приводит к вполне понятному результату: к появлению звена насыщения.


 

А также другие работы, которые могут Вас заинтересовать

22534. Плоское напряженное состояние 98.5 KB
  Тензор напряжений в этом случае имеет вид Геометрическая иллюстрация представлена на рис. Инварианты тензора напряжений равны а характеристическое уравнение принимает вид Корни этого уравнения равны 1 Нумерация корней произведена для случая Рис. Позиция главных напряжений Произвольная площадка характеризуется углом на рис. Если продифференцировать соотношение 2 по и приравнять производную нулю то придем к уравнению 4 что доказывает экстремальность главных напряжений.
22535. Упругость и пластичность. Закон Гука 156 KB
  При высоких уровнях нагружения когда в теле возникают значительные деформации материал частично теряет упругие свойства: при разгрузке его первоначальные размеры и форма полностью не восстанавливаются а при полном снятии внешних нагрузок фиксируются остаточные деформации. Накапливаемые в процессе пластического деформирования остаточные деформации называются пластическими. Твердые тела выполненные из различных материалов разрушаются при разной величине деформации. Соответствующие деформации обозначим через и причем эти деформации...
22536. Механические характеристики конструкционных материалов 110 KB
  ДИАГРАММЫ УПРУГОПЛАСТИЧЕСКОГО ДЕФОРМИРОВАНИЯ КОНСТРУКЦИОННЫХ МАТЕРИАЛОВ Основным опытом для определения механических характеристик конструкционных материалов является опыт на растяжение призматического образца центрально приложенной силой направленной по продольной оси; при этом в средней части образца реализуется однородное напряженное состояние. Форма размеры образца и методика проведения испытаний определяются соответствующими стандартами например ГОСТ 34643 81 ГОСТ 149773. Физический смысл коэффициента Е определяется как...
22537. Влияние различных факторов на механические характеристики материалов 54.5 KB
  Влияние процентного содержания углерода Влияние температуры окружающей среды. Повышенные температуры оказывают существенное влияние на такие механические характеристики конструкционных материалов как ползучесть и длительная прочность. Скорость релаксации напряжений возрастает при повышении температуры. Прочность углеродистых сталей с повышением температуры до 650 700oС снижается почти в десять раз.
22538. Основные понятия теории надежности конструкций 79.5 KB
  Условие прочности по существу есть условие обеспечения прочностной надежности. Например предельное напряжение входящее в условие прочности по своей природе является случайным. Если стечение обстоятельств приводящее к нарушению условия прочности редкое событие то приходим к вероятностной трактовке условия прочности с позиций теории надежности. Вместо условия прочности 1 записывается условие Р=Р 2 где Р заданное достаточно высокое значение вероятности которое называется нормативной вероятностью безотказной работы.
22539. Прочность и перемещения при центральном растяжении или сжатии 136 KB
  Напомним что под растяжением сжатием понимают такой вид деформации стержня при котором в его поперечном сечении возникает лишь один внутренний силовой фактор продольная сила Nz. Поскольку продольная сила численно равна сумме проекций приложенных к одной из отсеченных частей внешних сил на ось стержня для прямолинейного стержня она совпадает в каждом сечении с осью Oz то растяжение сжатие имеет место если все внешние силы действующие по одну сторону от данного поперечного сечения сводятся к равнодействующей направленной вдоль...
22540. Расчет статически неопределимых систем по допускаемым нагрузкам 116.5 KB
  Расчет статически неопределимых систем по допускаемым нагрузкам. Применение к статически определимым системам. Расчетная схема статически определимой стержневой системы Рассчитывая эту систему обычным путем найдем усилия N1 = N2 no формуле: из равновесия узла А. Это всегда имеет место для статически определимых конструкций при равномерном распределении напряжений когда материал по всему сечению используется полностью.
22541. Учет собственного веса при растяжении и сжатии 102 KB
  Длина стержня l площадь поперечного сечения F удельный вес материала и модуль упругости Е. Подсчитаем напряжения по сечению АВ расположенному на расстоянии от свободного конца стержня. Эти напряжения будут нормальными равномерно распределенными по сечению и направленными наружу от рассматриваемой части стержня т. Наиболее напряженным опасным будет верхнее сечение для которого достигает наибольшего значения l; напряжение в нем равно: Условие прочности должно быть выполнено именно для этого сечения: Отсюда необходимая площадь стержня...
22542. Расчет гибких нитей 148.5 KB
  Это так называемые гибкие нити. Обычно провисание нити невелико по сравнению с ее пролетом и длина кривой АОВ мало отличается не более чем на 10 от длины хорды АВ. В этом случае с достаточной степенью точности можно считать что вес нити равно мерно распределен не по ее длине а по длине ее проекции на горизонтальную ось т. Расчетная схема гибкой нити.