32230

Синтез оптимального управления при ограничениях на управляющее воздействие

Лекция

Информатика, кибернетика и программирование

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования принципа максимума предложенного в 1956 году академиком Л. Принцип максимума является дальнейшим развитием вариационного исчисления. Это условие положено в основу принципа максимума. Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Русский

2013-09-04

163 KB

3 чел.

Лекция №6

Синтез оптимального управления при ограничениях на управляющее воздействие

При реализации оптимального управления часто приходится  накладывать ограничения на управляющие воздействия,  обусловленные ограниченностью источника энергии или “прочность ” объекта  управления. Например, при синтезе оптимального по быстродействию управления необходимо, чтобы:

.                                         (6.1)

Очевидно, что на управляющее воздействие должно быть наложено ограничение:

,                                                    (6.2)

иначе получим очевидное, но не реализуемое решение: tк=0, при u = ∞.

Данная задача может быть решена методом классического вариационного исчисления. Идея заключается в том,  что в критерий (6.1) вводятся  дополнительная функция от “u”, называемая штрафной функцией. Эта функция должна вызывать  резкое увеличение критерия при превышении допустимого значения um. Даная функция задается следующим образом:

Рассмотрим применение штрафной функции на примере.

Определить алгоритм uопт(t) программного управления, обеспечивающий оптимальное по быстродействию изменение состояния объекта, описываемого передаточной функцией:

.                           (6.3)

В переменных состояниях динамика объекта описывается уравнениями:

.                                       (6.4)

где

Граничные условия:  x1(0)=х; х2(0)=0; х1(tк)=0;  x2(tк)=0.

В соответствии с общей задачей Лагранжа записываем функционал:

.     (6.5)

Находим экстремаль из уравнения Эйлера – Лагранжа:

.                              (6.6)

Из первых двух уравнений системы (6.6) получим:

.                                   (6.7)

График штрафной функции представлен на рисунке  6.1

Рис. 6.1. График штрафной функции L(u).

Решение третьего уравнения системы  (6.6) при  будет следующим:

.                 (6.8)

Из (6.8) следует, что оптимальное по быстродействию   управление uопт(t) представляет  кусочно-постоянную функцию (uum), имеющую два интервала и одно переключение управляющего воздействия.

Аналитически постоянные А1 и А2 определить крайне сложно. Поэтому решение краевой задачи решается методом припасовывания, т.е. стыковкой конечных и начальных значений решений дифференциальных уравнений.

Более эффективно решение задач синтеза оптимального управления при ограничениях управляющих воздействий осуществляется путем использования  принципа максимума, предложенного в 1956 году академиком Л.С. Понтрягиным и его учениками.

Принцип максимума является дальнейшим развитием вариационного исчисления. В основе этого принципа лежит  идея игольчатой вариации. При бесконечно малом приращении dt получается бесконечно узкий  интервал конечной амплитуду um, но его действие на объект будет, очевидно, бесконечно малым и приращение функционала будет бесконечно малым. Оно обращается в нуль, когда берется относительно uопт(t). Это условие положено в основу принципа максимума.

Рассмотрим применение принципа максимума Понтрягина для решения задач оптимизации.

Дана система дифференциальных уравнений, описывающих динамику объекта управления:

,                       (6.9)

где ;  U={u1,u2,…ur}.

Уравнение (6.9) представим в векторной форме:

.                              (6.10)

Управляющие воздействия ограничены по величине, т.е.  принадлежат замкнутому пространству:

.                                       (6.11)

Требуется найти закон управления , чтобы объект из состояния Х(0)=Хн перевести в конечное состояние X(tк)=Хк. так, чтобы функционал:

достиг экстремума.

Т.е. формулировка задачи такая же, как и при применении классического вариационного исчисления, за исключением  ограничения (6.11).

В частном случае для определения закона, оптимального по быстродействию f0=1 и J = tк.

Введем дополнительную переменную (координату)

.                (6.12)

Тогда

.                          (6.13)

В итоге получаем расширенную систему уравнений

.   (6.14)

или в векторной форме:

.                                   (6.15)

Критерий J=x0(tк) -  представляет в этом случае конечное  значение переменной (координаты) х0. Значит задача формулируется как достижение экстремума конечного значения координаты х0.

В (n+1) пространстве геометрически это можно представить как нахождение траектории изменение состояния объекта (нахождение экстремали) от Хн до Хк при которой изменение  координаты х0 будет минимальным (или максимальным), как показано на рис. 6.2, оптимальной является траектория 1, остальные траектории 2 и 3 дают большую величину координаты х0к10к2,3).

Рис. 6.2. Траектории изменения состояния объекта 1, 2, 3 и изменение величины критерия  Х0к. Оптимальной является траектория 1.

Сложность принципа максимума в том, что вводятся вспомогательные функции:

, i=1,2,...,n.    (6.16)

Эти функции аналогичны  функциям qi в каноническом представлении уравнения Эйлере – Лагранжа (см. 5.21).

Введение функции Гамильтона

  (6.17)

позволяет объединить  основную (6.14)и сопряженную (6.16) системы уравнений следующим образом:

.                                           (6.18)

Если уравнение u(t), и соответствующая ему траектория  Х(t) оптимальны, то найдется такая ненулевая вектор-функция , составляющие которой удовлетворяют системе (5.17), что функция  будет иметь максимальное значение в заданном интервале [tн, tк]. Т.е.

.   (6.19)

Выражение (6.18) для определения ,управление будет оптимальным, если оно обеспечивает максимум функции (6.19)

Если выполняются эти условия, то функции  являются постоянными. При этом ,а .

Т.е. выражение принципа максимума (6.17) в векторной форме будет:

.                                       (6.20)

Пример применения принципа максимума

Рассмотрим ранее решенную задачу методом Эйлера-Лагранжа для объекта с передаточной функцией

,                                       (п.6.1)

оптимального управления по критерию

.                                        (п.6.2)

Запишем модель объекта (п.6.1) в виде дифференциального уравнения:

,                                              (п.6.3)

где обозначено.

Кроме граничных условий - x1(0)=х; х1()=0, накладывается ограничение по управляющему воздействию:

.                                                       (п.6.4)

Поэтому данную задачу будем решать методом принципа максимума.

Запишем исходные уравнения, введем дополнительную переменную (координату) х0:

Сформулируем функцию Гамильтона (6.17) для применения принципа максимума:

,   (п.6.5)

у которой   вспомогательные переменные  определяются системой уравнений (6.18)

                         (п.6.6)

.                                (п.6.7)

Принимая  из (п.6.7) получим выражение для определения оптимального закона изменения управляющего воздействия:

.                                              (п.6.8)

Данное выражение совпадает с выражением для uопт(t) в предыдущем примере при замене .

Значение  с учетом  и соотношений (п.6.6) можно определить из системы уравнений (см. также (6.18)).

.                                  (п.6.9)

Решение этой системы (см. предыдущий пример) будет:

.                  (п.6.10)

Подставив (п.6.10) в (п.6.8) получим:

,                                   (п.6.11)

где, как и в аналогичном примере,

.                              (п.6.12)

Но еще необходимо учесть ограничение (п.6.4).

Выпишем слагаемые функции Н, которые зависят от управляющего воздействия u:

.                                   (п.6.13)

Функция Н достигает максимума по u одновременно с функцией . Учитывая, что ,  представим   в следующем виде:

.   (п.6.14)

Из (п.6.14) видно, что оптимальное управляющее воздействие uопт не будет переходить значения umax или  в случае, если:

.                          (п.6.15)

Из (п.4.15) следует, что оптимальный П-регулятор с коэффициентом, определенным выражением (п.6.12) должен иметь ограничение по выходному управляющему сигналу (см.рис.6.4).

Рис. 6.4. Структура оптимальной  по квадратичному интегральному критерию замкнутой САУ с ограничением по управляющему воздействию

Из рассмотренного примера следует, что каноническая  форма общей задачи Лагранжа и уравнения при применении принципа максимума совпадает. Благодаря этому  получается один и тот же закон оптимального управления, если . Но уравнения Эйлера-Лагранжа не позволяют учесть ограничения по u. Применение принципа максимума приводит к вполне понятному результату: к появлению звена насыщения.


 

А также другие работы, которые могут Вас заинтересовать

6844. Основы настройки сетевых устройств CISCO 145.5 KB
  Основы настройки сетевых устройств CISCO Цель работы: познакомиться с устройством маршрутизаторов, основами операционной системы IOS, протоколами маршрутизации и списками контроля доступа. План работы: Настройте адреса всех сетевых интерфейсов...
6845. Налаштування IPSec VPN засобами IOS 416 KB
  Налаштування IPSecVPN засобами IOS Завдання роботи: Налаштування EIGRP на маршрутизаторах Створення IPSecVPN між двома маршрутизаторами Перевірка функціонування IPSec Топологія Сценарій У даній роботі ви налаштуєте VPN ...
6846. Захист GRE-тунеля 365 KB
  Захист GRE-тунеля Завдання роботи: Створення GRE тунеля між двома маршрутизаторами Використання IPSec для захисту тунеля Топологія Сценарій У даній роботі ви налаштуєте GRE - тунель (GenericRoutingEncapsulation), захище...
6847. Налаштування контекстного контролю доступу 173 KB
  Налаштування контекстного контролю доступу Завдання роботи: Навчитися налаштовувати правила контекстного контролю доступу на маршрутизаторах Топологія Сценарій Контекстний контроль доступу (CBAC - Context Based Access Control) є...
6848. Програмування зовнішніх пристроїв 60.01 KB
  Програмування зовнішніх пристроїв Мета роботи: Навчитись розробляти програми виводу/вводу інформації через інтерфейс USB, а також використовувати функції третіх фірм. Хід виконання роботи Вивчити будову інтерфейса USB (наприклад, М.Гук Интерфейс...
6849. Аппроксимация функций с помощью полинома Лагранжа 382 KB
  Аппроксимация функций Цель работы: Ознакомление с задачей аппроксимации функции одной переменной, изучение задачи интерполирования функции Приобретение навыков программирования интерполяционных формул П...
6850. Обчислювальна фізика. Методичні вказівки до практичних та лабораторних занять 468.5 KB
  Етапи розв'язування задач моделювання. Постановка задачі. Створення математичної моделі. Математичне моделювання. Організація наближених обчислень. Джерела і види похибок. Запис наближених чисел. Правило округлення. Похибки результату при діях із наближеними числами. Поширення похибок округлення при обчисленнях...
6851. Механіка. Методичні рекомендації до лабораторних робіт 310.5 KB
  Лабораторні роботи Згідно з навчальною програмою дисципліни Механіка передбачені такі лабораторні роботи: Лабораторна робота № 1. Визначення розрахунковими та експериментальними методами масових та інерційних характеристик елементів М ПЕА. Лаб...
6852. Операційна система Microsoft Windows 7. Робота з файлами, папками, ярликами. Програма Провідник. Налаштування робочого середовища операційної системи Windows 2.53 MB
  Операційна система Microsoft Windows 7. Робота з файлами, папками, ярликами. Програма Провідник. Налаштування робочого середовища операційної системи Windows. Мета: Формувати практичні вміння та навички роботи з інтерфейсом, файлами та довідкою опер...