9906

Принцип максимума. Классификация задач оптимального управления динамическими системами

Реферат

Информатика, кибернетика и программирование

Принцип максимума Вторым направлением в теории решения задач управления является принцип максимума. Это метод в отличие от классического вариационного исчисления позволяет решать задачи управления, в которых на управляющие параметры наложены весьма ...

Русский

2013-03-18

106.5 KB

27 чел.

Принцип максимума

Вторым направлением в теории решения задач управления является принцип максимума. Это метод в отличие от классического вариационного исчисления позволяет решать задачи управления, в которых на управляющие параметры наложены весьма общие ограничения, хотя обычно заранее предопределяется ряд свойств решения. Благодаря этому принцип максимума является основным математическим приемом, используемым при расчете оптимального управления во многих важных задачах математики, техники и экономики.

Принцип максимума применяется к общей задаче управления, имеющей вид

+F(x1, t1),

= f(x, u, t), x(t0) = x0, x(t1) = x1, {u(t)}U. (1)

Здесь I(), F(..) и f() – заданные непрерывно дифференцируемые функции, t0, x0 – фиксированные параметры, t1 или x1 – фиксированные параметры (либо с помощью уравнения T(x, t)=0 определяется конченая поверхность). Траектория управления {u(t)} должна принадлежать фиксированному множеству управлений U, причем u(t) – кусочно-непрерывная функция времени, значения которой должны принадлежать некоторому фиксированному множеству , являющемуся непустым компактным подмножеством пространства Er.


Классификация задач оптимального управления динамическими системами

Запишем формулировку задачи оптимального управления. Дана система, объект, процесс. Система описывается дифференциальным уравнением:

,

где  x – вектор фазовых координат, u – вектор управления,

t – время.

На вектора x и u наложены ограничения x X, uU.

Система рассматривается на интервале t[0, T].

Требуется определить вектор–функции u(t), x(t) доставляющие минимум функционалу J=J(x, u) при переводе из начального состояния (x(0), 0) в конечное  состояние (x(T), T).

Задачи оптимального управления классифицируются по способу задания функционала, по способу задания ограничений вдоль траектории и по способу задания краевых условий.

Способы задания функционала:

Интегральный функционал.

 F – дифференцируемая функция своих аргументов.

При отсутствии ограничений на x и u задача называется задачей Лагранжа и является классической задачей вариационного исчисления. В качестве примера можно рассмотреть агрегат, который должен дать максимальное количество продукции. При этом функция F (x, u, t) имеет смысл мгновенной производительности, а интеграл – полную выработку продукции.

Задача Майера.

Минимизируется функционал

J(x, u)=[x(T), T].

Например, задача о достижении наибольшей дальности ракетой.

Формально задача Майера является более общей, чем задача Лагранжа. Любая задача Лагранжа может рассматриваться как частный случай задачи Майера.

Действительно, достаточно ввести новую скалярную переменную

xn+1=F(x, u, t),

 новый фазовый вектор

и вектор

тогда система будет описываться уравнением:

а минимизации подлежит функционал

Задача Больца. Функционал смешанного типа.

Можно усмотреть, что задача Больца также может быть сведена к задаче Майера.

Задача на быстродействие.

Этим термином объединяются задачи, в которых функционалом является время, т.е. требуется перевести систему из одного состояния в другое за минимальное время.

Способы задания ограничений

а) ограничения только на управление.

Например,

u(t)U или u(t) (t).

При наличии ограничений на управление классические методы оказываются непригодными.

б) ограничения на фазовые переменные.

Например,

x(t)X.

Могут быть ограничения типа равенств:

,

или типа неравенств:

.

в) совместные ограничения на управление и фазовые переменные. Бывают случаи, когда ограничение на управление и фазовые координаты не могут быть разделены (в экономике).

Здесь также ограничения типа равенств:

, j=1, , kn+m

и неравенств:

, j=1, , kn+m

г) изопериметрическая задача (задача с интегральными ограничениями)

где   j – скалярные функции,

L j – числа.

Класс изопериметрических задач играет большую роль, как в технике, так и в экономике, когда задан суммарный объем некоторого ресурса, которым мы вправе распоряжаться.

Изопериметрическая задача может быть сведена к задаче Лагранжа или Майера увеличением размерности фазового вектора x

Xn+ j = j (x, u, t), (j=1, …, k),

с граничными условиями

xn+ j(0)=0,

xn+ j(T)=L j.

Способы задания краевых условий.

а) задача с фиксированными концами, когда х(0) и х(T) заданы. В данном случае задачи подразделяются на задачи с фиксированным и нефиксированным временем.

б) задача со свободным концом, когда х(0) или х(T) не задано. Здесь также задачи с фиксированным и нефиксированным временем

г) задача с подвижными концами, Т фиксировано, а х(0) и х(T) лежат на некоторых гиперповерхностях:

l[x(0)]=0,  j=1, , p,

где .

Задачи с дискретным временем.

С такими задачами мы сталкиваемся, когда осуществляем дискретизацию задачи, т.е. заменяем дифференциальное уравнение конечно – разностным. Кроме того, существует обширный класс задач в технике и экономике, которые являются дискретными по существу. Поэтому будем также рассматривать системы, описываемые конечно – разностными уравнениями xn=fn(xn, un),  n=0, , N.

Функционал для таких задач будет иметь вид:

   – задача Лагранжа,

J(x, u)(xN)      – задача Майера,

  – задача Больца.

Например, изопериметрические ограничения записываются в виде:

Допустимые управления

Мы будем рассматривать поведение объекта, состояние которого в каждый момент времени характеризуется n переменными х1, х2,, хn (например, координатами и скоростями). Векторное пространство X векторной переменной х={х1, х2,, хn} является фазовым пространством рассматриваемого объекта. Поведение (движение) объекта заключается (с математической точки зрения) в том, что переменные х1, х2,, хn меняются с течением времени. Предполагается, что движением объекта можно управлять, т. е. что объект снабжен некоторыми «рулями», от положения которых зависит движение объекта. Положения «рулей» характеризуются точкой u некоторой области управления U, которая может быть любым топологическим хаусдорфовым пространством. В приложениях важен случай, когда U является замкнутой областью некоторого r – мерного евклидова пространства Е; в этом случае задание точки u=(u1, u2,, ur)U равносильно заданию системы числовых параметров u1, u2,, ur.

Каждую функцию u=u(t), определенную на некотором отрезке t0tt1 времени t и принимающую значения в пространстве U, мы будем называть управлением. В дальнейшем предполагается, что выбран некоторый класс D управлений; управления, принадлежащие этому классу, будут называться допустимыми. От класса D допустимых управлений требуется только, чтобы он удовлетворял следующим трем условиям.

1) Все управления u=u(t), принадлежащие классу D (т.е. допустимые), должны быть измеримыми и ограниченными. Управление u=u(t), t0tt1, называется измеримым, если для любого открытого множества OU множество тех значений t, для которых u(t)O, измеримо на отрезке t0tt1. Управление ограниченно, если множество всех точек u(t), t0tt1, имеет в пространстве U компактное замыкание. (Если, в частности, U есть замкнутое подмножество векторного пространства переменной u=(u1, u2,, ur), то измеримость и ограниченность имеют обычный смысл.)

2) Если u(t), t0tt1, – допустимое управление и если и v – произвольная точка пространства U, a t', t" – такие числа, что t0 t't"t1, то управление u1(t), t0tt1, определяемое формулой

также является допустимым.

3) Если отрезок t0tt1 можно разбить точками деления на конечное число частичных отрезков, на каждом из которых управление u(t) допустимо, то это управление допустимо и на всем отрезке t0tt1. Допустимое управление, рассматриваемое на частичном отрезке, также является допустимым. Управление, получающееся из допустимого управления u(t), t0tt1, сдвигом времени (т. е. управление u1(t)=u(t—), t0+<t<t1 + ), также является допустимым.

В качестве класса допустимых управлений можно взять, например, класс всех измеримых ограниченных управлений. Другим примером может служить множество всех кусочно–непрерывных управлений (т.е. таких управлений u=u(t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция u(t) может терпеть разрывы первого рода). Этот класс допустимых управлений, по – видимому, наиболее интересен для технических применений развиваемой здесь теории; такие управления соответствуют предположению о «безынерционности» рулей. Можно также рассматривать класс всех кусочно – постоянных управлений, класс кусочно – линейных управлений и т. п. В дальнейшем класс D допустимых управлений предполагается фиксированным.


Принцип максимума Понтрягина

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

 

         (1)

где           (2)

При этом предполагается, что моменты фиксированы, т.е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют.

Положим

,

где - константа,

Функция H называется функцией Гамильтона.

Система линейных дифференциальных уравнений

относительно переменных называется сопряженной системой, соответствующей управлению u и траектории x. Здесь

В более подробной покоординатной записи сопряженная система принимает вид

   (3)

Система (3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, имеют частные производные по переменным и непрерывны вместе с этими производными по совокупности аргументов . Предположим, что (u, x) – решение задачи (1). Тогда существует решение сопряженной системы (3), соответствующей управлению u и траектории x, и константа  такие, что при , и выполняются следующие условия:

a) (условие максимума) функция Гамильтона , достигает максимума по  при v = u(t), т.е.

   (4)

б) (условие трансверсальности на левом конце траектории) существуют числа , такие, что

       (5)

в) (условие трансверсальности на правом конце траектории) существуют числа , такие, что

    (6)

Центральным в теореме является условие максимума – (4).

Если отказаться от предположения о том, что конечный момент времени T фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (6) необходимо заменить условием

 

и добавить еще одно условие трансверсальности на правом конце траектории:

.


Примеры задач оптимального управления
 

Приведем некоторые задачи оптимального управления, которые, благодаря их типичности, часто встречаются во многих учебниках по теории оптимальных процессов. Эти задачи относятся к различным областям человеческой деятельности: технике, экономике, экологии и др. Но в то же время они являются "учебными" и служат, в основном, для иллюстрации некоторых теоретических положений. Очевидно, задачи и модели, представляющие непосредственный практический интерес, должны быть более подробными, глубокими и сложными. Учебные задачи - это первое приближение к реальным практическим задачам, их упрощенный аналог.

Максимизация дальности полета аппарата в атмосфере. Рассматривается летательный аппарат, положение которого описывается следующими параметрами: дальность и высота полета, величина и угол наклона к горизонту вектора скорости. Роль управлений играют угол атаки и функция, отвечающая возможности изменять в полете геометрию крыльев (т.е. их эффективную площадь). Требуется найти такие управляющие функции, которые доставляют максимум дальности полета.

Задача ракетодинамики в однородном поле (задача об оптимальном в смысле расхода топлива движении ракеты в пустоте). Рассматривается управляемый ракетный аппарат, состояние которого задается координатами в трехмерном пространстве, вектором скорости и значением массы. Управление осуществляется выбором направления и абсолютного значения тяги ракеты. Требуется так управлять ракетой, чтобы в фиксированный момент времени она достигла заданной точки, имея определенную скорость и израсходовав минимум топлива (т.е. имея максимально возможную массу).

Задача о максимальной высоте подъема вертикально взлетающей в атмосфере ракеты-зонда. Состояние ракеты задается значениями высоты, скорости и массы. Задача состоит в выборе тяги, которая максимизировала бы высоту подъема при свободной продолжительности полета.

Задача об оптимизации мясозаготовок. На ферме имеется стадо скота. Ежегодно часть стада отправляется на мясозаготовки, причем доход фермы зависит от количества проданного скота. Фазовой переменной выступает количество скота на ферме в конце каждого года после мясозаготовок, управляющим параметром - количество проданного на мясо скота. Требуется определить, каким образом ферма может получить максимальный доход за несколько лет при определенном минимуме ежегодных мясозаготовок и заданном значении поголовья скота на конец планового периода.

Оптимальное распределение ресурсов. Некоторая заданная начальная сумма денег затрачивается на приобретение оборудования двух типов А и В. С помощью этого оборудования организуется производство. Распределяя имеющиеся средства между различными типами оборудования, к концу срока эксплуатации получают определенный экономический эффект. Затем амортизированное оборудование реализуют, а вырученные средства используют как начальную сумму для следующего цикла, и т.д. Требуется найти такую стратегию распределения средств для покупки оборудования типов А и В в каждом цикле, чтобы обеспечить наибольший экономический эффект после фиксированного числа производственно-экономических циклов.

Распределение температуры в тонком стержне конечной длины с теплоизолированными концами. Состояние объекта описывается функцией распределения температуры по длине стержня и во времени, роль управления играет плотность тепловых источников. Задача состоит в отыскании такого управления, для которого распределение температуры как можно быстрее достигает заданного состояния.

Демпфирование колебаний спутника на круговой орбите. Для ориентации вытянутых спутников вдоль вертикали часто используется эффект собственной устойчивости, обусловленный слабым градиентом поля тяготения. Этот эффект приводит к колебаниям при отклонении от положения равновесия, которые требуется погасить с наименьшими затратами топлива, если демпфирование производится с помощью ракетного двигателя. В качестве фазовых переменных берутся угол и скорость отклонения оси спутника относительно текущего радиуса-вектора центра масс на орбите, управлением является тяга реактивного двигателя.

Задача об оптимальном управлении возрастной структурой популяции. Рассматривается непрерывная модель возрастной структуры популяции, разделенной на две возрастные группы. Управление заключается в том, что в обеих группах может происходить "пополнение-изъятие", а целью управления является максимизация дохода от урожая, за вычетом издержек на пополнение. Фазовыми переменными здесь, очевидно, являются численности популяций, а саму модель можно трактовать, например, как процесс эксплуатации некоторого водоема посредством выпуска мальков и отлова взрослых экземпляров рыбы.

Задача оптимального распределения капитальных вложений в отрасли на заданном интервале планирования. Состояние отрасли описывается величиной основных производственных фондов, количество которых растет за счет капитальных вложений и уменьшается за счет физического и морального износа. Капитальные вложения в отрасль играют роль управлений, а критерий оптимальности процессов одновременно учитывает экономию капиталовложений, с одной стороны, и увеличение основных производственных фондов отрасли - с другой. Эту задачу можно обобщить на случай нескольких отраслей. Тогда распределение капитальных вложений нужно осуществить не только во времени, но и между отраслями, которые являются "конкурентами".


 

А также другие работы, которые могут Вас заинтересовать

50518. Безопасность жизнедеятельности. Лабораторный практикум 244.5 KB
  Оптимальные и допустимые величины показателей микроклимата устанавливаются в зависимости от: 1 периода года; холодный период года характеризуется среднесуточной температурой наружного воздуха 10оС и ниже теплый выше 10оС; 2 категории работ по уровню энергозатрат организма.54896 устанавливает что при температуре воздуха на рабочих местах 25 оС и выше...
50519. Закрытый склад. Расчет деревянной конструкции 373.77 KB
  В курсовом проекте произведен расчет деревянных конструкций гнутоклееной рамы. Определены расчетные и нормативные нагрузки на перекрытие и поперечную раму здания. Подобрано сечение элементов поперечника. Выбраны конструктивные решения. Осуществлены расчеты узлов поперечника.
50520. Исследование процессов во влажном воздухе 138.5 KB
  Изучение процессов изменения состояния влажного воздуха приобретение навыков измерения влажности с помощью аспирационного психрометра и Id диаграммы. Смесь сухого воздуха с водяным паром называется влажным воздухом. Соответственно этому влажный воздух бывает: насыщенным влажным воздухом – смесь сухого воздуха с насыщенным водяным паром; ненасыщенным влажным воздухом – смесь сухого воздуха с перегретым водяным паром. При дальнейшем охлаждении влажного воздуха происходит конденсация пара.
50521. Определение настроек BIOS персонального компьютера 62 KB
  Раздел Power Параметр CPI PIC support установлен в положение Enbled разрешено. Возможные значения: Enbled Disbled. Следует оставить данный параметр без изменений Enbled поскольку данным процессором используется технология HyperTreding в противном случае можно нарушить нормальное функционирование системы либо снизить ее производительность. Параметр Microcode Updtion установлен в положение Enbled.
50523. ДОСЛІДЖЕННЯ ПРИНЦИПІВ РОБОТИ ВИМІРЮВАЛЬНИХ КАНАЛІВ ТЕМПЕРАТУРИ НА БАЗІ МІКРОПРОЦЕСОРНОГО ВИМІРЮВАЧА-РЕГУЛЯТОРА ТРМ1 869.5 KB
  Ознайомлення з методами вимірювання температури. КОРОТКІ ТЕОРЕТИЧНІ ВІДОМОСТІ Методи вимірювання температури і температурні шкали Виміряти температуру якогонебудь тіла безпосередньо тобто так як вимірюють інші фізичні величини наприклад довжину масу обєм або час не представляється можливим тому що в природі не існує еталона або зразка одиниці цієї величини. Тому визначення температури речовини роблять за допомогою спостереження за зміною фізичних властивостей іншої так званої термометричної речовини яка при зіткненні з нагрітим...
50525. Склад сыпучих материалов. Расчет деревянных конструкций поперечника 276.98 KB
  В данном курсовом проекте подобрано наиболее рациональное кон-структивное решение проектируемого здания, сконструированы и рассчитаны основные несущие и ограждающие конструкции, узловые соединения, выбраны мероприятия по защите элементов здания от гниения и возгорания. Все принятые конструктивные решения и расчетные алгоритмы соответствуют требованиям действующих нормативных документов
50526. Исследование системы управления виртуальной памятью Windows с использованием системного монитора 777 KB
  Целью работы является исследование системы управления виртуальной памятью в ОС Windows, а также оценка эффективности работы в режиме страничного обмена программ с известным распределением обращений к памяти (сортировок). Для этого используются стандартные средства администрирования...