9906

Принцип максимума. Классификация задач оптимального управления динамическими системами

Реферат

Информатика, кибернетика и программирование

Принцип максимума Вторым направлением в теории решения задач управления является принцип максимума. Это метод в отличие от классического вариационного исчисления позволяет решать задачи управления, в которых на управляющие параметры наложены весьма ...

Русский

2013-03-18

106.5 KB

28 чел.

Принцип максимума

Вторым направлением в теории решения задач управления является принцип максимума. Это метод в отличие от классического вариационного исчисления позволяет решать задачи управления, в которых на управляющие параметры наложены весьма общие ограничения, хотя обычно заранее предопределяется ряд свойств решения. Благодаря этому принцип максимума является основным математическим приемом, используемым при расчете оптимального управления во многих важных задачах математики, техники и экономики.

Принцип максимума применяется к общей задаче управления, имеющей вид

+F(x1, t1),

= f(x, u, t), x(t0) = x0, x(t1) = x1, {u(t)}U. (1)

Здесь I(), F(..) и f() – заданные непрерывно дифференцируемые функции, t0, x0 – фиксированные параметры, t1 или x1 – фиксированные параметры (либо с помощью уравнения T(x, t)=0 определяется конченая поверхность). Траектория управления {u(t)} должна принадлежать фиксированному множеству управлений U, причем u(t) – кусочно-непрерывная функция времени, значения которой должны принадлежать некоторому фиксированному множеству , являющемуся непустым компактным подмножеством пространства Er.


Классификация задач оптимального управления динамическими системами

Запишем формулировку задачи оптимального управления. Дана система, объект, процесс. Система описывается дифференциальным уравнением:

,

где  x – вектор фазовых координат, u – вектор управления,

t – время.

На вектора x и u наложены ограничения x X, uU.

Система рассматривается на интервале t[0, T].

Требуется определить вектор–функции u(t), x(t) доставляющие минимум функционалу J=J(x, u) при переводе из начального состояния (x(0), 0) в конечное  состояние (x(T), T).

Задачи оптимального управления классифицируются по способу задания функционала, по способу задания ограничений вдоль траектории и по способу задания краевых условий.

Способы задания функционала:

Интегральный функционал.

 F – дифференцируемая функция своих аргументов.

При отсутствии ограничений на x и u задача называется задачей Лагранжа и является классической задачей вариационного исчисления. В качестве примера можно рассмотреть агрегат, который должен дать максимальное количество продукции. При этом функция F (x, u, t) имеет смысл мгновенной производительности, а интеграл – полную выработку продукции.

Задача Майера.

Минимизируется функционал

J(x, u)=[x(T), T].

Например, задача о достижении наибольшей дальности ракетой.

Формально задача Майера является более общей, чем задача Лагранжа. Любая задача Лагранжа может рассматриваться как частный случай задачи Майера.

Действительно, достаточно ввести новую скалярную переменную

xn+1=F(x, u, t),

 новый фазовый вектор

и вектор

тогда система будет описываться уравнением:

а минимизации подлежит функционал

Задача Больца. Функционал смешанного типа.

Можно усмотреть, что задача Больца также может быть сведена к задаче Майера.

Задача на быстродействие.

Этим термином объединяются задачи, в которых функционалом является время, т.е. требуется перевести систему из одного состояния в другое за минимальное время.

Способы задания ограничений

а) ограничения только на управление.

Например,

u(t)U или u(t) (t).

При наличии ограничений на управление классические методы оказываются непригодными.

б) ограничения на фазовые переменные.

Например,

x(t)X.

Могут быть ограничения типа равенств:

,

или типа неравенств:

.

в) совместные ограничения на управление и фазовые переменные. Бывают случаи, когда ограничение на управление и фазовые координаты не могут быть разделены (в экономике).

Здесь также ограничения типа равенств:

, j=1, , kn+m

и неравенств:

, j=1, , kn+m

г) изопериметрическая задача (задача с интегральными ограничениями)

где   j – скалярные функции,

L j – числа.

Класс изопериметрических задач играет большую роль, как в технике, так и в экономике, когда задан суммарный объем некоторого ресурса, которым мы вправе распоряжаться.

Изопериметрическая задача может быть сведена к задаче Лагранжа или Майера увеличением размерности фазового вектора x

Xn+ j = j (x, u, t), (j=1, …, k),

с граничными условиями

xn+ j(0)=0,

xn+ j(T)=L j.

Способы задания краевых условий.

а) задача с фиксированными концами, когда х(0) и х(T) заданы. В данном случае задачи подразделяются на задачи с фиксированным и нефиксированным временем.

б) задача со свободным концом, когда х(0) или х(T) не задано. Здесь также задачи с фиксированным и нефиксированным временем

г) задача с подвижными концами, Т фиксировано, а х(0) и х(T) лежат на некоторых гиперповерхностях:

l[x(0)]=0,  j=1, , p,

где .

Задачи с дискретным временем.

С такими задачами мы сталкиваемся, когда осуществляем дискретизацию задачи, т.е. заменяем дифференциальное уравнение конечно – разностным. Кроме того, существует обширный класс задач в технике и экономике, которые являются дискретными по существу. Поэтому будем также рассматривать системы, описываемые конечно – разностными уравнениями xn=fn(xn, un),  n=0, , N.

Функционал для таких задач будет иметь вид:

   – задача Лагранжа,

J(x, u)(xN)      – задача Майера,

  – задача Больца.

Например, изопериметрические ограничения записываются в виде:

Допустимые управления

Мы будем рассматривать поведение объекта, состояние которого в каждый момент времени характеризуется n переменными х1, х2,, хn (например, координатами и скоростями). Векторное пространство X векторной переменной х={х1, х2,, хn} является фазовым пространством рассматриваемого объекта. Поведение (движение) объекта заключается (с математической точки зрения) в том, что переменные х1, х2,, хn меняются с течением времени. Предполагается, что движением объекта можно управлять, т. е. что объект снабжен некоторыми «рулями», от положения которых зависит движение объекта. Положения «рулей» характеризуются точкой u некоторой области управления U, которая может быть любым топологическим хаусдорфовым пространством. В приложениях важен случай, когда U является замкнутой областью некоторого r – мерного евклидова пространства Е; в этом случае задание точки u=(u1, u2,, ur)U равносильно заданию системы числовых параметров u1, u2,, ur.

Каждую функцию u=u(t), определенную на некотором отрезке t0tt1 времени t и принимающую значения в пространстве U, мы будем называть управлением. В дальнейшем предполагается, что выбран некоторый класс D управлений; управления, принадлежащие этому классу, будут называться допустимыми. От класса D допустимых управлений требуется только, чтобы он удовлетворял следующим трем условиям.

1) Все управления u=u(t), принадлежащие классу D (т.е. допустимые), должны быть измеримыми и ограниченными. Управление u=u(t), t0tt1, называется измеримым, если для любого открытого множества OU множество тех значений t, для которых u(t)O, измеримо на отрезке t0tt1. Управление ограниченно, если множество всех точек u(t), t0tt1, имеет в пространстве U компактное замыкание. (Если, в частности, U есть замкнутое подмножество векторного пространства переменной u=(u1, u2,, ur), то измеримость и ограниченность имеют обычный смысл.)

2) Если u(t), t0tt1, – допустимое управление и если и v – произвольная точка пространства U, a t', t" – такие числа, что t0 t't"t1, то управление u1(t), t0tt1, определяемое формулой

также является допустимым.

3) Если отрезок t0tt1 можно разбить точками деления на конечное число частичных отрезков, на каждом из которых управление u(t) допустимо, то это управление допустимо и на всем отрезке t0tt1. Допустимое управление, рассматриваемое на частичном отрезке, также является допустимым. Управление, получающееся из допустимого управления u(t), t0tt1, сдвигом времени (т. е. управление u1(t)=u(t—), t0+<t<t1 + ), также является допустимым.

В качестве класса допустимых управлений можно взять, например, класс всех измеримых ограниченных управлений. Другим примером может служить множество всех кусочно–непрерывных управлений (т.е. таких управлений u=u(t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция u(t) может терпеть разрывы первого рода). Этот класс допустимых управлений, по – видимому, наиболее интересен для технических применений развиваемой здесь теории; такие управления соответствуют предположению о «безынерционности» рулей. Можно также рассматривать класс всех кусочно – постоянных управлений, класс кусочно – линейных управлений и т. п. В дальнейшем класс D допустимых управлений предполагается фиксированным.


Принцип максимума Понтрягина

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

 

         (1)

где           (2)

При этом предполагается, что моменты фиксированы, т.е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют.

Положим

,

где - константа,

Функция H называется функцией Гамильтона.

Система линейных дифференциальных уравнений

относительно переменных называется сопряженной системой, соответствующей управлению u и траектории x. Здесь

В более подробной покоординатной записи сопряженная система принимает вид

   (3)

Система (3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, имеют частные производные по переменным и непрерывны вместе с этими производными по совокупности аргументов . Предположим, что (u, x) – решение задачи (1). Тогда существует решение сопряженной системы (3), соответствующей управлению u и траектории x, и константа  такие, что при , и выполняются следующие условия:

a) (условие максимума) функция Гамильтона , достигает максимума по  при v = u(t), т.е.

   (4)

б) (условие трансверсальности на левом конце траектории) существуют числа , такие, что

       (5)

в) (условие трансверсальности на правом конце траектории) существуют числа , такие, что

    (6)

Центральным в теореме является условие максимума – (4).

Если отказаться от предположения о том, что конечный момент времени T фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (6) необходимо заменить условием

 

и добавить еще одно условие трансверсальности на правом конце траектории:

.


Примеры задач оптимального управления
 

Приведем некоторые задачи оптимального управления, которые, благодаря их типичности, часто встречаются во многих учебниках по теории оптимальных процессов. Эти задачи относятся к различным областям человеческой деятельности: технике, экономике, экологии и др. Но в то же время они являются "учебными" и служат, в основном, для иллюстрации некоторых теоретических положений. Очевидно, задачи и модели, представляющие непосредственный практический интерес, должны быть более подробными, глубокими и сложными. Учебные задачи - это первое приближение к реальным практическим задачам, их упрощенный аналог.

Максимизация дальности полета аппарата в атмосфере. Рассматривается летательный аппарат, положение которого описывается следующими параметрами: дальность и высота полета, величина и угол наклона к горизонту вектора скорости. Роль управлений играют угол атаки и функция, отвечающая возможности изменять в полете геометрию крыльев (т.е. их эффективную площадь). Требуется найти такие управляющие функции, которые доставляют максимум дальности полета.

Задача ракетодинамики в однородном поле (задача об оптимальном в смысле расхода топлива движении ракеты в пустоте). Рассматривается управляемый ракетный аппарат, состояние которого задается координатами в трехмерном пространстве, вектором скорости и значением массы. Управление осуществляется выбором направления и абсолютного значения тяги ракеты. Требуется так управлять ракетой, чтобы в фиксированный момент времени она достигла заданной точки, имея определенную скорость и израсходовав минимум топлива (т.е. имея максимально возможную массу).

Задача о максимальной высоте подъема вертикально взлетающей в атмосфере ракеты-зонда. Состояние ракеты задается значениями высоты, скорости и массы. Задача состоит в выборе тяги, которая максимизировала бы высоту подъема при свободной продолжительности полета.

Задача об оптимизации мясозаготовок. На ферме имеется стадо скота. Ежегодно часть стада отправляется на мясозаготовки, причем доход фермы зависит от количества проданного скота. Фазовой переменной выступает количество скота на ферме в конце каждого года после мясозаготовок, управляющим параметром - количество проданного на мясо скота. Требуется определить, каким образом ферма может получить максимальный доход за несколько лет при определенном минимуме ежегодных мясозаготовок и заданном значении поголовья скота на конец планового периода.

Оптимальное распределение ресурсов. Некоторая заданная начальная сумма денег затрачивается на приобретение оборудования двух типов А и В. С помощью этого оборудования организуется производство. Распределяя имеющиеся средства между различными типами оборудования, к концу срока эксплуатации получают определенный экономический эффект. Затем амортизированное оборудование реализуют, а вырученные средства используют как начальную сумму для следующего цикла, и т.д. Требуется найти такую стратегию распределения средств для покупки оборудования типов А и В в каждом цикле, чтобы обеспечить наибольший экономический эффект после фиксированного числа производственно-экономических циклов.

Распределение температуры в тонком стержне конечной длины с теплоизолированными концами. Состояние объекта описывается функцией распределения температуры по длине стержня и во времени, роль управления играет плотность тепловых источников. Задача состоит в отыскании такого управления, для которого распределение температуры как можно быстрее достигает заданного состояния.

Демпфирование колебаний спутника на круговой орбите. Для ориентации вытянутых спутников вдоль вертикали часто используется эффект собственной устойчивости, обусловленный слабым градиентом поля тяготения. Этот эффект приводит к колебаниям при отклонении от положения равновесия, которые требуется погасить с наименьшими затратами топлива, если демпфирование производится с помощью ракетного двигателя. В качестве фазовых переменных берутся угол и скорость отклонения оси спутника относительно текущего радиуса-вектора центра масс на орбите, управлением является тяга реактивного двигателя.

Задача об оптимальном управлении возрастной структурой популяции. Рассматривается непрерывная модель возрастной структуры популяции, разделенной на две возрастные группы. Управление заключается в том, что в обеих группах может происходить "пополнение-изъятие", а целью управления является максимизация дохода от урожая, за вычетом издержек на пополнение. Фазовыми переменными здесь, очевидно, являются численности популяций, а саму модель можно трактовать, например, как процесс эксплуатации некоторого водоема посредством выпуска мальков и отлова взрослых экземпляров рыбы.

Задача оптимального распределения капитальных вложений в отрасли на заданном интервале планирования. Состояние отрасли описывается величиной основных производственных фондов, количество которых растет за счет капитальных вложений и уменьшается за счет физического и морального износа. Капитальные вложения в отрасль играют роль управлений, а критерий оптимальности процессов одновременно учитывает экономию капиталовложений, с одной стороны, и увеличение основных производственных фондов отрасли - с другой. Эту задачу можно обобщить на случай нескольких отраслей. Тогда распределение капитальных вложений нужно осуществить не только во времени, но и между отраслями, которые являются "конкурентами".


 

А также другие работы, которые могут Вас заинтересовать

33464. Співучастю у злочині 29 KB
  Таким чином, при окресленні обєктивних і субєктивних ознак співучасті має місце вказівка на спільність
33465. Субєкт злочину 29 KB
  Передусім субєктом злочину може бути тільки фізична особа, тобто людина. Нести кримінальну відповідальність можуть громадяни України, іноземці й особи без громадянства. Тому не можуть бути визнані субєктом злочину юридичні особи (підприємства, установи, громадські організації і т. ін.).
33466. Субєктивна сторона злочину 25.5 KB
  Відсутність певного мотиву або мети також може виключати склад злочину і кримінальну відповідальность.
33467. Судимість 35 KB
  Підставою судимості є наявність обвинувального вироку суду який набрав законної сили і яким особа засуджується до певного покарання. Тому такими що не мають судимості визнаються: а особи засуджені вироком суду без призначення покарання; б особи засуджені вироком суду із звільненням від покарання; в особи які відбули покарання за діяння злочинність і караність яких виключена законом.Погашення судимості. Погашення судимості це автоматичне її припинення при встановленні певних передбачених законом умов.
33468. Тлумачення закону 32 KB
  Тлумачення закону поділяється на види залежно від суб'єкта тлумачення прийомів засобів та обсягу тлумачення. Залежно від суб'єкта який роз'яснює закон розрізняють легальне або офіційне судове і наукове або доктринальне тлумачення. Легальним офіційним зветься тлумачення що здійснюється органом державної влади уповноваженим на те законом. 150 Конституції України правом офіційного тлумачення законів в тому числі кримінальних наділений Конституційний Суд України.
33469. Мета злочину 29 KB
  В багатьох злочинах субєктивна сторона потребує встановлення мотиву і мети, що є її факультативними ознаками. Вони мають значення обовязкових ознак лише в тих випадках, коли названі в диспозиції статті ОЧ КК як обовязкові ознаки конкретного злочину. У деяких складах злочинів закон вказує на емоційний стан особи
33470. Фізичний або психічний примус 27 KB
  40 КК передбачає що не є злочином дія або бездіяльність особи яка заподіяла шкоду правоохоронюваним інтересам вчинена під безпосереднім впливом фізичного примусу внаслідок якого особа не могла керувати своїми діями. Підставою виключення злочинності діяння у випадку що аналізується є непереборний фізичний примус під безпосереднім впливом якого особа заподіює шкоду правоохоронюваним інтересам. Фізичний примус насильство це протиправний фізичний вплив на людину наприклад застосування фізичної сили нанесення удару побоїв тілесних...
33471. Форми співучасті 29 KB
  У такому разі говорять про просту і про складну співучасть: 1 проста співучасть співвиконавство співвинність має місце там де всі співучасники є виконавцями злочину і отже всі вони виконують однорідну роль. Але з погляду форми співучасті їх ролі однорідні всі вони безпосередньо виконують дії описані в диспозиції статті Особливої частини КК як ознаки об'єктивної сторони конкретного складу злочину в даному випадку розбою; 2 складна співучасть співучасть з розподілом ролей виявляється в тому що співучасники виконують різнорідні...
33472. Законодавство 29 KB
  Статті Загальної частини КК містять норми що встановлюють принципи та загальні положення кримінального права; чинність кримінального закону в просторі та часі; визначають поняття злочину; стадії вчинення злочину; ознаки субєкта злочину; зміст вини; співучасть у вчиненні злочинів; види множини злочинів; обставини що виключають злочинність діяння; підстави звільнення від кримінальної відповідальності від покарання та його відбування; загальні засади призначення покарання. Загальна і Особлива частини КК взаємозвязані між собою і складають...