9906

Принцип максимума. Классификация задач оптимального управления динамическими системами

Реферат

Информатика, кибернетика и программирование

Принцип максимума Вторым направлением в теории решения задач управления является принцип максимума. Это метод в отличие от классического вариационного исчисления позволяет решать задачи управления, в которых на управляющие параметры наложены весьма ...

Русский

2013-03-18

106.5 KB

28 чел.

Принцип максимума

Вторым направлением в теории решения задач управления является принцип максимума. Это метод в отличие от классического вариационного исчисления позволяет решать задачи управления, в которых на управляющие параметры наложены весьма общие ограничения, хотя обычно заранее предопределяется ряд свойств решения. Благодаря этому принцип максимума является основным математическим приемом, используемым при расчете оптимального управления во многих важных задачах математики, техники и экономики.

Принцип максимума применяется к общей задаче управления, имеющей вид

+F(x1, t1),

= f(x, u, t), x(t0) = x0, x(t1) = x1, {u(t)}U. (1)

Здесь I(), F(..) и f() – заданные непрерывно дифференцируемые функции, t0, x0 – фиксированные параметры, t1 или x1 – фиксированные параметры (либо с помощью уравнения T(x, t)=0 определяется конченая поверхность). Траектория управления {u(t)} должна принадлежать фиксированному множеству управлений U, причем u(t) – кусочно-непрерывная функция времени, значения которой должны принадлежать некоторому фиксированному множеству , являющемуся непустым компактным подмножеством пространства Er.


Классификация задач оптимального управления динамическими системами

Запишем формулировку задачи оптимального управления. Дана система, объект, процесс. Система описывается дифференциальным уравнением:

,

где  x – вектор фазовых координат, u – вектор управления,

t – время.

На вектора x и u наложены ограничения x X, uU.

Система рассматривается на интервале t[0, T].

Требуется определить вектор–функции u(t), x(t) доставляющие минимум функционалу J=J(x, u) при переводе из начального состояния (x(0), 0) в конечное  состояние (x(T), T).

Задачи оптимального управления классифицируются по способу задания функционала, по способу задания ограничений вдоль траектории и по способу задания краевых условий.

Способы задания функционала:

Интегральный функционал.

 F – дифференцируемая функция своих аргументов.

При отсутствии ограничений на x и u задача называется задачей Лагранжа и является классической задачей вариационного исчисления. В качестве примера можно рассмотреть агрегат, который должен дать максимальное количество продукции. При этом функция F (x, u, t) имеет смысл мгновенной производительности, а интеграл – полную выработку продукции.

Задача Майера.

Минимизируется функционал

J(x, u)=[x(T), T].

Например, задача о достижении наибольшей дальности ракетой.

Формально задача Майера является более общей, чем задача Лагранжа. Любая задача Лагранжа может рассматриваться как частный случай задачи Майера.

Действительно, достаточно ввести новую скалярную переменную

xn+1=F(x, u, t),

 новый фазовый вектор

и вектор

тогда система будет описываться уравнением:

а минимизации подлежит функционал

Задача Больца. Функционал смешанного типа.

Можно усмотреть, что задача Больца также может быть сведена к задаче Майера.

Задача на быстродействие.

Этим термином объединяются задачи, в которых функционалом является время, т.е. требуется перевести систему из одного состояния в другое за минимальное время.

Способы задания ограничений

а) ограничения только на управление.

Например,

u(t)U или u(t) (t).

При наличии ограничений на управление классические методы оказываются непригодными.

б) ограничения на фазовые переменные.

Например,

x(t)X.

Могут быть ограничения типа равенств:

,

или типа неравенств:

.

в) совместные ограничения на управление и фазовые переменные. Бывают случаи, когда ограничение на управление и фазовые координаты не могут быть разделены (в экономике).

Здесь также ограничения типа равенств:

, j=1, , kn+m

и неравенств:

, j=1, , kn+m

г) изопериметрическая задача (задача с интегральными ограничениями)

где   j – скалярные функции,

L j – числа.

Класс изопериметрических задач играет большую роль, как в технике, так и в экономике, когда задан суммарный объем некоторого ресурса, которым мы вправе распоряжаться.

Изопериметрическая задача может быть сведена к задаче Лагранжа или Майера увеличением размерности фазового вектора x

Xn+ j = j (x, u, t), (j=1, …, k),

с граничными условиями

xn+ j(0)=0,

xn+ j(T)=L j.

Способы задания краевых условий.

а) задача с фиксированными концами, когда х(0) и х(T) заданы. В данном случае задачи подразделяются на задачи с фиксированным и нефиксированным временем.

б) задача со свободным концом, когда х(0) или х(T) не задано. Здесь также задачи с фиксированным и нефиксированным временем

г) задача с подвижными концами, Т фиксировано, а х(0) и х(T) лежат на некоторых гиперповерхностях:

l[x(0)]=0,  j=1, , p,

где .

Задачи с дискретным временем.

С такими задачами мы сталкиваемся, когда осуществляем дискретизацию задачи, т.е. заменяем дифференциальное уравнение конечно – разностным. Кроме того, существует обширный класс задач в технике и экономике, которые являются дискретными по существу. Поэтому будем также рассматривать системы, описываемые конечно – разностными уравнениями xn=fn(xn, un),  n=0, , N.

Функционал для таких задач будет иметь вид:

   – задача Лагранжа,

J(x, u)(xN)      – задача Майера,

  – задача Больца.

Например, изопериметрические ограничения записываются в виде:

Допустимые управления

Мы будем рассматривать поведение объекта, состояние которого в каждый момент времени характеризуется n переменными х1, х2,, хn (например, координатами и скоростями). Векторное пространство X векторной переменной х={х1, х2,, хn} является фазовым пространством рассматриваемого объекта. Поведение (движение) объекта заключается (с математической точки зрения) в том, что переменные х1, х2,, хn меняются с течением времени. Предполагается, что движением объекта можно управлять, т. е. что объект снабжен некоторыми «рулями», от положения которых зависит движение объекта. Положения «рулей» характеризуются точкой u некоторой области управления U, которая может быть любым топологическим хаусдорфовым пространством. В приложениях важен случай, когда U является замкнутой областью некоторого r – мерного евклидова пространства Е; в этом случае задание точки u=(u1, u2,, ur)U равносильно заданию системы числовых параметров u1, u2,, ur.

Каждую функцию u=u(t), определенную на некотором отрезке t0tt1 времени t и принимающую значения в пространстве U, мы будем называть управлением. В дальнейшем предполагается, что выбран некоторый класс D управлений; управления, принадлежащие этому классу, будут называться допустимыми. От класса D допустимых управлений требуется только, чтобы он удовлетворял следующим трем условиям.

1) Все управления u=u(t), принадлежащие классу D (т.е. допустимые), должны быть измеримыми и ограниченными. Управление u=u(t), t0tt1, называется измеримым, если для любого открытого множества OU множество тех значений t, для которых u(t)O, измеримо на отрезке t0tt1. Управление ограниченно, если множество всех точек u(t), t0tt1, имеет в пространстве U компактное замыкание. (Если, в частности, U есть замкнутое подмножество векторного пространства переменной u=(u1, u2,, ur), то измеримость и ограниченность имеют обычный смысл.)

2) Если u(t), t0tt1, – допустимое управление и если и v – произвольная точка пространства U, a t', t" – такие числа, что t0 t't"t1, то управление u1(t), t0tt1, определяемое формулой

также является допустимым.

3) Если отрезок t0tt1 можно разбить точками деления на конечное число частичных отрезков, на каждом из которых управление u(t) допустимо, то это управление допустимо и на всем отрезке t0tt1. Допустимое управление, рассматриваемое на частичном отрезке, также является допустимым. Управление, получающееся из допустимого управления u(t), t0tt1, сдвигом времени (т. е. управление u1(t)=u(t—), t0+<t<t1 + ), также является допустимым.

В качестве класса допустимых управлений можно взять, например, класс всех измеримых ограниченных управлений. Другим примером может служить множество всех кусочно–непрерывных управлений (т.е. таких управлений u=u(t), каждое из которых непрерывно для всех рассматриваемых t, за исключением лишь конечного числа моментов времени, где функция u(t) может терпеть разрывы первого рода). Этот класс допустимых управлений, по – видимому, наиболее интересен для технических применений развиваемой здесь теории; такие управления соответствуют предположению о «безынерционности» рулей. Можно также рассматривать класс всех кусочно – постоянных управлений, класс кусочно – линейных управлений и т. п. В дальнейшем класс D допустимых управлений предполагается фиксированным.


Принцип максимума Понтрягина

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

 

         (1)

где           (2)

При этом предполагается, что моменты фиксированы, т.е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют.

Положим

,

где - константа,

Функция H называется функцией Гамильтона.

Система линейных дифференциальных уравнений

относительно переменных называется сопряженной системой, соответствующей управлению u и траектории x. Здесь

В более подробной покоординатной записи сопряженная система принимает вид

   (3)

Система (3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, имеют частные производные по переменным и непрерывны вместе с этими производными по совокупности аргументов . Предположим, что (u, x) – решение задачи (1). Тогда существует решение сопряженной системы (3), соответствующей управлению u и траектории x, и константа  такие, что при , и выполняются следующие условия:

a) (условие максимума) функция Гамильтона , достигает максимума по  при v = u(t), т.е.

   (4)

б) (условие трансверсальности на левом конце траектории) существуют числа , такие, что

       (5)

в) (условие трансверсальности на правом конце траектории) существуют числа , такие, что

    (6)

Центральным в теореме является условие максимума – (4).

Если отказаться от предположения о том, что конечный момент времени T фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (6) необходимо заменить условием

 

и добавить еще одно условие трансверсальности на правом конце траектории:

.


Примеры задач оптимального управления
 

Приведем некоторые задачи оптимального управления, которые, благодаря их типичности, часто встречаются во многих учебниках по теории оптимальных процессов. Эти задачи относятся к различным областям человеческой деятельности: технике, экономике, экологии и др. Но в то же время они являются "учебными" и служат, в основном, для иллюстрации некоторых теоретических положений. Очевидно, задачи и модели, представляющие непосредственный практический интерес, должны быть более подробными, глубокими и сложными. Учебные задачи - это первое приближение к реальным практическим задачам, их упрощенный аналог.

Максимизация дальности полета аппарата в атмосфере. Рассматривается летательный аппарат, положение которого описывается следующими параметрами: дальность и высота полета, величина и угол наклона к горизонту вектора скорости. Роль управлений играют угол атаки и функция, отвечающая возможности изменять в полете геометрию крыльев (т.е. их эффективную площадь). Требуется найти такие управляющие функции, которые доставляют максимум дальности полета.

Задача ракетодинамики в однородном поле (задача об оптимальном в смысле расхода топлива движении ракеты в пустоте). Рассматривается управляемый ракетный аппарат, состояние которого задается координатами в трехмерном пространстве, вектором скорости и значением массы. Управление осуществляется выбором направления и абсолютного значения тяги ракеты. Требуется так управлять ракетой, чтобы в фиксированный момент времени она достигла заданной точки, имея определенную скорость и израсходовав минимум топлива (т.е. имея максимально возможную массу).

Задача о максимальной высоте подъема вертикально взлетающей в атмосфере ракеты-зонда. Состояние ракеты задается значениями высоты, скорости и массы. Задача состоит в выборе тяги, которая максимизировала бы высоту подъема при свободной продолжительности полета.

Задача об оптимизации мясозаготовок. На ферме имеется стадо скота. Ежегодно часть стада отправляется на мясозаготовки, причем доход фермы зависит от количества проданного скота. Фазовой переменной выступает количество скота на ферме в конце каждого года после мясозаготовок, управляющим параметром - количество проданного на мясо скота. Требуется определить, каким образом ферма может получить максимальный доход за несколько лет при определенном минимуме ежегодных мясозаготовок и заданном значении поголовья скота на конец планового периода.

Оптимальное распределение ресурсов. Некоторая заданная начальная сумма денег затрачивается на приобретение оборудования двух типов А и В. С помощью этого оборудования организуется производство. Распределяя имеющиеся средства между различными типами оборудования, к концу срока эксплуатации получают определенный экономический эффект. Затем амортизированное оборудование реализуют, а вырученные средства используют как начальную сумму для следующего цикла, и т.д. Требуется найти такую стратегию распределения средств для покупки оборудования типов А и В в каждом цикле, чтобы обеспечить наибольший экономический эффект после фиксированного числа производственно-экономических циклов.

Распределение температуры в тонком стержне конечной длины с теплоизолированными концами. Состояние объекта описывается функцией распределения температуры по длине стержня и во времени, роль управления играет плотность тепловых источников. Задача состоит в отыскании такого управления, для которого распределение температуры как можно быстрее достигает заданного состояния.

Демпфирование колебаний спутника на круговой орбите. Для ориентации вытянутых спутников вдоль вертикали часто используется эффект собственной устойчивости, обусловленный слабым градиентом поля тяготения. Этот эффект приводит к колебаниям при отклонении от положения равновесия, которые требуется погасить с наименьшими затратами топлива, если демпфирование производится с помощью ракетного двигателя. В качестве фазовых переменных берутся угол и скорость отклонения оси спутника относительно текущего радиуса-вектора центра масс на орбите, управлением является тяга реактивного двигателя.

Задача об оптимальном управлении возрастной структурой популяции. Рассматривается непрерывная модель возрастной структуры популяции, разделенной на две возрастные группы. Управление заключается в том, что в обеих группах может происходить "пополнение-изъятие", а целью управления является максимизация дохода от урожая, за вычетом издержек на пополнение. Фазовыми переменными здесь, очевидно, являются численности популяций, а саму модель можно трактовать, например, как процесс эксплуатации некоторого водоема посредством выпуска мальков и отлова взрослых экземпляров рыбы.

Задача оптимального распределения капитальных вложений в отрасли на заданном интервале планирования. Состояние отрасли описывается величиной основных производственных фондов, количество которых растет за счет капитальных вложений и уменьшается за счет физического и морального износа. Капитальные вложения в отрасль играют роль управлений, а критерий оптимальности процессов одновременно учитывает экономию капиталовложений, с одной стороны, и увеличение основных производственных фондов отрасли - с другой. Эту задачу можно обобщить на случай нескольких отраслей. Тогда распределение капитальных вложений нужно осуществить не только во времени, но и между отраслями, которые являются "конкурентами".


 

А также другие работы, которые могут Вас заинтересовать

43553. Проект Внутрігосподарського землеустрою СВК „Надія” 236.5 KB
  Ружинський район входить до складу лісостепової зони України, яка характеризується достатньою кількістю опадів, помірною зимою, досить теплим літом. Переважаючі вітри: влітку – південно західні, взимку – східні та південно-східні.
43554. Тепловой расчет конвективной туннельной сушильной установки 3.04 MB
  Выполнить тепловой расчет конвективной туннельной сушильной установки, определить длительность сушки, размеры установки, выбрать вентилятор для подачи наружного воздуха, дымосос и циклон, на основании следующих данных.
43555. Модуль 2ННК-М 402 KB
  Для проведення ГК в свердловину опускають детектор γ-опромінення і електронну схему, яка перетворює зареєстровані γ-кванти в імпульси напруги. В інших типах РК вимірюється штучна радіоактивність,створена в породах джерелом гамма (ГГК) або нейтронного стаціонарного (ННК-НТ), ННК-Т, НГК і імпульсного (ІННК,ІНГК) випромінювання.
43556. Створення приймача амплітудно-модульованих сигналів 4.37 MB
  Вибір та розрахунок вибіркових систем тракту проміжної частоти Склад комплекту: пристрій має самостійне призначення може працювати з підсилювачем звукової частоти;Допоміжне обладнання: блок живлення від мережі змінного струму 220В 50Гц; стандартні зєднання з підсилювачем звукової частоти. Необхідну вибірність по сусідньому каналу отримують в каскаді перетворювача частоти за допомогою або фільтрів зосередженої селекції або пєзоелектричних фільтрів а вибірність по дзеркальному каналу забезпечується вхідним колом.
43557. Проектирование базы данных для Excel и Access 107 KB
  Для Excel: подготовить таблицу и заполнить ее данными с использованием стандартной формы по тематике задания не менее 10 строк в таблице; описать и выполнить в режиме вычислений функции информационной технологии необходимые вычисления фильтрацию данных сортировку данных подведение итогов; разработать схемы алгоритмов реализующих функции информационной технологии и составить соответствующие им коды приложений на языке программирования VB. Для ccess: разработать связанные таблицы; создать...
43558. РАСЧЕТ КАМЕРЫ ПРЕДВАРИТЕЛЬНОГО ОХЛАЖДЕНИЯ УСТАНОВКИ ПРОИЗВОДСТВА ПИГМЕНТНОГО ДИОКСИДА ТИТАНА 244.5 KB
  Техническую двуокись титана получают методом высокотемпературного парофазного гидролиза из очищенного тетрахлорида титана. Полученный диоксид титана охлаждается проходя через камеру предварительного охлаждения трубную камеру циклон и осаждается в бункерах этих аппаратов. Из...
43559. Детали машин. Проектирование привода к конвейеру по схем 413 KB
  Выбор эл. двигателя и кинематический расчет. Расчет ременной передачи. Расчет редуктора. Расчет валов. Расчет элементов корпуса редуктора. Расчет шпоночных соединений. Расчет подшипников. Выбор смазки. Спецификация на редуктор.
43560. Расчет динамических и топливо экономических характеристик автомобиля УАЗ-469 716.5 KB
  Исходные данные курсовой работы Расчет динамических и топливо экономических характеристик автомобиля УАЗ469 Номер варианта 02 Марка автомобиля УАЗ469 Колесная формула 4Х4 Тип двигателя : четырехтактный карбюраторный Дорожные условия эксплуатации автомобиля коэффициент сопротивления качения fk = 006; угол подъема α=20 Технические характеристика автомобиля. № п п Наименование параметра Обозначение Единица измерения Значение параметров 1 Полный вес: на переднюю ось на заднюю ось G G1 G2 кН кН кН 2450 1020 1430 2...
43561. ТЕОРИЯ ТЕЛЕТРАФИКА 2.49 MB
  Постановка задачи Задание на курсовую работу Разработка обобщенной функциональной схемы ЦОВ Определение характеристик ЦОВ Разработка алгоритмов обработки вызовов поступающих на ЦОВ Разработка структурной схемы ЦОВ Разработка сценариев взаимодействия ЦОВ с сетями общего пользования 15 8 Список сокращений и обозначений Список литературы Введение Целью настоящей курсовой работы является получение знаний о принципах функционирования современных центров обслуживания...