9890

Принцип максимума Понтрягина

Реферат

Математика и математический анализ

Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах. Формулировка принципа максимума. Рассмотрим...

Русский

2013-03-18

177 KB

124 чел.

Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

 

        (2.1)

 

где              (2.2)

При этом предполагается, что моменты фиксированы, т.е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

,

где - константа,

Функция H называется функцией Гамильтона.

Система линейных дифференциальных уравнений  относительно переменных называется сопряженной системой, соответствующей управлению u и траектории x. Здесь

 

В более подробной покоординатной записи сопряженная система принимает вид

    (2.3)

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, имеют частные производные по переменным и непрерывны вместе с этими производными по совокупности аргументов . Предположим, что (u,x) – решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению u и траектории x, и константа  такие, что

при , и выполняются следующие условия:

a) (условие максимума) при каждом  функция Гамильтона ,

достигает максимума по  при v=u(t), т.е.

    (2.4)

б) (условие трансверсальности на левом конце траектории) существуют числа , такие, что

       (2.5)

в) (условие трансверсальности на правом конце траектории) существуют числа , такие, что

     (2.6)

Центральным в теореме является условие максимума – (2.4).

Если отказаться от предположения о том, что конечный момент времени T фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) необходимо заменить условием

 

и добавить еще одно условие трансверсальности на правом конце траектории:

 

Пример применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

 

Пусть точка движется по прямой в соответствии с законом

 

Таким образом, оптимальное управление u может принимать лишь два значения +1 или -1.

Условие максимума (2.4) позволяет, в принципе, найти управление u как функцию параметров  

     (2.7)

Рассмотрим систему дифференциальных уравнений

 

       (2.8)

объединяющую систему уравнений движения объекта и сопряженную систему.

Опишем численный метод. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5),(2.6), а также выписанными на основе (2.2) краевыми условиями

    (2.9)

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти . При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр задан и равен либо 0, либо -1).

Значения являются очевидно, некоторыми функциями от a и b:

 

 Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений

 

 

 

 

Эта система содержит 2n+m неизвестных и состоит из 2n+m уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.

 

Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (a,b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов.

При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т.п.

Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно). Конечномерные аналоги задач оптимального управления имеют особенности, позволяющие эффективно применять некоторые методы нелинейного, динамического программирования и т.д. Продемонстрируем пример такого подхода.

Рассмотрим следующую задачу оптимального управления

 

 

   (2.10)

где моменты времени фиксированы. Это задача более общего вида, чем (2.1), ибо в (2.10) U зависит от времени и имеются фазовые ограничения произвольного вида, которые, в частности, могут содержать ограничения на концах траектории вида (2.2)

Зафиксируем моменты времени и заменим задачу (2.10) ее конечноразностным аналогом

 

 

 

 

Положив

 

задачу можно переписать в виде

 

 

 

 

Мы получили задачу математического программирования с переменными

 

 

Задав начальное состояние и управление , по формулам легко вычислить траекторию ( ). Тем самым (2.11) сводится к задаче с переменными , и ее размерность, таким образом, оказывается равной n+Nr.

Для решения задачи (2.11) часто применяют метод динамического программирования. В данном случае этот метод выглядит следующим образом. Введем функцию

 

где минимум берется по таким  что

 

(будем предполагать, что все фигурирующие здесь и ниже минимумы достигаются). Если множество таких наборов пусто, то значение не определено. Нетрудно видеть, что

 

  (2.12)

где минимум берется по таким , что значение определено.

Положив и проводя вычисления по формулам (2.12) при k=N-1,N-2,…0 можно найти решение задачи (2.11).

Действительно, пусть - значение управления, реализующее минимум в (2.12). Ясно, что значение задачи  (2.11), т.е. минимальное значение минимизирующей функции, равно , где минимум берется по таким , что значение определено. Оптимальное управление и оптимальная траектория находятся, очевидно, по формулам

       (2.13)

При численной реализации данного метода сеточные аппроксимации множеств , т.е. некоторые конечные множества

 

Затем строятся множества , которые служат сеточными аппроксимациями интересующих  нас подмножеств (i=0,…,N-1).

Далее по формулам (2.12) вычисляются значения для

и т.д. причем при каждом k минимум в (2.12) берется по . После того как найдена точка минимизирующая решение задачи определяется формулами (2.13).

Отметим, что дискретные задачи оптимального управления встречаются на практике (например, при описании импульсных систем) и потому представляют интерес не только как конечноразностные аналоги непрерывных задач.

Задачи оптимизации управляемых процессов, или как они будут в дальнейшем называться, задачи оптимального управления, составляют один из широких классов экстремальных задач и имеют важное прикладное значение.

Принцип максимума Понтрягина.

 Предложен Л.С. Понтрягиным в 1956 г.

Рассмотрим процесс, описываемый системой ОДУ:

       (*)

x- n-мерный вектор состояния (фазовые координаты)

u – r-мерный вектор управляющих воздействий

f – n-мерная вектор-функция.

Т.к. t не входит в (*) явно, то система автономная.

Любая система может быть сведена к (*), если положить .

Обычно на и накладываются ограничения.

Будем полагать

          (**)

где U-замкнутая ограниченная область не зависящая от x и t.

Управление  называется допустимым. Кроме того  и удовлетворяет уравнению (*).

Примеры ограничений:

1)

2)

3)

Предполагаем также, что непрерывна и имеет непрерывные частные производные по .

Необходимо найти такое  при , чтобы система, двигаясь по траектории в соответствии с (*), обеспечивала минимум некоторого функционала J.

Обычно функционал J есть функция от части фазовых координат в начале и в конце траектории:

        (***)

где  - некоторые составляющие вектора x в начале (t=0) и в конце траектории ( ). В задаче на максимальное быстродействие ; Полагая .

Часть фазовых координат, не вошедших в (***) может быть закреплена

 

 

Рассмотрим для простоты задачу. Задача с конечным интервалом времени, фиксированным левым концом и свободным правым.

     (1)

      (2)

Управление u(t) в силу ограничения (**) следует искать среди кусочно-непрерывных функций. (В вариационном исчислении искомое решение принадлежало классу непрерывных функций).

Пусть - оптимальная траектория и оптимальное управление. - это вектор, координаты которого могут иметь на отрезке разрывы первого рода в конечном числе точек.

  - б.м. величина;  - б.м. отрезок времени.

Дадим управлению вариацию, заменив на б.м. интервале на другое управление u, не меняя вне этого интервала [“Игольчатая вариация”].

При этом приращения при  вовсе не должны быть сколь угодно малой величиной.

Игольчатая вариация относится к классу кусочно-непрерывных функций, среди которых мы ищем оптимальное управление.

Несмотря на конечную величину , влияние этой вариации на последующее движение объекта – бесконечно мало, т.к. влияние любого импульса (короткого) на систему оценивается  величиной его площади (которая – б.м.)

В результате варьирования на б.м. интервале движение системы x начиная с момента отличается от оптимального .

 

Начиная с момента , вариация траектории удовлетворяет некоторому дифференциальному уравнению с начальным условием:

  (3)

Формула (3) следует из разложения величин и в ряд Тейлора

 

с учетом того что = и принимая во внимание уравнение движения (2).

Согласно (2) приращение на интервале является решением уравнения

     (4)

с начальным условием (3), имеющим порядок малости .

Т.к. решения дифференциальных уравнений непрерывно зависят от начальных условий, то .      (5)

Поэтому в (4) правую часть можно линеаризовать, разлогая в ряд Тейлора и отбрасывая члены порядка и выше.

     (6)

Т.к. , то первая компонента вектора в точке есть вариация функции

, причем     (7)

в силу оптимальности траектории .

Введем функцию , удовлетворяющую условию

      (8)

Уравнение следует из условия (8) постоянства скалярного произведения для каждого

    (9)

С учетом (6) (при )

     (10)

Из условия произвольности

    (11)

Из (7)-(8) следуют граничные условия:

        (12)

Решая (11) при условии (12), получаем и тогда условия (7)-(8) приобретают вид:

     (13)

вместо подставляем его значение (3), выраженное через правую часть уравнения (2) и получаем неравенство

    (14)

Функция называются функцией Гамильтона.

Из (14) следует, что на оптимальной траектории функция Гамильтона достигает своего максимума.

Момент начальной вариации был выбран произвольно на , следовательно это верно для всего интервала.

  (16)

Принцип максимума Понтрягина.

Принцип максимума является необходимым условием оптимальности.

Для некоторых классов задач он является и достаточным, но это требует доказательства в каждом конкретном случае.

Введение Гамильтониана H позволяет упростить запись основного уравнения (2) и сопряженного (11)

 

        (17)

Вместе с краевыми условиями эта система представляет собой двухточечную нелинейную краевую задачу. Входящие в (17) управление выражается через и из условий оптимальности (16).


 

А также другие работы, которые могут Вас заинтересовать

44118. Модель создания единого информационного пространства образовательного учреждения с применением сетевых информационных технологий 1.25 MB
  Особую роль в данной форме самообразования могут занять социальные сети и социальные сообщества функционирующие в Интернете. Все больше преподавателей осваивают работу в Сети и начинают использовать ее в образовательном процессе. При условии создания в учебном заведении Интернет-системы следующим шагом становится выход на более высокий уровень функционирования информационного пространства Интернет предусматривающий создание и открытие доступа всем непосредственным участникам учебного процесса и внешним посетителям к сайту учебного...
44119. Технологический процесса производства сборной жестяной консервной тары 4.79 MB
  В некоторых случаях можно отказаться от применения пайки продольного шва. Продольный шов можно соединять с помощью клеящего устройства и герметизировать уплотняющими средствами. Благодаря этому становиться возможным изготовление герметичных сборных жестяных банок из неподдающихся пайки исходных материалов.
44120. Разработка способов сжигания твердого топлива ОАО «Экспериментальная ТЭС» 1.73 MB
  Расчет мощности на перекачку воды Расчет деаэратора питательной воды ДПВ до реконструкции на каждый котел установлен один деаэратор. Расчет теплового баланса деаэратора питательной воды ДПВ. Выбор деаэратора питательной воды ДПВ.
44121. Транспортировка грузов 1.01 MB
  Поэтому для обеспечения высоких эксплуатационных характеристик грузоподъемных кранов и их безаварийной работы машинист крана крановщик и обслуживающий персонал должны знать хорошо назначение область применения и устройство кранов их конструктивные особенности технические характеристики устройство и работу крановых механизмов электрооборудования приборов и устройств безопасности. Кроме того машинист крана должен знать правила безопасной эксплуатации кранов их технического обслуживания и ремонта современную прогрессивную технологию и...
44122. МОТИВАЦИИ УЧЕБНОЙ ДЕЯТЕЛЬНОСТИ ПЕРВОКЛАССНИКОВ С ЗАДЕРЖКОЙ ПСИХИЧЕСКОГО РАЗВИТИЯ 588.5 KB
  Мотивационную сферу человека с точки зрения ее развитости можно оценивать по следующим параметрам: широта, гибкость и иерархизированность. Под широтой мотивационной сферы понимается качественное разнообразие мотивационных факторов — диспозиций (мотивов), потребностей и целей, представленных на каждом из уровней.
44123. Формирование и развитие рынка речных круизов в Перми и Пермском крае на примере туристической фирмы ООО «Кубань» 838 KB
  Основные понятия рынка и государственное регулирование сферы туризма в России Переход страны к рыночной экономике сопровождается постепенным созданием конкурентной среды во всех отраслях современного туризма в том числе и в сфере речного круизного туризма. В российской экономической литературе вопросам туризма посвящено немало научных исследований. Таким образом планируется рассмотреть проблемы и сформировать программы развития туризма регионального муниципального уровней в которых предстоит разработать и реализовать комплекс мер...
44124. Проектирование районной понизительной подстанции 356.24 KB
  На данной подстанции по ПУЭ устанавливается 2 трансформатора, это делается из-за того что на ней присутствуют потребители I и II категории. Перерыв в электроснабжение которых для I категории допускается лишь на время автоматического восстановления питания, а для II категории – на время
44125. Оценка стоимости недвижимости. Анализ ипотеки в Барнауле и Алтайском крае 1.09 MB
  Мне было дано провести анализ по оценки объекта недвижимости в городе Барнаулея взял как примержилой дом находящегося по адресу: г. Оценка стоимости недвижимости процесс определения рыночной стоимости объекта или отдельных прав в отношении оцениваемого объекта недвижимости. Оценка стоимости недвижимости включает: определение стоимости права собственности или иных прав например права аренды права пользования и т. в отношении различных объектов недвижимости.
44126. Создание электронного библиотечного каталога 1.79 MB
  На практике это означает выполнение автоматизированной обработки новых поступлений в библиотеку; освобождение сотрудников от ряда рутинных работ по подготовке картотек изданий списков заказов писем отчетной документации; создание базы данных о поступлениях; осуществление операций по созданию и копированию тематических архивов литературы. Благодаря автоматизации с минимальными временными затратами можно выполнять следующие функции: предметный поиск информации по запросам читателей; обслуживание баз данных информационных и периодических...