9890

Принцип максимума Понтрягина

Реферат

Математика и математический анализ

Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах. Формулировка принципа максимума. Рассмотрим...

Русский

2013-03-18

177 KB

103 чел.

Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

 

        (2.1)

 

где              (2.2)

При этом предполагается, что моменты фиксированы, т.е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

,

где - константа,

Функция H называется функцией Гамильтона.

Система линейных дифференциальных уравнений  относительно переменных называется сопряженной системой, соответствующей управлению u и траектории x. Здесь

 

В более подробной покоординатной записи сопряженная система принимает вид

    (2.3)

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, имеют частные производные по переменным и непрерывны вместе с этими производными по совокупности аргументов . Предположим, что (u,x) – решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению u и траектории x, и константа  такие, что

при , и выполняются следующие условия:

a) (условие максимума) при каждом  функция Гамильтона ,

достигает максимума по  при v=u(t), т.е.

    (2.4)

б) (условие трансверсальности на левом конце траектории) существуют числа , такие, что

       (2.5)

в) (условие трансверсальности на правом конце траектории) существуют числа , такие, что

     (2.6)

Центральным в теореме является условие максимума – (2.4).

Если отказаться от предположения о том, что конечный момент времени T фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) необходимо заменить условием

 

и добавить еще одно условие трансверсальности на правом конце траектории:

 

Пример применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

 

Пусть точка движется по прямой в соответствии с законом

 

Таким образом, оптимальное управление u может принимать лишь два значения +1 или -1.

Условие максимума (2.4) позволяет, в принципе, найти управление u как функцию параметров  

     (2.7)

Рассмотрим систему дифференциальных уравнений

 

       (2.8)

объединяющую систему уравнений движения объекта и сопряженную систему.

Опишем численный метод. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5),(2.6), а также выписанными на основе (2.2) краевыми условиями

    (2.9)

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти . При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр задан и равен либо 0, либо -1).

Значения являются очевидно, некоторыми функциями от a и b:

 

 Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений

 

 

 

 

Эта система содержит 2n+m неизвестных и состоит из 2n+m уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.

 

Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (a,b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов.

При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т.п.

Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно). Конечномерные аналоги задач оптимального управления имеют особенности, позволяющие эффективно применять некоторые методы нелинейного, динамического программирования и т.д. Продемонстрируем пример такого подхода.

Рассмотрим следующую задачу оптимального управления

 

 

   (2.10)

где моменты времени фиксированы. Это задача более общего вида, чем (2.1), ибо в (2.10) U зависит от времени и имеются фазовые ограничения произвольного вида, которые, в частности, могут содержать ограничения на концах траектории вида (2.2)

Зафиксируем моменты времени и заменим задачу (2.10) ее конечноразностным аналогом

 

 

 

 

Положив

 

задачу можно переписать в виде

 

 

 

 

Мы получили задачу математического программирования с переменными

 

 

Задав начальное состояние и управление , по формулам легко вычислить траекторию ( ). Тем самым (2.11) сводится к задаче с переменными , и ее размерность, таким образом, оказывается равной n+Nr.

Для решения задачи (2.11) часто применяют метод динамического программирования. В данном случае этот метод выглядит следующим образом. Введем функцию

 

где минимум берется по таким  что

 

(будем предполагать, что все фигурирующие здесь и ниже минимумы достигаются). Если множество таких наборов пусто, то значение не определено. Нетрудно видеть, что

 

  (2.12)

где минимум берется по таким , что значение определено.

Положив и проводя вычисления по формулам (2.12) при k=N-1,N-2,…0 можно найти решение задачи (2.11).

Действительно, пусть - значение управления, реализующее минимум в (2.12). Ясно, что значение задачи  (2.11), т.е. минимальное значение минимизирующей функции, равно , где минимум берется по таким , что значение определено. Оптимальное управление и оптимальная траектория находятся, очевидно, по формулам

       (2.13)

При численной реализации данного метода сеточные аппроксимации множеств , т.е. некоторые конечные множества

 

Затем строятся множества , которые служат сеточными аппроксимациями интересующих  нас подмножеств (i=0,…,N-1).

Далее по формулам (2.12) вычисляются значения для

и т.д. причем при каждом k минимум в (2.12) берется по . После того как найдена точка минимизирующая решение задачи определяется формулами (2.13).

Отметим, что дискретные задачи оптимального управления встречаются на практике (например, при описании импульсных систем) и потому представляют интерес не только как конечноразностные аналоги непрерывных задач.

Задачи оптимизации управляемых процессов, или как они будут в дальнейшем называться, задачи оптимального управления, составляют один из широких классов экстремальных задач и имеют важное прикладное значение.

Принцип максимума Понтрягина.

 Предложен Л.С. Понтрягиным в 1956 г.

Рассмотрим процесс, описываемый системой ОДУ:

       (*)

x- n-мерный вектор состояния (фазовые координаты)

u – r-мерный вектор управляющих воздействий

f – n-мерная вектор-функция.

Т.к. t не входит в (*) явно, то система автономная.

Любая система может быть сведена к (*), если положить .

Обычно на и накладываются ограничения.

Будем полагать

          (**)

где U-замкнутая ограниченная область не зависящая от x и t.

Управление  называется допустимым. Кроме того  и удовлетворяет уравнению (*).

Примеры ограничений:

1)

2)

3)

Предполагаем также, что непрерывна и имеет непрерывные частные производные по .

Необходимо найти такое  при , чтобы система, двигаясь по траектории в соответствии с (*), обеспечивала минимум некоторого функционала J.

Обычно функционал J есть функция от части фазовых координат в начале и в конце траектории:

        (***)

где  - некоторые составляющие вектора x в начале (t=0) и в конце траектории ( ). В задаче на максимальное быстродействие ; Полагая .

Часть фазовых координат, не вошедших в (***) может быть закреплена

 

 

Рассмотрим для простоты задачу. Задача с конечным интервалом времени, фиксированным левым концом и свободным правым.

     (1)

      (2)

Управление u(t) в силу ограничения (**) следует искать среди кусочно-непрерывных функций. (В вариационном исчислении искомое решение принадлежало классу непрерывных функций).

Пусть - оптимальная траектория и оптимальное управление. - это вектор, координаты которого могут иметь на отрезке разрывы первого рода в конечном числе точек.

  - б.м. величина;  - б.м. отрезок времени.

Дадим управлению вариацию, заменив на б.м. интервале на другое управление u, не меняя вне этого интервала [“Игольчатая вариация”].

При этом приращения при  вовсе не должны быть сколь угодно малой величиной.

Игольчатая вариация относится к классу кусочно-непрерывных функций, среди которых мы ищем оптимальное управление.

Несмотря на конечную величину , влияние этой вариации на последующее движение объекта – бесконечно мало, т.к. влияние любого импульса (короткого) на систему оценивается  величиной его площади (которая – б.м.)

В результате варьирования на б.м. интервале движение системы x начиная с момента отличается от оптимального .

 

Начиная с момента , вариация траектории удовлетворяет некоторому дифференциальному уравнению с начальным условием:

  (3)

Формула (3) следует из разложения величин и в ряд Тейлора

 

с учетом того что = и принимая во внимание уравнение движения (2).

Согласно (2) приращение на интервале является решением уравнения

     (4)

с начальным условием (3), имеющим порядок малости .

Т.к. решения дифференциальных уравнений непрерывно зависят от начальных условий, то .      (5)

Поэтому в (4) правую часть можно линеаризовать, разлогая в ряд Тейлора и отбрасывая члены порядка и выше.

     (6)

Т.к. , то первая компонента вектора в точке есть вариация функции

, причем     (7)

в силу оптимальности траектории .

Введем функцию , удовлетворяющую условию

      (8)

Уравнение следует из условия (8) постоянства скалярного произведения для каждого

    (9)

С учетом (6) (при )

     (10)

Из условия произвольности

    (11)

Из (7)-(8) следуют граничные условия:

        (12)

Решая (11) при условии (12), получаем и тогда условия (7)-(8) приобретают вид:

     (13)

вместо подставляем его значение (3), выраженное через правую часть уравнения (2) и получаем неравенство

    (14)

Функция называются функцией Гамильтона.

Из (14) следует, что на оптимальной траектории функция Гамильтона достигает своего максимума.

Момент начальной вариации был выбран произвольно на , следовательно это верно для всего интервала.

  (16)

Принцип максимума Понтрягина.

Принцип максимума является необходимым условием оптимальности.

Для некоторых классов задач он является и достаточным, но это требует доказательства в каждом конкретном случае.

Введение Гамильтониана H позволяет упростить запись основного уравнения (2) и сопряженного (11)

 

        (17)

Вместе с краевыми условиями эта система представляет собой двухточечную нелинейную краевую задачу. Входящие в (17) управление выражается через и из условий оптимальности (16).


 

А также другие работы, которые могут Вас заинтересовать

28778. Эволюция древнерусской государственности в XI-XII вв. Международные связи древнерусских земель 25.18 KB
  Международные связи древнерусских земель. Ее причинами были: раздел территории на уделы между наследниками различных ветвей Дома Рюриковичей происходил в результате действовавшего принципа по старшинству к старшему в роду; постоянные княжеские усобицы в основе которых часто лежали политические амбиции тех или иных конкретных лиц не согласных с лествичным правом; рост крупного землевладения укреплявший чувство уверенности в своих силах у крупных владетелей обладавших значительными материальными ресурсами; натуральный характер...
28779. Борьба народов Руси с иноземными захватчиками в XII в. 66.86 KB
  Борьба народов Руси с иноземными захватчиками в XII в. XIII век в истории Руси это время вооруженного противостояния натиску с востока монголотатары и северозапада немцы шведы датчане. Встают два важных вопроса: почему русские княжества проявив героизм и мужество не смогли дать отпор завоевателям Какие последствия имело для Руси иго Ответ на первый вопрос очевиден: конечно имело значение военное превосходство монголотатар жесткая дисциплина отличная конница прекрасно налаженная разведка и др. Другие подчеркивают...
28780. Держава Чингисхана и монгольские завоевания. Иго и дискуссия о его роли в становлении Русского государства 29.73 KB
  Влияние монголотатарского ига на развитие русских земель. Упомянув кратко о зависимости русских князей от ханских ярлыков и сбора налогов Соловьев отмечал что нет причины признавать значительное влияние монголов на русскую внутреннею администрацию поскольку мы не видим никаких его следов. произошло не благодаря а вопреки Орде с точки зрения на монгольское иго в современной исторической науке: Традиционная история рассматривает его как бедствие для русских земель. Нашествие кочевников сопровождались массовыми разрушениями русских городов...
28781. Начало самодержавия в России. Внутренняя и внешняя политика Ивана IV. Альтернативы развития страны: «Избранная Рада » и опричнина 17.93 KB
  Внутренняя и внешняя политика Ивана IV. Царствование Ивана Грозного принято условно делить на две части сильно отличающиеся друг от друга по внутренней политике. Это знаменовало формирование на Руси нового типа традиционного общества сословнопредставительной монархии Постоянным же совещательным органом при царе служила еще со времен Ивана III Боярская дума состоявшая из бояр. Первый Земский собор орган сословного представительства обеспечивающий связь центра и мест речь Ивана IV с лобного места: осуждение неправильного боярского...
28782. Смута: социальная катастрофа или время альтернатив? Причины и последствия смутного времени. Начало династии Романовых 18.58 KB
  Смутное время началось после смерти Федора Ивановича последнего царя из рода Рюрика 6 января 1598 г. Русская армия в это время готовилась выйти на помощь Смоленску который с сентября 1609 года был осаждён войсками польского короля Сигизмунда III. Поляки и запорожцы овладели городами северской земли; население Стародуба и Почепа полностью погибло во время вражеского штурма; Чернигов и НовгородСеверский сдались.
28783. Понятие модернизации, ее виды и циклы. Особенности петровской модернизации 14.86 KB
  Первым этапом такой модернизации в России стали реформы Петра I Великого Основными предпосылками реформ были: 1 тупик развития 2 необходимость выхода к морям для развития экономики. Именно с этой даты ведется отсчет истории России как великой державы. Превращение России в великую и морскую державу символизировало принятие Петром Великим наследственного императорского титула.
28784. Реформы Петра I. Каково соотношение модернизационных и традиционных начал в политике Петра 13.47 KB
  Каково соотношение модернизационных и традиционных начал в политике Петра Модернизация в России догоняющая.
28785. В чем заключалась политика «Просвещенного абсолютизма» Екатерины II 21.04 KB
  Таким образом Екатерина стремилась достигнуть союза между монархом и обществом не на принуждении абсолютизм а на добровольном осознании своих прав и обязанностей. Екатерина поощряла развитие образования и науки торговопромышленной деятельности способствовала зарождению журналистики. В идеях просвещенного абсолютизма Екатерина руководствовалась трудами французских просветителей Вольтер Дидро.
28786. Выделите основные тенденции и противоречия развития российского государства и общества в первой половине 19в. 14.04 KB
  Главными особенностями развития России в 1й половине XIX века были: 1 рост удельного веса бюрократии гражданской военной и полицейской; 2 замедление экономического развития по сравнению с Европой как следствие тупикового пути крепостного права; 3 противоречие между экономической и политической отсталостью с одной стороны и мощным расцветом культуры и науки с другой 4 начало идейного и духовного разрыва между монархией и формирующейся интеллигенцией.