9890

Принцип максимума Понтрягина

Реферат

Математика и математический анализ

Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах. Формулировка принципа максимума. Рассмотрим...

Русский

2013-03-18

177 KB

103 чел.

Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

 

        (2.1)

 

где              (2.2)

При этом предполагается, что моменты фиксированы, т.е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

,

где - константа,

Функция H называется функцией Гамильтона.

Система линейных дифференциальных уравнений  относительно переменных называется сопряженной системой, соответствующей управлению u и траектории x. Здесь

 

В более подробной покоординатной записи сопряженная система принимает вид

    (2.3)

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, имеют частные производные по переменным и непрерывны вместе с этими производными по совокупности аргументов . Предположим, что (u,x) – решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению u и траектории x, и константа  такие, что

при , и выполняются следующие условия:

a) (условие максимума) при каждом  функция Гамильтона ,

достигает максимума по  при v=u(t), т.е.

    (2.4)

б) (условие трансверсальности на левом конце траектории) существуют числа , такие, что

       (2.5)

в) (условие трансверсальности на правом конце траектории) существуют числа , такие, что

     (2.6)

Центральным в теореме является условие максимума – (2.4).

Если отказаться от предположения о том, что конечный момент времени T фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) необходимо заменить условием

 

и добавить еще одно условие трансверсальности на правом конце траектории:

 

Пример применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

 

Пусть точка движется по прямой в соответствии с законом

 

Таким образом, оптимальное управление u может принимать лишь два значения +1 или -1.

Условие максимума (2.4) позволяет, в принципе, найти управление u как функцию параметров  

     (2.7)

Рассмотрим систему дифференциальных уравнений

 

       (2.8)

объединяющую систему уравнений движения объекта и сопряженную систему.

Опишем численный метод. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5),(2.6), а также выписанными на основе (2.2) краевыми условиями

    (2.9)

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти . При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр задан и равен либо 0, либо -1).

Значения являются очевидно, некоторыми функциями от a и b:

 

 Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений

 

 

 

 

Эта система содержит 2n+m неизвестных и состоит из 2n+m уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.

 

Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (a,b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов.

При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т.п.

Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно). Конечномерные аналоги задач оптимального управления имеют особенности, позволяющие эффективно применять некоторые методы нелинейного, динамического программирования и т.д. Продемонстрируем пример такого подхода.

Рассмотрим следующую задачу оптимального управления

 

 

   (2.10)

где моменты времени фиксированы. Это задача более общего вида, чем (2.1), ибо в (2.10) U зависит от времени и имеются фазовые ограничения произвольного вида, которые, в частности, могут содержать ограничения на концах траектории вида (2.2)

Зафиксируем моменты времени и заменим задачу (2.10) ее конечноразностным аналогом

 

 

 

 

Положив

 

задачу можно переписать в виде

 

 

 

 

Мы получили задачу математического программирования с переменными

 

 

Задав начальное состояние и управление , по формулам легко вычислить траекторию ( ). Тем самым (2.11) сводится к задаче с переменными , и ее размерность, таким образом, оказывается равной n+Nr.

Для решения задачи (2.11) часто применяют метод динамического программирования. В данном случае этот метод выглядит следующим образом. Введем функцию

 

где минимум берется по таким  что

 

(будем предполагать, что все фигурирующие здесь и ниже минимумы достигаются). Если множество таких наборов пусто, то значение не определено. Нетрудно видеть, что

 

  (2.12)

где минимум берется по таким , что значение определено.

Положив и проводя вычисления по формулам (2.12) при k=N-1,N-2,…0 можно найти решение задачи (2.11).

Действительно, пусть - значение управления, реализующее минимум в (2.12). Ясно, что значение задачи  (2.11), т.е. минимальное значение минимизирующей функции, равно , где минимум берется по таким , что значение определено. Оптимальное управление и оптимальная траектория находятся, очевидно, по формулам

       (2.13)

При численной реализации данного метода сеточные аппроксимации множеств , т.е. некоторые конечные множества

 

Затем строятся множества , которые служат сеточными аппроксимациями интересующих  нас подмножеств (i=0,…,N-1).

Далее по формулам (2.12) вычисляются значения для

и т.д. причем при каждом k минимум в (2.12) берется по . После того как найдена точка минимизирующая решение задачи определяется формулами (2.13).

Отметим, что дискретные задачи оптимального управления встречаются на практике (например, при описании импульсных систем) и потому представляют интерес не только как конечноразностные аналоги непрерывных задач.

Задачи оптимизации управляемых процессов, или как они будут в дальнейшем называться, задачи оптимального управления, составляют один из широких классов экстремальных задач и имеют важное прикладное значение.

Принцип максимума Понтрягина.

 Предложен Л.С. Понтрягиным в 1956 г.

Рассмотрим процесс, описываемый системой ОДУ:

       (*)

x- n-мерный вектор состояния (фазовые координаты)

u – r-мерный вектор управляющих воздействий

f – n-мерная вектор-функция.

Т.к. t не входит в (*) явно, то система автономная.

Любая система может быть сведена к (*), если положить .

Обычно на и накладываются ограничения.

Будем полагать

          (**)

где U-замкнутая ограниченная область не зависящая от x и t.

Управление  называется допустимым. Кроме того  и удовлетворяет уравнению (*).

Примеры ограничений:

1)

2)

3)

Предполагаем также, что непрерывна и имеет непрерывные частные производные по .

Необходимо найти такое  при , чтобы система, двигаясь по траектории в соответствии с (*), обеспечивала минимум некоторого функционала J.

Обычно функционал J есть функция от части фазовых координат в начале и в конце траектории:

        (***)

где  - некоторые составляющие вектора x в начале (t=0) и в конце траектории ( ). В задаче на максимальное быстродействие ; Полагая .

Часть фазовых координат, не вошедших в (***) может быть закреплена

 

 

Рассмотрим для простоты задачу. Задача с конечным интервалом времени, фиксированным левым концом и свободным правым.

     (1)

      (2)

Управление u(t) в силу ограничения (**) следует искать среди кусочно-непрерывных функций. (В вариационном исчислении искомое решение принадлежало классу непрерывных функций).

Пусть - оптимальная траектория и оптимальное управление. - это вектор, координаты которого могут иметь на отрезке разрывы первого рода в конечном числе точек.

  - б.м. величина;  - б.м. отрезок времени.

Дадим управлению вариацию, заменив на б.м. интервале на другое управление u, не меняя вне этого интервала [“Игольчатая вариация”].

При этом приращения при  вовсе не должны быть сколь угодно малой величиной.

Игольчатая вариация относится к классу кусочно-непрерывных функций, среди которых мы ищем оптимальное управление.

Несмотря на конечную величину , влияние этой вариации на последующее движение объекта – бесконечно мало, т.к. влияние любого импульса (короткого) на систему оценивается  величиной его площади (которая – б.м.)

В результате варьирования на б.м. интервале движение системы x начиная с момента отличается от оптимального .

 

Начиная с момента , вариация траектории удовлетворяет некоторому дифференциальному уравнению с начальным условием:

  (3)

Формула (3) следует из разложения величин и в ряд Тейлора

 

с учетом того что = и принимая во внимание уравнение движения (2).

Согласно (2) приращение на интервале является решением уравнения

     (4)

с начальным условием (3), имеющим порядок малости .

Т.к. решения дифференциальных уравнений непрерывно зависят от начальных условий, то .      (5)

Поэтому в (4) правую часть можно линеаризовать, разлогая в ряд Тейлора и отбрасывая члены порядка и выше.

     (6)

Т.к. , то первая компонента вектора в точке есть вариация функции

, причем     (7)

в силу оптимальности траектории .

Введем функцию , удовлетворяющую условию

      (8)

Уравнение следует из условия (8) постоянства скалярного произведения для каждого

    (9)

С учетом (6) (при )

     (10)

Из условия произвольности

    (11)

Из (7)-(8) следуют граничные условия:

        (12)

Решая (11) при условии (12), получаем и тогда условия (7)-(8) приобретают вид:

     (13)

вместо подставляем его значение (3), выраженное через правую часть уравнения (2) и получаем неравенство

    (14)

Функция называются функцией Гамильтона.

Из (14) следует, что на оптимальной траектории функция Гамильтона достигает своего максимума.

Момент начальной вариации был выбран произвольно на , следовательно это верно для всего интервала.

  (16)

Принцип максимума Понтрягина.

Принцип максимума является необходимым условием оптимальности.

Для некоторых классов задач он является и достаточным, но это требует доказательства в каждом конкретном случае.

Введение Гамильтониана H позволяет упростить запись основного уравнения (2) и сопряженного (11)

 

        (17)

Вместе с краевыми условиями эта система представляет собой двухточечную нелинейную краевую задачу. Входящие в (17) управление выражается через и из условий оптимальности (16).


 

А также другие работы, которые могут Вас заинтересовать

47911. Біохімічне обгрунтування методики занять фізичною культурою і спортом з особами різного віку та статі 369 KB
  Перше дитинство 47 років 5. Друге дитинство 812 років хлопчики 811 років дівчинки. Підлітковий пубертатний 1316 років хлопчики вік 1215 років дівчатка. Зрілий вік: I період 2235 років чоловіки 2135 років жінки.
47912. ПОНЯТТЯ ТА ПОТЕНЦІЙНІ ЗАГРОЗИ БЕЗПЕЦІ ПІДПРИЄМНИЦЬКОЇ ДІЯЛЬНОСТІ 1.41 MB
  Провідні українські експерти визнають той факт що багаторівнева економіка потребує також різноманітних видів забезпечення економічної фізичної та інших видів безпеки та організації охорони. Це дає можливість вибору для клієнтів аналізу та порівняння різних форм охоронної діяльності і в кінцевому результаті сприяє в цілому підвищенню рівня безпеки підприємницької діяльності в Україні. В умовах збільшення частки приватного капіталу в економіці України розвитку малого та середнього бізнесу а також роздержавлення стратегічних об'єктів...
47913. Призначення випробувань, впливаючі фактори при експлуатації РЕМА і ЕОЗ 1.59 MB
  Призначення випробувань впливаючі фактори при експлуатації РЕМА і ЕОЗ. Слід виділити три групи завдань вирішуваних проведенням випробувань: здобуття емпіричних даних необхідних для проектування апаратури; встановлення відповідності виробу проектним вимогам; визначення граничного стану ЕА. Цілі випробувань не постійні: вони міняються на різних етапах проектування і виготовлення апаратури. Перерахуємо основні цілі випробувань ЕА : Експериментальне підтвердження теоретичних розрахунків прийнятих допущень і гіпотез заданих показників якості...
47914. Сучасний стан охорони праці в Україні. Мета та завдання дисципліни Основи охорони праці 19.12 MB
  Виявити мету та завдання дисципліни Основи охорони праціâ€œ. Визначити правові та організаційні питання охорони праці. Сучасний стан охорони праці в Україні.
47916. Звітність підприємства. Методичні вказівки 334 KB
  Звіт про рух грошових коштів Тема 5 Звіт про власний капітал Тема 6. Фінансова бухгалтерська звітність документи які містять інформацію про фінансовий стан результати діяльності про рух грошових коштів підприємства за звітний період і тому подібне. № 2 Звіт про рух грошових коштів ф. № 4 представляється за станом на 31 грудня Звіт про рух грошових коштів ф.
47917. СУТЬ І ЗМІСТ МАРКЕТИНГУ 1.29 MB
  За ним маркетинг це: спрямування ділового мислення інтегрована орієнтована на споживача і кінцевий результат діяльність фірми довгостроковий максимальний прибуток від реалізації її продукції філософія ділової активності бізнесу в умовах ринкових відносин і конкуренції; оснований на точному знанні передбаченні та врахуванні вимог ринку і побажань споживачів комплекс науково обгрунтованих уявлень про управління виробничозбутовою діяльністю фірми в умовах ринкових відносин; Більш конкретним є функціональний підхід до розуміння...
47918. Мікроекономіка. Конспект лекцій 1.22 MB
  Особливості споживчого попиту. Попит закон попиту чинники що впливають на попит. Ринкова рівновага цін попиту і пропозиції. Поняття і зміна цінової еластичності попиту.
47919. Кінематика матеріальної точки. Основні поняття і способи задання руху 4.42 MB
  Основні поняття і способи задання руху Теоретичне ядро Вступ в курс класичної механіки. Природничі науки: хімія біологія астрономія географія вивчають різні але конкретні явища та процеси живої і неживої природи а також форми матерії та закони її руху. Таким чином предметом фізики є вивчення найбільш загальних і найпростіших властивостей і форм руху матерії. Проте цим не вичерпуються наші уявлення про типи та форми існування матерії як відомо матерія перебуває у вічному русі що означає: а світ що оточує нас за своєю природою...