9890
Принцип максимума Понтрягина
Реферат
Математика и математический анализ
Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах. Формулировка принципа максимума. Рассмотрим...
Русский
2013-03-18
177 KB
113 чел.
Принцип максимума Понтрягина.
Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.
Формулировка принципа максимума.
Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше
(2.1)
где (2.2)
При этом предполагается, что моменты фиксированы, т.е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим
,
где - константа,
Функция H называется функцией Гамильтона.
Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой, соответствующей управлению u и траектории x. Здесь
В более подробной покоординатной записи сопряженная система принимает вид
(2.3)
Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .
Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).
Теорема (принцип максимума Понтрягина).
Пусть функции и, имеют частные производные по переменным и непрерывны вместе с этими производными по совокупности аргументов . Предположим, что (u,x) решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению u и траектории x, и константа такие, что
при , и выполняются следующие условия:
a) (условие максимума) при каждом функция Гамильтона ,
достигает максимума по при v=u(t), т.е.
(2.4)
б) (условие трансверсальности на левом конце траектории) существуют числа , такие, что
(2.5)
в) (условие трансверсальности на правом конце траектории) существуют числа , такие, что
(2.6)
Центральным в теореме является условие максимума (2.4).
Если отказаться от предположения о том, что конечный момент времени T фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) необходимо заменить условием
и добавить еще одно условие трансверсальности на правом конце траектории:
Пример применения принципа максимума.
1. Простейшая задача оптимального быстродействия.
Пусть точка движется по прямой в соответствии с законом
Таким образом, оптимальное управление u может принимать лишь два значения +1 или -1.
Условие максимума (2.4) позволяет, в принципе, найти управление u как функцию параметров
(2.7)
Рассмотрим систему дифференциальных уравнений
(2.8)
объединяющую систему уравнений движения объекта и сопряженную систему.
Опишем численный метод. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5),(2.6), а также выписанными на основе (2.2) краевыми условиями
(2.9)
Эта задача называется краевой задачей принципа максимума.
Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти . При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр задан и равен либо 0, либо -1).
Значения являются очевидно, некоторыми функциями от a и b:
Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений
Эта система содержит 2n+m неизвестных и состоит из 2n+m уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.
Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (a,b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов.
При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т.п.
Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно). Конечномерные аналоги задач оптимального управления имеют особенности, позволяющие эффективно применять некоторые методы нелинейного, динамического программирования и т.д. Продемонстрируем пример такого подхода.
Рассмотрим следующую задачу оптимального управления
(2.10)
где моменты времени фиксированы. Это задача более общего вида, чем (2.1), ибо в (2.10) U зависит от времени и имеются фазовые ограничения произвольного вида, которые, в частности, могут содержать ограничения на концах траектории вида (2.2)
Зафиксируем моменты времени и заменим задачу (2.10) ее конечноразностным аналогом
Положив
задачу можно переписать в виде
Мы получили задачу математического программирования с переменными
Задав начальное состояние и управление , по формулам легко вычислить траекторию ( ). Тем самым (2.11) сводится к задаче с переменными , и ее размерность, таким образом, оказывается равной n+Nr.
Для решения задачи (2.11) часто применяют метод динамического программирования. В данном случае этот метод выглядит следующим образом. Введем функцию
где минимум берется по таким что
(будем предполагать, что все фигурирующие здесь и ниже минимумы достигаются). Если множество таких наборов пусто, то значение не определено. Нетрудно видеть, что
(2.12)
где минимум берется по таким , что значение определено.
Положив и проводя вычисления по формулам (2.12) при k=N-1,N-2,…0 можно найти решение задачи (2.11).
Действительно, пусть - значение управления, реализующее минимум в (2.12). Ясно, что значение задачи (2.11), т.е. минимальное значение минимизирующей функции, равно , где минимум берется по таким , что значение определено. Оптимальное управление и оптимальная траектория находятся, очевидно, по формулам
(2.13)
При численной реализации данного метода сеточные аппроксимации множеств , т.е. некоторые конечные множества
Затем строятся множества , которые служат сеточными аппроксимациями интересующих нас подмножеств (i=0,…,N-1).
Далее по формулам (2.12) вычисляются значения для
и т.д. причем при каждом k минимум в (2.12) берется по . После того как найдена точка минимизирующая решение задачи определяется формулами (2.13).
Отметим, что дискретные задачи оптимального управления встречаются на практике (например, при описании импульсных систем) и потому представляют интерес не только как конечноразностные аналоги непрерывных задач.
Задачи оптимизации управляемых процессов, или как они будут в дальнейшем называться, задачи оптимального управления, составляют один из широких классов экстремальных задач и имеют важное прикладное значение.
Принцип максимума Понтрягина.
Предложен Л.С. Понтрягиным в 1956 г.
Рассмотрим процесс, описываемый системой ОДУ:
(*)
x- n-мерный вектор состояния (фазовые координаты)
u r-мерный вектор управляющих воздействий
f n-мерная вектор-функция.
Т.к. t не входит в (*) явно, то система автономная.
Любая система может быть сведена к (*), если положить .
Обычно на и накладываются ограничения.
Будем полагать
(**)
где U-замкнутая ограниченная область не зависящая от x и t.
Управление называется допустимым. Кроме того и удовлетворяет уравнению (*).
Примеры ограничений:
1)
2)
3)
Предполагаем также, что непрерывна и имеет непрерывные частные производные по .
Необходимо найти такое при , чтобы система, двигаясь по траектории в соответствии с (*), обеспечивала минимум некоторого функционала J.
Обычно функционал J есть функция от части фазовых координат в начале и в конце траектории:
(***)
где - некоторые составляющие вектора x в начале (t=0) и в конце траектории ( ). В задаче на максимальное быстродействие ; Полагая .
Часть фазовых координат, не вошедших в (***) может быть закреплена
Рассмотрим для простоты задачу. Задача с конечным интервалом времени, фиксированным левым концом и свободным правым.
(1)
(2)
Управление u(t) в силу ограничения (**) следует искать среди кусочно-непрерывных функций. (В вариационном исчислении искомое решение принадлежало классу непрерывных функций).
Пусть - оптимальная траектория и оптимальное управление. - это вектор, координаты которого могут иметь на отрезке разрывы первого рода в конечном числе точек.
- б.м. величина; - б.м. отрезок времени.
Дадим управлению вариацию, заменив на б.м. интервале на другое управление u, не меняя вне этого интервала [“Игольчатая вариация”].
При этом приращения при вовсе не должны быть сколь угодно малой величиной.
Игольчатая вариация относится к классу кусочно-непрерывных функций, среди которых мы ищем оптимальное управление.
Несмотря на конечную величину , влияние этой вариации на последующее движение объекта бесконечно мало, т.к. влияние любого импульса (короткого) на систему оценивается величиной его площади (которая б.м.)
В результате варьирования на б.м. интервале движение системы x начиная с момента отличается от оптимального .
Начиная с момента , вариация траектории удовлетворяет некоторому дифференциальному уравнению с начальным условием:
(3)
Формула (3) следует из разложения величин и в ряд Тейлора
с учетом того что = и принимая во внимание уравнение движения (2).
Согласно (2) приращение на интервале является решением уравнения
(4)
с начальным условием (3), имеющим порядок малости .
Т.к. решения дифференциальных уравнений непрерывно зависят от начальных условий, то . (5)
Поэтому в (4) правую часть можно линеаризовать, разлогая в ряд Тейлора и отбрасывая члены порядка и выше.
(6)
Т.к. , то первая компонента вектора в точке есть вариация функции
, причем (7)
в силу оптимальности траектории .
Введем функцию , удовлетворяющую условию
(8)
Уравнение следует из условия (8) постоянства скалярного произведения для каждого
(9)
С учетом (6) (при )
(10)
Из условия произвольности
(11)
Из (7)-(8) следуют граничные условия:
(12)
Решая (11) при условии (12), получаем и тогда условия (7)-(8) приобретают вид:
(13)
вместо подставляем его значение (3), выраженное через правую часть уравнения (2) и получаем неравенство
(14)
Функция называются функцией Гамильтона.
Из (14) следует, что на оптимальной траектории функция Гамильтона достигает своего максимума.
Момент начальной вариации был выбран произвольно на , следовательно это верно для всего интервала.
(16)
Принцип максимума Понтрягина.
Принцип максимума является необходимым условием оптимальности.
Для некоторых классов задач он является и достаточным, но это требует доказательства в каждом конкретном случае.
Введение Гамильтониана H позволяет упростить запись основного уравнения (2) и сопряженного (11)
(17)
Вместе с краевыми условиями эта система представляет собой двухточечную нелинейную краевую задачу. Входящие в (17) управление выражается через и из условий оптимальности (16).
А также другие работы, которые могут Вас заинтересовать | |||
11037. | Работа в сети с централизованным управлением | 32.5 KB | |
Практическая работа Работа в сети с централизованным управлением Цель работы. Освоить приемы работы рядового пользователя в существующей сети Microsoft при наличии домена безопасности. Исходная ситуация. Для работы используются виртуальные машины Win9x и Win2k изнача | |||
11038. | Сетевое оборудование. Семейство технологий Ethernet (стандарт 802.3) | 84.5 KB | |
Сетевое оборудование В данном разделе рассматриваются работа физического и канального уровней модели ОСИ сетевых интерфейсов и линий связи. На канальном уровне сетевое оборудование реализует тот или иной метод доступа. Таким образом например Ethernet является как метод | |||
11039. | Сетевое оборудование стандарта Ethernet | 2.38 MB | |
Сетевое оборудование Выполняет функциинижних уровней OSI т.е. физического и канального. Все сетевое оборудование условно можно поделить на две группы: 1.Для построения локальных сетей 2.Для построения глобальных сетей Сетевое оборудование стандарта Ethernet. Ethe... | |||
11040. | Сетевые протоколы. Протокол TCP/IP | 45 KB | |
Сетевые протоколы. В данной теме рассматриваются протоколы сетевого и транспортного уровней модели OSI. На сетевом уровне требуется настроить адреса после чего узлы сети начинают видеть получать отклик друг друга. Транспортный уровень занимается коррекцией ошибо | |||
11041. | Аппараты распределительных устройств низкого и высокого напряжения | 184 KB | |
Переключатель – в отличии от рубильника имеет 2 системы неподвижных контактов и 3 коммутационных положения. В среднем положении контакты переключателю разомкнуты. В каждом положении происходит фиксация контактов. | |||
11042. | Мехатроника. Основные термины и определения | 1.26 MB | |
Введение. Основные термины и определения. Мехатроника это новое направление современной науки и техники которое стремительно развивается в последнее десятилетие во всем мире. Если наступивший век считается веком информатизации то для всех машин в самых различных сф | |||
11043. | Этапы развития мехатроники. Классификация мехатронных объектов | 599.5 KB | |
Этапы развития мехатроники. Классификация мехатронных объектов. Мехатроника является молодой областью науки и техники которая выделилась в самостоятельное направление совсем недавно. Об этом можно судить например по возрасту специальных периодических изданий: так ... | |||
11044. | Структура и принципы интеграции мехатронных модулей и машин | 770 KB | |
Структура и принципы интеграции мехатронных модулей и машин Структура мехатронных модулей Мехатронные модули по составу объединяемых устройств и элементов можно подразделить на три группы рис.3.1: модули движения; мехатронные модули движения; интеллек | |||
11045. | Мехатронные системы в машиностроительных технологиях | 794.5 KB | |
Мехатронные системы в машиностроительных технологиях. Автоматизация технологических процессов в производственной сфере проходит путем широкого внедрения мехатронных объектов. Аппаратурные вычислительные и программные возможности в настоящее время позволяют созд... | |||