32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

3 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

69933. Предмет и методы науки истории 41.5 KB
  Предмет и методы науки истории. Методы истории. Важнейшая задача истории обобщение и обработка накопленного человеческого опыта. Ключевский писал: Без знания истории мы должны признать себя случайностями не знающими как и зачем мы пришли в мир как и для чего в нем живем как и к чему...
69934. Предмет и задачи психофизиологии. Принципы психофизиологического исследования 41.5 KB
  Принципы психофизиологического исследования В связи с успехами изучения активности отдельных нейронов мозга животных и в условиях клинического обследования у человека психофизиология стала наукой не только о физиологических но и о нейронных механизмах психических процессов состояний и поведения.
69935. Содержание предпринимательской деятельности в жизни современного общества 233 KB
  Изучить сущность предпринимательской деятельности и ее роль в развитии общества и бизнеса цели предпринимательства условия предпринимательской деятельности. История возникновения и сущность предпринимательства. Виды и формы предпринимательства.
69936. Предмет, система курса «Основы права» 92.5 KB
  Цель лекции: ознакомить студентов с основными юридическими понятиями, основными законами которые были приняты за годы суверенитета. Рассмотреть основные этапы становления науки о правовых отношений.
69937. Введение в теорию менеджмента 141 KB
  Менеджмент сложный непрерывный динамичный и целенаправленный процесс воздействия управляющей системы субъект управления на управляемый объект при помощи различных методов и средств для достижения поставленных целей. Объект управления социально-экономическая система воспринимающая...
69938. Предмет гидроэкологии 70 KB
  Гидробиология гидроэкология наука изучающая биологические процессы происходящие в водных экосистемах взаимодействие гидробионтов со средой их роль в функционировании водных экосистем естественного и искусственного происхождения в процессах трансформации вещества и энергии...
69939. Классификация строительных материалов. Состав, структура и основные свойства строительных материалов 199 KB
  Строительными называются материалы для возведения и ремонта зданий и сооружений. Изучение строительных материалов в вузе предполагает не просто знакомство с названиями и применением материалов. В высшем учебном заведении не должно быть чисто информационных курсов.