32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и –ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

3 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

84362. Страна изучаемого языка и моя страна 54 KB
  Цель урока: Формирование навыков устно-речевого общения речевой деятельности через речевые ситуации связанные со страной изучаемого языка и родной страной. Цель которую ставит учитель: ориентировать учащихся на речевую деятельность создать атмосферу иноязычного общения через речевую ситуацию знакомство...
84363. Материк Австралия, урок 34.42 KB
  Коррекционно образовательные Закрепить понятия: о географическом положении материка Австралии океанах и морях омывающих данный материк. Покажите на карте материк Австралии. Назовите какими океанами омывается Австралия Скажите какие материки расположены ближе к Австралии. Определите где шаблон Австралии.
84364. Текст-повествование. Изложение по рассказу В. Бианки «Купание медвежат» 41 KB
  Цели урока: познакомить со структурой повествовательного текста; обучать учащихся письменной передаче текста; развивать устную и письменную речь учащихся; использовать в речи точный образный язык; развивать эмоциональную сферу детей их чувства эстетический вкус; воспитывать любовь к природе.
84365. Расстояние между двумя точками. Масштаб 26.71 KB
  Цель урока: формирование понятий расстояния между точками масштаб. Метапредметные: а познавательные сформированность познавательных интересов умение работать с различными источниками информации б регулятивные понимание смысла поставленной задачи умение выполнять учебные действия...
84366. Произведения зарубежных писателей о детях. Марк Твен «Приключения Тома Сойера» (отрывки) 75.5 KB
  Цель: продолжить знакомство с отрывками из произведения Марка Твена «Приключения Тома Сойера». Задачи: Познакомить с отрывком из 16 главы романа Марка Твена « Приключения Тома Сойера». Формировать умение читать выборочно и про себя. Формировать умение высказывать собственные суждения и давать им обоснование.
84367. Береги здоровье! 98.5 KB
  Цель: Сформировать у учащихся стойкую мотивацию к здоровому образу жизни. Планируемые результаты: Предметные: учащиеся знакомятся с правилами здорового образа жизни. Личностные УУД: Л1 - Соблюдение основных моральных норм поведения (приветствовать друг друга, прощаться).
84369. Греки и критяне 23.31 KB
  Расположение древнейшей Греции мы увидим на карте Слайд 2 обратите внимание на большой остров который расположен на юге обозначенного пространства прочитайте его название о. Мы будем изучать историю народов населявших эти земли: в Греции жили греки на острове...
84370. Англійська народна казка «Сорочаче гніздо» 48.5 KB
  Анотація: Розробка комбінованого уроку українського читання на заявлену тему у 2 класі, мета якого – розширити знання учнів про життя птахів; учити стежити за логікою описування подій; орієнтуватися у структурі тексту; формувати уміння визначати головну думку та пояснювати...