32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

3 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

70341. Ергономічність колективного інформаційного простору навчального закладу як фактор ефективності внурішкільного контролю та спосіб зворотного зв’язку в управлінській діяльності 224 KB
  Дотримування ергономічних вимог під час створення комп’ютерної продукції змушує звернути увагу на сутність поняття «ергономіка». Більшість означень поняття стосується діяльністної сфери людини, оптимізації умов її діяльності, ефективності процесу пізнання, створення умов для довготривалого збереження працездатності.
70343. Разработка программного обеспечения (ПО) для системы он-лайн продаж строительных материалов на примере ОАО «Гродненский комбинат строительных материалов» 5.21 MB
  Обзор современных литературных источников, необходимых для дальнейшей работы над проектом, анализ методов решения прикладных задач; систематизация собранного материала для выполнения дипломного проекта; изучение существующего программного обеспечения для проектирования выбранной системы; построение логической модели данных. Определение правил для данных, правил для процессов, а также правил для интерфейса...
70344. Моніторинг якості знань молодших школярів 524.5 KB
  З кожним роком змінюється життя навколо нас змінюються люди а відповідно і змінюються вимоги до якості знань школярів. Адже саме в перші роки навчання закладаються основи всіх знань вміння працювати і самостійно приймати рішення.
70345. Финансовый менеджмент: содержание и механизм функционирования 160.5 KB
  Целью финансового менеджмента являются выработка и применение методов, средств и инструментов для достижения целей деятельности фирмы в целом или ее отдельных производственно-хозяйственных звеньев – центров прибыли...
70346. МАРШРУТИЗАЦИЯ В ГОРОДСКИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ НА БАЗЕ МОБИЛЬНЫХ ИНТЕРФЕЙСОВ 2.63 MB
  Цель работы – расширение электронной туристической карты до «электронного туристического гида» для мобильных устройств на платформе Android. В процессе работы были проведены теоретические исследования средств информационной визуализации для мобильных приложений, изучены возможности практического применения GPS-навигации в информационных системах.
70347. ПСИХОЛОГО-ПЕДАГОГИЧЕСКИЕ АСПЕКТЫ ПРОБЛЕМЫ ФОРМИРОВАНИЯ КОММУНИКАТИВНЫХ УМЕНИЙ У ДОШКОЛЬНИКОВ С ТЯЖЕЛЫМИ НАРУШЕНИЯМИ РЕЧИ В УСЛОВИЯХ ОБРАЗОВАТЕЛЬНОЙ ИНТЕГРАЦИИ 82 KB
  Проанализированы различные теоретические подходы к определению сущности общения и коммуникации; определены группы наиболее значимых для дошкольников коммуникативных умений; обоснованы исходные теоретические предпосылки констатирующего эксперимента.
70348. МЕТОДИКА ФОРМИРОВАНИЯ КОММУНИКАТИВНОЙ КОМПЕТЕНТНОСТИ СТУДЕНТОВ ТЕХНИЧЕСКОГО ВУЗА В ПРОЦЕССЕ ИЗУЧЕНИЯ СОЦИАЛЬНО-ГУМАНИТАРНЫХ ДИСЦИПЛИН 95.5 KB
  Проблема формирования коммуникативной компетентности студентов не является совершенно новой. Представляется целесообразным целостно на междисциплинарном уровне исследовать проблему формирования коммуникативной компетентности студентов посредством выявления дидактического...
70349. СОСТАВ И СОДЕРЖАНИЕ ДОКУМЕНТАЛЬНЫХ МАТЕРИАЛОВ КАК ИСТОЧНИКОВ ПРИ ИЗУЧЕНИИ РАЗВИТИЯ СИСТЕМЫ ВЫСШЕГО ОБРАЗОВАНИЯ В РЕСПУБЛИКЕ БЕЛАРУСЬ 67 KB
  Статья посвящена актуальной проблеме - системному анализу документальной источниковедческой базы материалов учет которых чрезвычайно важен при изучении процесса развития системы высшего образования в нашей стране.