32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и –ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

2 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

44670. Нагревание и охлаждение электродвигателей 60.42 KB
  Для определения необходимой для привода мощности электродвигателя рассмотрим особенности нагрева двигателя и классификацию режимов его работы по условиям нагрева. Во время работы в двигателе возникают потери эллектрической энергии, которые превращаются в теплоту и нагревают обмотки и другие части ЭД
44671. Рассказ В. Осеевой «Хорошее» 19.14 KB
  Кто может выйти к доске и на оценку рассказать что помнит из жизни и творчества автора. Кто скажет какой это жанр Сегодня мы познакомимся с рассказом Хорошее Предположим о чем будет этот рассказ. Книги закрыты садимся ровно руки на парте внимательно слушаем учитель читает текст Какие чувства вызвал у вас рассказ Что особенно понравилось А было ли вам за героев стыдно За кого Вам хочется прочитать этот рассказ самостоятельно попробовав передать все чувства и эмоции которые вы испытали во время его прослушивания Начнем...
44672. Основы механики электропривода 35.44 KB
  Работа электромеханической системы электропривод – исполнительный механизм происходит при взаимодействии различных сил и моментов. Один из моментов создаётся электродвигателем, он приводит систему в движение и называется электромагнитным моментом
44676. Имя существительное как часть речи 57 KB
  Создать благоприятные условия для ознакомления учащихся с обобщённым лексическим значением имени существительного как части речи
44677. Одушевленные и неодушевленные имена существительные 90.5 KB
  Одушевленные и неодушевленные имена существительные. Цель: познакомить с понятиями одушевленные и неодушевленные имена существительные. Задачи: Образовательная: закрепить умения находить в тексте имена существительные Сформировать понятие об одушевленных и неодушевленных именах существительных учить различать одушевленные и неодушевленные имена существительные; закрепить умение находить в предложениях подлежащее и сказуемое связь слов в предложении; учить приемам анализа и синтеза. Подвести к выводу: одушевленные имена...
44678. Слова,которые отвечают на вопросы кто? что? 37.5 KB
  Дети читают слова написанные на доске ставят к ним вопросы:швеязонтикмалинашумпопугайпесоксердцевосток Ирина метро. Назовите слова обозначающие изображенные предметы.Поставьте к словам вопросы.Учащиеся записывают слова классифицируя их по группам: люди животные растения.