32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и –ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

3 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

8294. Разработка универсального лабораторного стенда для исследования высокомоментного двигателя 393.5 KB
  Электрические моментные двигатели постоянного тока широко используются в качестве исполнительных элементов в современных системах автоматики, телемеханики, измерительной техники
8295. Преуспевать с радостью. Учебник к психологии успеха 870.5 KB
  Когда все говорят о кризисе, не надо этого делать. Несомненно, люди - существа, легко поддающиеся влиянию. Пессимистические заголовки газет и журналов застряли в таком большом числе голов, что сформировалось негативно-парализующее убеждение
8296. Великобританія у 20-30-х роках 59 KB
  Тема: Великобританія у 20- 30-х роках Мета: Пояснити чому в останній третині ХІХ ст. Англія поступово втрачає провідне місце у світовій економіці, Описати що стало причиною занепаду і кризи ідеології і політики англійських лібералів.Навчити лі...
8297. Основы управления предприятием 559.5 KB
  Очевидно, что всякая революция имеет свои причины. В чем же причины непрерывного и часто кардинального изменения форм и методов управления в 20 веке. Ответ естественно искать в изменениях, происходящих в объекте управления системы хозяйствования. Под хозяйствованием мы понимаем гармоничное (согласованное) протекание процессов производства и потребления продукции и услуг...
8298. Преподавание и воспитание в высшей школе: Методология, цели и содержание, творчество 991 KB
  В книге содержатся сведения по различным сторонам деятельности преподавателя современного вуза. Особое внимание уделяется воспитательной работе, способствующей становлению личности студента как субъекта культуры, и творчеству преподавателя. Рассматр...
8299. Педагогика как наука о воспитании и развитии личности 929.5 KB
  Педагогика слово греческого происхождения (пейда - дитя, гогос - вести), буквально оно переводится как деторождение, детовождение или искусство воспитания. В Древней Греции педагогос называли раба, который занимался обучением и воспитанием..
8300. Інформатика. Курс лекцій 7.4 MB
  Навчальний предмет ІНФОРМАТИКА - це нормативна дисципліна з підготовки бакалаврів - майбутніх податківців за напрямом Економіка і підприємництво. Предмет дисципліни - засоби автоматизації інформаційних процесів обробки та використання економічної інформації...
8301. Конспект лекцій з патологічної фізіології 647.5 KB
  Предмет і завдання патологічної фізіології, та її місце в системі підготовки лікаря ветеринарної медицини. Методи патологічної фізіології. Історія розвитку патологічної фізіології та огляд теорій про походження хвороб...
8302. Активізація суспільних та політичних рухів на початку ХХ століття 52.5 KB
  Тема уроку. Активізація суспільних та політичних рухів на початку ХХ століття. Мета: пояснити причинно-наслідкові звязки та перебіг суспільно-політичний рухів на початку ХХ століття розвивати аналітичні вміння при вивченні всесвітньої історії...