32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

3 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

8163. Суспільна стабільність та безпека, їх соціальна цінність 26 KB
  Суспільна стабільність та безпека, їх соціальна цінність. Мета: визначити сутність понять суспільна стабільніст, соціальні загрози зясувати, які чинники сприяють забезпеченню суспільної стабільності, розвивати вміння аналізувати, порівнювати, робити висновки, розширювати міжпредметні..
8164. Природні та техногенні явища як фактори загрози суспільній безпеці. Подолання та попередження наслідків глобальних проблем 26.54 KB
  Природні та техногенні явища як фактори загрози суспільній безпеці. Подолання та попередження наслідків глобальних проблем Мета: сформувати уявлення учнів про специфічність глобальних проблем людства акцентувати увагу на їх соціальних та економічни...
8165. Вступ. Загальне поняття про предмет Людина і світ 58 KB
  Вступ. Загальне поняття про предмет Людина і світ Мета уроку: Розкрити основні завдання вивчення курсу Людина і світ і сформувати уявлення про роль людинознавчого курсу в здійсненні світоглядного самовизначення людини розкрити зміст співвідношення ...
8166. Ціннісні виміри людського життя. Смерть і безсмертя 29.5 KB
  Тема уроку. Ціннісні виміри людського життя. Смерть і безсмертя. Мета:сформувати уявлення учнів про цінності та їх роль у житті людини ознайомити учнів з основними аспектами проблеми смерті та безсмертя як фінальних цінностей людини формуват...
8167. Почуття, інтелект, воля. Ідеали в житті людини 44 KB
  Почуття, інтелект, воля. Ідеали в житті людини. Мета: Розглянути поняття почуття, інтелект, воля, та проаналізувати ідеали в житті людини розвивати вміння критично аналізувати різні точки зору на певну проблему виховувати толерантне ставлення до п...
8168. Завершення І світової війни 33 KB
  Завершення І світової війни. Хоч головні битви розгорталися в 1918 р. на Західному фронті, історія розпорядилася так, що не вони завершили війну, а події на Східному фронті. Упродовж двох років у північній частині Греції англо-французькі війська без...
8169. Особа, суспільство, держава 31 KB
  Тема уроку. Особа, суспільство, держава. Мета: Навчити ліцеїстів розрізняти поняття людина, індивід, особистість, особа, громадянин. розвивати вміння висловлювати власне ставлення до проблеми виховувати почуття правової свідомості. Обладнання...
8170. Громадянство. Правова і соціальна держава 27 KB
  Тема уроку. Громадянство. Правова і соціальна держава. Мета уроку: визначити поняття громадянство, правова і соціальна держава розвивати вміння висловлювати власне ставлення до проблеми виховувати почуття правової свідомості. Обладнання: Дош...
8171. Культура Гетьманщини 15.54 KB
  Культура Гетьманщини 1648 pp. - період гетьманської держави, її очолюють високоосвічені, європейського рівня політичні й громадські діячі: П. Сагайдачний, Б. Хмельницький, І. Виговський, І. Мазепа. Вони докладають великих зусиль і кош...