32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

3 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

80926. Поняття наочного навчання. Класифікація наочності 31.77 KB
  На основі безпосереднього сприйняття предметів чи за допомогою зображень наочності у процесі навчання в учнів формуються образні уявлення і поняття про історичне минуле. Педагогічний словник визначає наочність як один із принципів навчання заснований на показі конкретних предметів процесів явищ. Під засобами навчання розуміють предмети прилади чи їх сукупність яка необхідна для здійснення чогонебудь.
80927. Дайте оцінку сучасним засобам навчання на уроках історії 35.54 KB
  Очевидно що одним із засобів розвитку особистості учня в цьому напрямі а також активізації пізнавальної мотивації учня на уроках історії є учбоводослідницька діяльність яка має включати в себе постановку творчих дослідницьких завдань і наукове поетапне їх вирішення. Формування дослідницьких вмінь на уроках історії можливо в процесі поєднання інтерактивних аудіовізуальних і мультимедійних технологій. Використання аудіовізуальних засобів на уроках історії практикується досить давно але раніше якість фотоаудіовідеоматеріалів їх нестача...
80929. Проблема диференційного підходу до учнів у навчанні історії 36.5 KB
  У методиці навчання історії ще немає повноцінних досліджень і рекомендацій з індивідуалізації роботи з учнями але визначені загальні підходи до діагностики їх пізнавальних здібностей і можливостей. Він писав: До слабких недостатньо підготовлених відносяться учні які при поверхневому знанні історії не виявляють помітного інтересу до її вивчення і майже зовсім не володіють адекватними прийомами й уміннями самостійної роботи з навчальним історичним матеріалом. вважаються учні що мають цілком задовільні знання з історії.
80931. Звязок методики навчання історії з іншими науками 35.76 KB
  Методичні дослідження вивчаючи процес навчання історії мають спиратися на родинні науки насамперед на історію педагогіку і психологію. Пізнавальна діяльність учнів та її результати не можуть бути повноцінними якщо навчання історії не буде відповідати сучасному рівню історичної науки її методології. Навчання історії стане науково обґрунтованим і результативним лише за умови якщо вся його структура зміст і методика будуть відповідати цим обєктивним етапам та закономірностям пізнання.
80932. Сучасні цілі та завдання шкільної історичної освіти в Україні 33.28 KB
  Головна мета шкільної історичної освіти може бути визначена як створення та становлення особистості учня як субєкта історичного розвитку та суспільних відносин громадянинапатріота. Завданнями сучасної шкільної історичної освіти є забезпечення умов для: набуття школярами ключових та предметних компетентностей; виховання повноправного громадянина патріота України який здатен вільно орієнтуватися в суспільному житті та усвідомлювати свою роль та відповідальність перед суспільством та державою формування в учнів самосвідомості та власної...
80933. Структура та методичне забезпечення підручника «Всесвітньої історії» (10-11кл.) 37.68 KB
  Бесіда діалогічний метод навчання за допомогою якого вчитель із поставленими питаннямь спонукає учнів відтворювати раніше набуті знання робити самостійні висновкиузагальнення на основі засвоєного фактичного матеріалу. Бесіда є одним із активних методів навчання. Бесіда дозволяє залучити до діяльності на уроці дітей незалежно від їхнього рівня підготовки та індивідуальних можливостей що сприяє досягненню високих результатів у навчально виховному процесі. Така бесіда зазвичай проводиться на початку вивчення теми чи розділу.
80934. Аналіз програми з історії України для 5 кл. Мета ,завдання та зміст 29.92 KB
  Головною метою курсу є підготовка учнів до успішного опанування систематичних курсів історії України та всесвітньої історії прищеплення інтересу до історії отримання знань у наступних класах через формування в них початкових уявлень про історію як науку та про історію України як складову світової історії елементарних вмінь з історії; поглиблення загальних дидактичних вмінь необхідних для успішного засвоєння історичної інформації в подальшому; прагнення викликати захоплення минулим України. Зміст курсу ґрунтується на таких засадах:...