32232

Связь между принципами максимумами и динамическим программированием

Лекция

Информатика, кибернетика и программирование

17 является скалярным произведением векторов Ψ и X: Н = ψ 8. Вектор касателен к траектории t и нормален к векторам ψ и ψ что определяет оптимальный процесс перехода из в . Максимальное быстрое уменьшение J будет происходить очевидно что если вектор скорости Хточка в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо чтобы проекция вектора скорости движения изображающей точки Хточка на вектор отрицательной нормалям к поверхности J...

Русский

2013-09-04

359.5 KB

3 чел.

Лекция №8

Связь между принципами максимумами и динамическим программированием

Величина функции Гамильтона согласно (6.17) является скалярным произведением  векторов Ψ и X:

Н = <ψ, >                            (8.1)

Функция Беллмана (7.4) представляет определенное значения критерия оптимальности для определенного момента времени t1. Следовательно, в пространстве состояния объекта  управления или, в частности, как показано на рис. 8.1, на фазовой плоскости, можно представить изменения критерия  J в виде линий равного уровня, составляющие конкретные значения функции Беллмана S.

Рис. 8.1. Геометрическая интерпретация на фазовой плоскости определения       оптимальной траектории изменения состояния объекта управления

Геометрическая интерпретация  принципа максимума и динамического  программирования представляется следующим образом. Вектор  касателен к траектории (t) и нормален к векторам ψ и –ψ, что определяет оптимальный процесс  перехода из в . Оптимальная траектория изменения состояния объекта управления из начального состояния ={, } в конечное  ={, }должна быть направлено в сторону убывания критерия  J.

Если изображающая точка состояния объекта будет двигаться вдоль линии равного уровня то J не будет меняться. Максимальное быстрое уменьшение  J будет происходить, очевидно, что если вектор скорости Х(точка) в направлении убывании убывание J будет максимальным. Для обеспечения этого необходимо, чтобы  проекция вектора скорости  движения изображающей точки Х(точка) на вектор отрицательной нормалям к поверхности J (или перпендикулярен к линии равного уровня J) была максимальной  (см. рисунок 7.1)

Компоненты вектора ψ={ } определяется из системы уравнений (6.18) и из аналогичной системы (7.11). Следовательно, вектор равен градиенту с отрицательным знаком функции Беллмана, так как                                     (8.2)

Или учитывая соотношение (7.4) можно записать, что

                            .                                    (8.3)

Следовательно,

                                     S                            (8.4)

Таким образом, вектор  определяет направление максимальной скорости уменьшения критерия оптимальности  J, т.е. – является нормалью к поверхностям равного уровня функционала (критерия) J.

Из этого следует, что векторное произведение (8.1) будет максимальным, а значит управления оптимальным по критерию J, если проекция вектора скорости  на нормаль –  будет максимальная, т.е нулевой. Следовательно, вектора   и   должны быть ортогональным. Этим определяется экстремаль и оптимальное управление  (x).

Уравнение Беллмана  (7.12) можно так же записать в виде векторного произведения

,                   (8.5)

где                                                      (8.6)    

                             = f (X,U) – уравнение динамики объекта управления.

Выражение (8.6) предоставляет градиент функции S на X. Следовательно, выражение (8.5) можно представить как

Расширим  вектор столбец (8.6) на один элемент, равный единица и обозначим его   

                        (8.8)

Учитывая, что минимум положительной функции равен отрицательной величине максимальное значения, уравнение (7.12) можно записать в следующем виде:

.               (8.9)

Составляя полученное выражение (8.9) с условием (6.20) принципа максимума, можно убедиться, что они идентичны, если вектор  отожествляется с вектором . Это значит, что

.           (8.10)

Т.е.        – .                                                         (8.11)

Эти выражения геометрически интерпретируются на рис 8.1, как нормаль и поверхностям равного уровня S. Т.е. между методом Эйлера-Лагранжа принципами максимума и динамическим программированием существует тесная связь. Это продемонстрировано и решением примеров по определению оптимального управления для объекта  .


 

А также другие работы, которые могут Вас заинтересовать

79422. Процессы проектирования. Архитектурные стили и шаблоны проектирования 80.97 KB
  Шаблон проверяют на: Целостность и непротиворечивость Конструкция полностью покрывает заявленные требования к функционалу Устойчивость и производительность Два подхода проектирования: От общих функций к реализации От частного к общему Архитектурные стили Репозиторий: Описание Все совместно используемые подсистемами данные хранятся в центральной базе данных доступной всем подсистемам. Рекомендации Логично использовать если система обрабатывает большие объёмы данных. Преимущества Совместное использование больших объёмов данных эффективно...
79423. Процессы проектирования. Проектирование информационной архитектуры 44.84 KB
  Задачи решаемые во время проектирования информационной архитектуры: Идентификация и инвентаризация существующих данных включая определение их источников процедур изменения и использования ответственность оценка качества; Сокращение избыточности и фрагментарности данных с целью уменьшения стоимости хранения данных повышение качества данных за счет исключения противоречивости и неоднозначности различных экземпляров данных; Исключение ненужных перемещений и копирований данных; Формирование интегрированных представлений данных таких...
79424. Процессы проектирования. Построение ER модели. Виды нотации 56.27 KB
  С её помощью можно выделить ключевые сущности и обозначить связи которые могут устанавливаться между этими сущностями. Степень конца связи указывается графически множественность связи изображается в виде вилки на конце связи. Модальность связи так же изображается графически необязательность связи помечается кружком на конце связи. Наименование может быть одно для всей связи или два для каждого из концов связи.
79425. Процессы проектирования. Построение логической модели данных 47.37 KB
  Построение логической модели данных. Создание схемы базы данных на основе конкретной модели данных например реляционной модели данных. Для реляционной модели данных даталогическая модель набор схем отношений обычно с указанием первичных ключей а также связей между отношениями представляющих собой внешние ключи. Концептуальная модель хранилища данных представляет собой описание главных основных сущностей и отношений между ними.
79426. Процессы проектирования. Построение физической модели данных 44.2 KB
  Построение физической модели данных. Создание схемы базы данных для конкретной СУБД. Специфика конкретной СУБД может включать в себя ограничения на именование объектов базы данных ограничения на поддерживаемые типы данных и т. Кроме того специфика конкретной СУБД при физическом проектировании включает выбор решений связанных с физической средой хранения данных выбор методов управления дисковой памятью разделение БД по файлам и устройствам методов доступа к данным создание индексов и т.
79427. Процессы проектирования. Проектирование программной архитектуры 48.05 KB
  Подход на основе шаблонов примеры шаблонов можно найти в вопросе 26 Стандартная структура подхода на основе шаблонов: Имя паттерна Задача паттерна Описание решения алгоритм без привязки к реализации Плюсы применения паттерна Минусы применения паттерна Иногда 4 и 5 пункт заменяют рекомендацией. Плюсы применения шаблонов проектирования: Инструмент для решения простых задач на любом языке разработчикам легче взаимодействовать увеличивается скорость программирования. Минусы применения шаблонов проектирования: Зацикливание разработчика...
79428. Процессы проектирования. Шаблоны программной архитектуры 112.61 KB
  Как применять политику ценообразования Вырабатывается стратегия приоритета скидок объект Продажа не должен обладать информацией о применяемых скидках но можно было бы применить стратегию расчета скидок. Имеются классы проектирования Продажа ТоварПродажа продажа отдельного вида товара в рамках продажи в целом ТоварСпецификация описание конкретного вида товара. Объект Продажа должен передать сообщение Рассчитать промежуточную сумму каждому экземпляру класса ТоварПродажа которые в свою очередь передают сообщения СообщитьЦену объектам...
79429. Процессы проектирования. Проектирование инфраструктуры 42.3 KB
  В последнее время чаще начинают использовать стороннюю инфраструктуру облачные сервисы etc. Это выгодно с точки зрения цены не покупаем оборудование а платим деньги только за аренду однако если вмешивается безопасность или очень критично производительность то приходится тратить деньги на свою инфраструктуру. Следует различать инфраструктуру ИС и инфраструктуру проекта по созданию ИС. в этом билете имеется в виду инфраструктура ИС про инфраструктуру проекта можно читать в билете 11.
79430. Процессы проектирования. Проектирование интерфейсов 46.72 KB
  Проектирование интерфейсов Интерфейс определяет совокупность средств и методов взаимодействия между элементами системы. С другой стороны набор правил или процедур для взаимодействия между компонентами программы между компонентами программы в целом а также между информационными системами и оборудованием программный интерфейс. Программный интерфейс формален полный и непротиворечивый формализован. Физическая реализация интерфейса USB COM port.