9891

Принцип максимума Понтрягина.

Контрольная

Математика и математический анализ

Принцип максимума Понтрягина Предложен Л.С. Понтрягиным в 1956 г. Рассмотрим процесс, описываемый системой ОДУ: x - n-мерный вектор состояния (фазовые координаты) u - r-мерный вектор управляющих воздейств...

Русский

2013-03-18

84 KB

3 чел.

Принцип максимума Понтрягина

Предложен Л.С. Понтрягиным в 1956 г.

Рассмотрим процесс, описываемый системой ОДУ:

      (*)

x - n-мерный вектор состояния (фазовые координаты)

u – r-мерный вектор управляющих воздействий

f – n-мерная вектор-функция.

Так как t не входит в (*) явно, то система - автономная.

Любая система может быть сведена к (*), если положить .

Обычно на и накладываются ограничения.

Будем полагать

,          (**)

где U-замкнутая ограниченная область, не зависящая от x и t.

Управление  называется допустимым. Кроме того,  и удовлетворяет уравнению (*).

Примеры ограничений:

1)

2)

3)

Предполагаем также, что непрерывна и имеет непрерывные частные производные по .

Необходимо найти такое  при , чтобы система, двигаясь по траектории в соответствии с (*), обеспечивала минимум некоторого функционала J.

Обычно функционал J есть функция от части фазовых координат в начале и в конце траектории:

,       (***)

где  - некоторые составляющие вектора x в начале (t=0) и в конце траектории ( ).

В задаче на максимальное быстродействие

.

Полагая .

Часть фазовых координат, не вошедших в (***) может быть закреплена

,

.

Рассмотрим для простоты задачу с конечным интервалом времени, фиксированным левым концом и свободным правым.

     (1)

      (2)

Управление u(t) в силу ограничения (**) следует искать среди кусочно-непрерывных функций. (В вариационном исчислении искомое решение принадлежало классу непрерывных функций).

Пусть - оптимальная траектория и оптимальное управление. - это вектор, координаты которого могут иметь на отрезке  разрывы первого рода в конечном числе точек.

- бесконечно малая величина;

,  - бесконечно малый отрезок времени.

Дадим оптимальному управлению вариацию, заменив на бесконечно малом интервале на другое управление u, не меняя вне этого интервала.  Такая вариация называется "игольчатой".

Заметим, что приращения при  не обязаны быть сколь угодно малой величиной.

Игольчатая вариация относится к классу кусочно-непрерывных функций, среди которых мы ищем оптимальное управление.

Несмотря на то, что величина не является бесконечно малой, влияние этой вариации на последующее движение объекта бесконечно мало, т.к. влияние любого импульса (короткого) на систему оценивается величиной его площади (которая в нашем случае является бесконечно малой величиной).

В результате варьирования на бесконечно малом интервале траектория системы x, начиная с момента отличается от оптимальной траектории .

 

Начиная с момента , вариация траектории удовлетворяет некоторому дифференциальному уравнению с начальным условием:

     (3)

 

Формула (3) следует из разложения величин и в ряд Тейлора:

 

с учетом того, что = и принимая во внимание уравнение движения (2).

Согласно (2) приращение на интервале является решением уравнения

    (4)

с начальным условием (3), имеющим порядок малости .

Т.к. решения дифференциальных уравнений непрерывно зависят от начальных условий, то

.       (5)

Поэтому в выражении (4) правую часть можно линеаризовать, разлагая в ряд Тейлора и отбрасывая члены порядка и выше.

    (6)

Т.к. , то первая компонента вектора в точке есть вариация функции , причем

       (7)

в силу оптимальности траектории .

Введем функцию , удовлетворяющую условию

     (8)

Уравнение для следует из условия (8) постоянства скалярного произведения для каждого :

  . (9)

С учетом (6) (при ):

    (10)

Из условия произвольности

   (11)

Из (7)-(8) следуют граничные условия:

 

      (12)

Решая (11) при условии (12), находим и тогда условия (7)-(8) приобретают вид:

.   (13)

Вместо подставляем его значение (3), выраженное через правую часть уравнения (2) и получаем неравенство

   (14)

Функция называется функцией Гамильтона.

Из (14) следует, что на оптимальной траектории функция Гамильтона достигает своего максимума.

 

Момент начальной вариации был выбран произвольно на , следовательно это верно для всего интервала.

(16)

 

Это и есть принцип максимума Понтрягина.

Принцип максимума является необходимым условием оптимальности.

Для некоторых классов задач он является и достаточным, но это требует доказательства в каждом конкретном случае.

Введение Гамильтониана H позволяет упростить запись основного уравнения (2) и сопряженного (11)

 

        (17)

Вместе с краевыми условиями эта система представляет собой двухточечную нелинейную краевую задачу. Входящие в (17) управление выражается через и из условий оптимальности (16).


 

А также другие работы, которые могут Вас заинтересовать

69270. Обробка подій миші 43 KB
  У цьому розділі розглядаються способи організації введення даних за допомогою миші і клавіатури. У першому розділі описується стандартна система введення даних, використовувана операційною системою Windows для контролю стану введення (input state).
69271. Рядок стану 64 KB
  Рядок стану є багатоелементною смугою, розташованою внизу фреймового вікна. Вона використовується для відображення різних даних, специфічних для цього додатку. Практично всі додатки Windows (як SDI, так і MDI) мають рядки стану. Крім того, вони є навіть у деяких діалогових застосувань.
69272. Створення і маніпулювання панелями інструментів 58 KB
  Оскільки панелі інструментів займають дорогоцінний екранний простір вони повинні містити лише найбільш часто використовувані команди. У достатньо великих застосуваннях для вирішення різних завдань застосовується декілька різних панелей інструментів.
69273. Інтерфейс графічних пристроїв 57.5 KB
  Операційна система Windows володіє графічним інтерфейсом, тому всі створювані для неї застосування зобов’язані використовувати саме його. Графічний інтерфейс істотно простіший, зручніше і зрозуміліше для користувачів, чим текстовий. Інтерфейс графічних пристроїв Windows...
69274. Діалогові вікна 45.5 KB
  В першу чергу необхідно вивчити, як можна визначити клас, похідний від CDialog. Оскільки демонстраційний додаток розділу володіє діалоговим вікном, що містить всі дані елементи управління, приступимо до його створення прямо зараз. Це буде проект додатку SDI під назвою ControlsDemo.
69275. Елементи керування 53 KB
  Щоб краще зрозуміти, як саме MFC забезпечує підтримку елементів управління ймовірно, було б цікаве розглянути процес створення елементів управління безвідносно до MFC. Звернете увагу, практично будь-який прямокутник, що відображається на екрані, здатний взаємодіяти з користувачем, є вікно.
69276. Кнопки, перемикачі 49.5 KB
  Вивчення класів елементів управління не випадково почате саме з класу кнопки, оскільки це найбільш часто використовуваний елемент управління, який присутній практично в кожному діалоговому вікні.
69277. Клас Cedit. Клас CListBox 54.5 KB
  Елемент управління поле введення (edit control), що інкапсулюється класом CEdit, є прямокутне дочірнє вікно, в якому користувач може вводити дані. Як правило, це найбільший елемент управління в додатку. Змінюючи стилі цього елементу управління, можна отримати все, що завгодно...
69278. Немодальні діалогові вікна 79 KB
  Визначення створення і контроль за тривалістю існування немодального діалогового вікна здійснюються впродовж семи етапів. Створення ресурсу шаблону діалогового вікна. Звернете увагу діалогові вікна в немодальному режимі не мають ніяких спеціальних стилів.