9898

Вторая вариация и достаточные условия экстремума

Реферат

Математика и математический анализ

Вторая вариация и достаточные условия экстремума Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, иг...

Русский

2013-03-18

178 KB

8 чел.

PAGE 14

Вторая вариация и достаточные условия экстремума

Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, играющее в этом вопросе ту же роль, что дифференциал второго порядка при исследовании экстремума функций. Этим понятием является вторая вариация.

Вариации высших порядков

Замена приращения функционала на его вариацию, как и замена приращения функции на ее дифференциал, может быть уточнена с помощью добавления членов высшего порядка малости. Это приводит к разложению в ряд

 (1)

совершенно аналогичный ряду Тейлора для функций. Здесь δ2I, δ3I, … - вариации соответственно второго, третьего и т. д. порядков (коротко - вторая, третья и т. д. вариации) функционала I. Каждая из них получается с помощью варьирования предыдущей (т.е. и т.д.), в процессе которого считается не зависящим от у, т.е. не варьируется.

Каждая из этих вариаций обладает относительно свойством однородности с соответствующим показателем:

, С=const.

Это означает, что члены в правой части (1) имеют последовательно первый, второй, третий и т. д. порядки малости относительно (точнее говоря, относительно || ||, где норма берется в том пространстве, в котором рассматривается функционал), если только не обращаются в нуль.

Ранее мы пользовались только первым членом ряда (1). В этом разделе мы будем пользоваться также и вторым членом, т.е. более точной формулой

 (2)

В конкретных примерах разложение (1), а потому и (2) получаются с помощью обычного ряда Тейлора. Например, для функционала

получаем

,

где в F,  и т. д. должны быть подставлены значения х, у, у'. Отсюда получаем для второй вариации выражение

  (3)

Отметим, что здесь, конечно, .

Условия экстремума в терминах второй вариации

Пусть функционал I{у} принимает для стационарное значение, т. е. . Другими словами, пусть выполнено основное необходимое условие для экстремума. Тогда при в правой части (2) первый член отсутствует, и потому главным становится второй. Поэтому при рассмотрении экстремума функции нескольких переменных приходим к следующим выводам:

если >0 для любой (конечно, кроме вариации δу≡0, когда δ2I = 0), то при функционал I{у} имеет минимум;

если < 0 для любой δу, то при функционал I{у} имеет максимум;

если может принимать значения обоих знаков, то при функционал I{y} имеет минимакс и экстремума не будет.

Единственный случай, когда по нельзя судить о наличии экстремума, тот, когда знака менять не может, но может обращаться в нуль (в частности, если она тождественно по равна нулю). Мы не будем здесь разбирать этот случай.

Более тщательный анализ показывает, что достаточное условие минимума в общем случае имеет вид

(C = const > 0).

Это условие для функциональных пространств более сильное, чем просто > 0. Однако для обычных задач вариационного исчисления это уточнение несущественно.

Приведенные формулировки, как и изученное ранее необходимое условие, желательно преобразовать к равносильному виду требования, наложенного непосредственно на искомую функцию у(х). Это преобразование проводится различно для разных классов функционалов. Покажем его для некоторых таких классов. Отметим, что тип экстремума (слабый или сильный) определяется выбором пространства, в котором рассматриваются функционал I{у} и разложения (1) и (2).

Необходимые условия Лежандра

Рассмотрим функционал

при некоторых граничных условиях. Вторая вариация такого функционала выражается по формуле (3).


Легко проверить, что:

если  допускает при  (не обязательно для всех таких х) положительные значения, то и допускает положительные значения;

если  допускает при  отрицательные значения, то и допускает отрицательные значения.

В самом деле, обозначим для краткости коэффициенты квадратичной формы под знаком интеграла (3), после подстановки в них , соответственно через φ(x), ψ(x), χ(x), и пусть χ(x0)>0 (a<x0<b) (мы считаем все рассматриваемые функции и их производные непрерывными, так что если  при а<х<b, то это верно и при ). Выберем в качестве функцию, график которой изображен жирной линией на рисунке. (При этом, если желать иметь дело только с функциями из С1, то уголки можно как угодно мало скруглить.) Тогда

.  (5)

Заменяя при малом ε коэффициенты их значениями в точке х0, получаем приближенные выражения для слагаемых в правой части (5)

, ψ(x0)∙0, .

Значит, при малом ε вся сумма (5) положительна, что и требовалось доказать.

Сравнивая полученный результат с условиями экстремума, приведенными выше, приходим к необходимым условиям Лежандра:

если функционал при некоторых граничных условиях имеет при (хотя бы слабый) минимум, то

, (a≤x≤b)

если же максимум, то

, (a≤x≤b).

Заодно мы получаем достаточное условие для минимакса: если для экстремали функция  принимает при  значения обоих знаков, то при функционал имеет минимакс. Необходимые условия Лежандра не являются достаточными.

Аналогично рассматриваются функционалы от нескольких функций, например от двух функций. Здесь разложения (1) и (2) также имеют место, но у и δу уже являются векторными функциями. Вторая вариация, взамен (3), приобретает вид

,

где индексы i, j принимают независимо один от другого значения 1, 2 (а в случае n искомых функций - все n значений).

Рассуждая, как выше, приходим к необходимым условиям Лежандра и в этом случае:

если функция доставляет рассматриваемому функционалу при некоторых граничных условиях минимум, то квадратичная форма

    (6)

при любом х (аxb) не должна принимать отрицательные значения, т. е. должна быть неотрицательной (все собственные значения ее матрицы должны быть ≥0);

если для будет максимум, то форма (6) должна быть всюду на отрезке ахb неположительной,

если же для экстремали матрица () имеет, хотя бы при различных х, собственные значения обоих знаков, то при функционал имеет минимакс.

Необходимое условие Якоби

Пусть для некоторой функции удовлетворяются уравнение Эйлера и граничные условия, т.е. она придает функционалу при таких условиях стационарное значение. Обозначим для кратности  и т. д. Тогда, прежде всего, в силу условий Лагранжа, если  меняет знак на интервале а≤ х≤b, то значение минимаксное. Наличие нулей у  всегда вызывает существенные осложнения. Поэтому мы будем предполагать, что  сохраняет знак, для определённости  (axb).

Обозначим на минуту δу=z в функционале (3), куда поставлено  ; тогда уравнением Эйлера для него будет

.    (7)

Оно называется уравнением Якоби для исходного функционала. Обозначим через а* точку, сопряжённую с а относительно этого уравнения. Тогда, если а*>b, то функционал (3) имеет при δу=0 минимум, а потому функционал I{y} имеет при   слабый минимум; если же а*<b, то функционал I{y} имеет при слабый минимакс. Ясно, что если  (axb), то вместо минимума надо говорить о максимуме. Эти условия экстремума, выраженные в терминах сопряжённых точек, называются условиями Якоби.

 


Прямые методы

Классический метод решения вариационных задач, основанный на сведении их к дифференциальным уравнениям Эйлера, зачастую оказывается недостаточно эффективным, несмотря на большое теоретическое значение этого метода. Хотя мы видели ряд примеров, когда уравнение Эйлера оказывалось возможным решить в квадратурах и даже в элементарных функциях, но для сколько-нибудь более сложных задач, особенно для функций нескольких переменных, такого решения не существует, и мы приходим к необходимости численно решать линейную или нелинейную краевую задачу для дифференциального уравнения, что возможно, но отнюдь не просто и здесь рассматриваться не будет. Поэтому естественно, что были разработаны методы численного решения вариационной задачи в ее исходной постановке, без перехода к уравнению Эйлера; они получили название прямых методов вариационного исчисления. 

В различных разделах математического анализа имеется, грубо говоря, два основных класса методов приближенного отыскания неизвестных функций: методы сужения числа степеней свободы и методы дискретизации. (Конечно, имеются и методы смешанного типа, а также не укладывающиеся в эти два класса). В методах первого класса независимые переменные в принципе остаются непрерывными, но функция ищется в том или ином специальном виде, включающем несколько параметров, которые затем подбираются из требования наилучшим образом удовлетворить условиям задачи; типичными представителями здесь являются метод интерполяции или метод наименьших квадратов. В более сложных задачах эти методы предоставляют обширное поле приложения физической интуиции и аналитического искусства, так как, если удается правильно предвидеть форму искомого решения, применив лишь небольшое число параметров, и удачно выбрать критерий качества приближения, то метод может оказаться чрезвычайно эффективным (в частности, если сама исходная задача содержит параметры). В методах второго класса - они называются также сеточными - мы с самого начала заменяем искомую функцию набором ее значений в узлах некоторой сетки; здесь типичными являются методы численного интегрирования обыкновенных дифференциальных уравнений. Сеточные методы обычно бывают менее специфичны (более универсальны) и более алгоритмичны, чем методы предыдущего класса; поэтому они широко применяются при работе на ЭВМ.

 

Метод Ритца для квадратичного функционала

Meтод Ритца, предложенный в 1908 г. немецким физиком и математиком В. Ритцем – также один из типичных методов сужения числа степеней свободы.

Изложим его сначала на самом простом примере отыскания экстремали функционала при граничных условиях, предположив, что функционал квадратичный:

.   (1)

Отметим, что мы здесь рассматриваем более общий - неоднородный вид квадратичного функционала. Включение членов с уу' и у' не приводит к расширению общности, так как их можно устранить интегрированием по частям, что, впрочем, в конкретных примерах делать не обязательно.

Метод Ритца состоит в том, что приближенное выражение для искомой экстремали строится в виде

   (2)

где g0(x), g1(x), ..., gn(x) - некоторые выбранные функции, тогда как параметры ck будут подбираться из условия стационарности значения функционала (1). Функция g0(x) обычно выбирается удовлетворяющей граничным условиям, причем желательно, чтобы она по возможности лучше изображала искомое решение, если о последнем что-либо известно. (После ее выбора иногда делают замену y=g0(x)+z, чтобы перейти к однородным граничным условиям z(a)=z(b)=0). Базисные (иначе координатные) функции gk(x) (k = 1,2, ..., n) выбираются удовлетворяющими однородным граничным условиям, т.е. gk(а) = gk(b) = 0; тогда при любых значениях ck сумма (2) будет удовлетворять исходным граничным условиям и, таким образом, о них можно не беспокоиться.

В теоретических исследованиях функции g1,...,gn составляют часть бесконечной системы функций

g1(x), g2(x), …, gn(x), gn+1(x), …   (3)

линейно независимой и полной в пространстве функций , удовлетворяющих условиям f(а)=f(b)=0. При этом линейная независимость означает, что ни одна из этих функций не является линейной комбинацией конечного числа остальных, а полнота - что любую такую функцию f(x) можно как угодно хорошо приблизить (в смысле C1) линейной комбинацией конечного числа функций (3). Чаще всего, если не учитывается конкретный вид функционала (1), берутся системы

, k=1, 2, 3 …   (4)

или

, k=1, 2, 3, …    (5)

можно проверить, что каждая из этих систем линейно независимая и полная в С1). Можно доказать, что если Р(х)>0 и исходная задача имеет единственное решение, то приближенные решения, построенные по методу Ритца, при  сходятся к точному. Условие единственности выполнено, например, если Q(x).

В конкретных приложениях теоремы о сходимости использовать затруднительно, они скорее имеют утешительный характер. Более реальны теоремы с двусторонними оценками отличия точного решения от приближенного; такие теоремы для метода Ритца впервые получил в 1918 г. российский математик Н. М. Крылов (1879-1955). Однако такие оценки, удобные для практического использования, получены лишь для весьма узкого класса задач, так что их на практике обычно не применяют.

При практическом применении метода стремятся к его практической сходимости, т. е. к тому, чтобы при небольшом числе базисных функций он дал решение с хорошей точностью. Здесь также можно использовать первые члены систем (4) и (5) или каких-либо иных систем. Если удается использовать конкретный вид функционала (1), то обычно скорость сходимости метода улучшается. Например, если и по смыслу задачи решение должно быть четной функцией, то ясно, что при применении системы (4) нужно пользоваться только нечетными k; но если четность решения заранее неясна, то нельзя пользоваться только четными функциями gk(x), так как при этом мы навязываем решению свойство четности, которым оно могло не обладать. Если интуиция подсказывает, что точное решение будет где-то иметь «горбик», то желательно одну из первых функций gk(x) взять с таким горбиком и т. п.

Вариационные задачи бывают двух типов: можно искать функцию, реализующую экстремальное или стационарное значение функционала, а можно искать и само это значение функционала. Ясно, что искать стационарное значение выгоднее, чем реализующую его функцию, так как ошибка в отыскании такой функции даст в соответствующем стационарном значении ошибку высшего порядка малости (сравните с задачей о нахождении стационарного значения функции одной переменной). Поэтому желательно, когда это возможно, сводить более сложные задачи к задачам на отыскание стационарных значений.

Вернемся к приближенному решению (2). Подставив его в правую часть (1), раскрыв скобки и произведя интегрирование, мы получим многочлен второй степени относительно пока еще произвольных параметров

   (6)

Ясно, что если, например, исходная задача была задачей о минимуме, то желательно подобрать параметры ck так, чтобы и выражение (6) приняло минимально возможное значение. Это же относится и к любому стационарному значению функционала (1), так как в зоне медленного изменения функционала и выражение (6) должно медленно меняться при изменении параметров. Поэтому мы приходим к системе уравнений

, k=1, 2, …, n,   (7)

из которой и надо найти параметры ck.

Введем рабочее обозначение

Тогда квадратичная часть функции (6) имеет вид

,     (8)

Поэтому (7) представляет собой систему линейных алгебраических уравнений относительно с1, c2, …, сn с симметрической матрицей

, k=1, 2, …, n.

и потому при небольшом n легко решается. Отметим, что если Р(х)>0,  и функции g1, g2, ..., gn линейно независимы, то нетрудно доказать, что квадратичная форма (8) положительно определенная, что облегчает решение системы (7). Подставив найденное решение в правую часть (2), мы и получаем приближенное решение по методу Ритца.

Метод Канторовича

Этот метод, предложенный Л. В. Канторовичем в 1933 г., представляет собой развитие метода Ритца для функционалов от функций нескольких переменных. Он состоит в том, что в качестве коэффициентов при базисных функциях берутся не неизвестные константы, а неизвестные функции от некоторой одной переменной. Тогда после подстановки в функционал и применения условий стационарности (уже вариационных!) мы получаем краевую задачу для системы обыкновенных дифференциальных уравнений относительно этих неизвестных функций. Решая эту задачу точно или численно (что, по крайней мере, в линейном случае, т. е. для квадратичного функционала, вполне доступно современным вычислительным средствам), мы и получаем приближенное решение исходной вариационной задачи. Так как функции более гибки, чем константы, то с помощью их оптимального подбора (оптимальность обеспечивается самой структурой метода) удается значительно лучше приблизиться к точному решению, чем в методе Ритца.

Пусть

   (9)

.

При применении метода Ритца к функционалу (9) выбирается следующая система координатных функций:

.

Решение ищется в виде  где Сk – неизвестные постоянные. В методе Канторовича выражение для экстремали берется в виде

   (10)

где — неизвестные функции, определяемые таким образом, чтобы функционал (9) достигал экстремального значения. Отыскание решения в виде (10) позволяет расширить класс экстремалей.

После подстановки (10) в (9) и интегрирования полученного выражения по у получается следующий функционал:

Функции  k=1, 2, …, n, должны удовлетворять системе уравнений Эйлера-Лагранжа

, k=1, 2, …, n,

a приближенное решение вида (10) – заданным граничным условиям на прямых x=а и x=b.

Метод Галеркина

Этот метод применяется для отыскания приближенных решений как вариационных задач, так и краевых задач для обыкновенных дифференциальных уравнений и уравнений в частных производных, в частности, уравнений Эйлера-Лагранжа.

Пусть неизвестная функция u(Р) удовлетворяет в некоторой области D следующей краевой задаче:

 на y ( G).  (11)

Здесь L - некоторый линейный дифференциальный оператор, Г - линейный оператор граничных условий. Приближенное решение краевой задачи (11) ищется в виде суммы

где сk - неопределенные коэффициенты, (P) — система линейно независимых непрерывно дифференцируемых функций, удовлетворяющих однородным краевым условиям. Обозначим невязку

Коэффициенты сk определяются из условия ортогональности в области D невязки к функциям , k=1, 2, …, n.

  , k=1, 2, …, n.   (12)

Так как оператор L линеен, то (12) запишется в каноническом виде, удобном для вычислений сi:

,

или в виде

,

где .

3 а м е ч а н и е.

Можно использовать ортогональность невязки к другой линейно независимой системе функции  (Р) выбираемой из удобства вычислений получаемых интегралов.


 

А также другие работы, которые могут Вас заинтересовать

30129. Исследование методов позиционирования, а так же разработка устройства для дистанционного мониторинга технических объектов, транспортных средств и человека 873.95 KB
  Одним из основных компонентов системы позиционирования является устройство под названием GPSтрекер.4 Применение систем навигации Кроме навигации координаты получаемые благодаря спутниковым системам используются в следующих отраслях: Геодезия: с помощью систем навигации определяются точные координаты точек Картография: системы навигации используется в гражданской и военной картографии Навигация: с применением систем навигации осуществляется как морская так и дорожная навигация Спутниковый мониторинг транспорта: с помощью систем...
30130. Створення газети на тему «Молодь обирає спорт» у програмі Page Maker 639.28 KB
  Програма PageMaker є складовою частиною лінійки програмних продуктів фірми Adobe, до складу якої крім того входять Adobe Table, Adobe FrameMaker, Adobe PageMill, Adobe Photoshop, Adobe Illustrator, Adobe Streamline, Adobe Premier. Практично кожна з цих програм є світовим лідером в своїй області
30131. Создание управляющих программ с использованием сплайновой интерполяции типов AKIMA(ASPLINE), NURBS(BSPLINE) и кубического сплайна(CSPLINE). Воспроизведение сплайновой интерполяции в системе ЧПУ WinPCNC 184.33 KB
  Воспроизведение сплайновой интерполяции в системе ЧПУ WinPCNC Выполнил: студент гр. Ход Работы В процессе обучения будет рассмотрено использование сплайновой интерполяции на двух примерах. Будем использовать три основных типа сплайна: SPLINE kim сплайн BSPLINE NURBS сплайн CSPLINE кубический сплайн.
30132. Генерация и редактирование сплайн контуров. Создание и отработка управляющих программ 236.41 KB
  Полученную кривую можно сохранить в файле в формате txt, где будут записаны последовательности координат X и Y. Таким образом, с помощью программы можно не только просмотреть, как будет строиться та или иная кривая, но и использовать полученные оцифрованные точки в дальнейшем.
30133. Основы программирования в оболочке ОС UNIX 25.44 KB
  Пользователь имеет возможность присвоить переменной значение некоторой строки символов. Например команда mrk= usr ndy bin присваивает значение строки символов usr ndy bin переменной mrk типа строка символов . Для этого в соот ветствующем месте командной строки должно быть употреблено имя этой переменной которому предшествует метасимвол . Использование значения присвоенного некоторой переменной называется подстановкой.
30134. БАЗЫ ДАННЫХ 34.53 KB
  В начале работы следуют выбрать интересующего работника. После этого будут выведены данные о заданиях выбранного работника в соответствующую таблицу. При выборе конкретного задания выводятся данные о работниках.
30135. ИЗУЧЕНИЕ МОДЕЛЕЙ ВЗАИМОДЕЙСТВИЯ РАСПРЕДЕЛЕННО ВЫПОЛНЯЮЩИХСЯ ПРОЦЕССОВ 65.72 KB
  Осуществить построение топологии сети требуемого вида (рис. 3.1); выполнить широковещательную рассылку вводимого с клавиатуры сообщения от узла S на все остальные узлы. На узле, инициирующем рассылку, выводить (в виде матрицы) топологию сети и остовное дерево, на остальных хостах сети после получения сообщения выводить номер хоста и сам текст сообщения.
30136. Средства создания и сопровождения сайта 139.29 KB
  Подпись Дата Лист 2 КОГУ Проверил Бегун Э.контур утвердить Лит Листов КОГУ Лабораторная работа 9. Подпись Дата Лист 2 КОГУ Проверил Бегун Э.контур утвердить Лит Листов КОГУ создал hobby.
30137. Теория сплайнов. Параметры, влияющие на точность аппроксимации контура 3.81 MB
  SPLINE SPLINE kim spline проходит точно через заданные точки. Минимально допустимое количество точек определяется особенностями системы ЧПУ; например система ЧПУ Sinumerik позволяет построить кривые только через 6 смежных точек в то время как система ЧПУ WinPCNC через 4 точки в предельном случае можно использовать две точки но в этом случае кривая трактуется как отрезок прямой. Главная область применения этого типа сплайна прохождение через точки полученные от контрольноизмерительной машины КИМ или от аналогичных машин. В...