9898

Вторая вариация и достаточные условия экстремума

Реферат

Математика и математический анализ

Вторая вариация и достаточные условия экстремума Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, иг...

Русский

2013-03-18

178 KB

8 чел.

PAGE 14

Вторая вариация и достаточные условия экстремума

Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, играющее в этом вопросе ту же роль, что дифференциал второго порядка при исследовании экстремума функций. Этим понятием является вторая вариация.

Вариации высших порядков

Замена приращения функционала на его вариацию, как и замена приращения функции на ее дифференциал, может быть уточнена с помощью добавления членов высшего порядка малости. Это приводит к разложению в ряд

 (1)

совершенно аналогичный ряду Тейлора для функций. Здесь δ2I, δ3I, … - вариации соответственно второго, третьего и т. д. порядков (коротко - вторая, третья и т. д. вариации) функционала I. Каждая из них получается с помощью варьирования предыдущей (т.е. и т.д.), в процессе которого считается не зависящим от у, т.е. не варьируется.

Каждая из этих вариаций обладает относительно свойством однородности с соответствующим показателем:

, С=const.

Это означает, что члены в правой части (1) имеют последовательно первый, второй, третий и т. д. порядки малости относительно (точнее говоря, относительно || ||, где норма берется в том пространстве, в котором рассматривается функционал), если только не обращаются в нуль.

Ранее мы пользовались только первым членом ряда (1). В этом разделе мы будем пользоваться также и вторым членом, т.е. более точной формулой

 (2)

В конкретных примерах разложение (1), а потому и (2) получаются с помощью обычного ряда Тейлора. Например, для функционала

получаем

,

где в F,  и т. д. должны быть подставлены значения х, у, у'. Отсюда получаем для второй вариации выражение

  (3)

Отметим, что здесь, конечно, .

Условия экстремума в терминах второй вариации

Пусть функционал I{у} принимает для стационарное значение, т. е. . Другими словами, пусть выполнено основное необходимое условие для экстремума. Тогда при в правой части (2) первый член отсутствует, и потому главным становится второй. Поэтому при рассмотрении экстремума функции нескольких переменных приходим к следующим выводам:

если >0 для любой (конечно, кроме вариации δу≡0, когда δ2I = 0), то при функционал I{у} имеет минимум;

если < 0 для любой δу, то при функционал I{у} имеет максимум;

если может принимать значения обоих знаков, то при функционал I{y} имеет минимакс и экстремума не будет.

Единственный случай, когда по нельзя судить о наличии экстремума, тот, когда знака менять не может, но может обращаться в нуль (в частности, если она тождественно по равна нулю). Мы не будем здесь разбирать этот случай.

Более тщательный анализ показывает, что достаточное условие минимума в общем случае имеет вид

(C = const > 0).

Это условие для функциональных пространств более сильное, чем просто > 0. Однако для обычных задач вариационного исчисления это уточнение несущественно.

Приведенные формулировки, как и изученное ранее необходимое условие, желательно преобразовать к равносильному виду требования, наложенного непосредственно на искомую функцию у(х). Это преобразование проводится различно для разных классов функционалов. Покажем его для некоторых таких классов. Отметим, что тип экстремума (слабый или сильный) определяется выбором пространства, в котором рассматриваются функционал I{у} и разложения (1) и (2).

Необходимые условия Лежандра

Рассмотрим функционал

при некоторых граничных условиях. Вторая вариация такого функционала выражается по формуле (3).


Легко проверить, что:

если  допускает при  (не обязательно для всех таких х) положительные значения, то и допускает положительные значения;

если  допускает при  отрицательные значения, то и допускает отрицательные значения.

В самом деле, обозначим для краткости коэффициенты квадратичной формы под знаком интеграла (3), после подстановки в них , соответственно через φ(x), ψ(x), χ(x), и пусть χ(x0)>0 (a<x0<b) (мы считаем все рассматриваемые функции и их производные непрерывными, так что если  при а<х<b, то это верно и при ). Выберем в качестве функцию, график которой изображен жирной линией на рисунке. (При этом, если желать иметь дело только с функциями из С1, то уголки можно как угодно мало скруглить.) Тогда

.  (5)

Заменяя при малом ε коэффициенты их значениями в точке х0, получаем приближенные выражения для слагаемых в правой части (5)

, ψ(x0)∙0, .

Значит, при малом ε вся сумма (5) положительна, что и требовалось доказать.

Сравнивая полученный результат с условиями экстремума, приведенными выше, приходим к необходимым условиям Лежандра:

если функционал при некоторых граничных условиях имеет при (хотя бы слабый) минимум, то

, (a≤x≤b)

если же максимум, то

, (a≤x≤b).

Заодно мы получаем достаточное условие для минимакса: если для экстремали функция  принимает при  значения обоих знаков, то при функционал имеет минимакс. Необходимые условия Лежандра не являются достаточными.

Аналогично рассматриваются функционалы от нескольких функций, например от двух функций. Здесь разложения (1) и (2) также имеют место, но у и δу уже являются векторными функциями. Вторая вариация, взамен (3), приобретает вид

,

где индексы i, j принимают независимо один от другого значения 1, 2 (а в случае n искомых функций - все n значений).

Рассуждая, как выше, приходим к необходимым условиям Лежандра и в этом случае:

если функция доставляет рассматриваемому функционалу при некоторых граничных условиях минимум, то квадратичная форма

    (6)

при любом х (аxb) не должна принимать отрицательные значения, т. е. должна быть неотрицательной (все собственные значения ее матрицы должны быть ≥0);

если для будет максимум, то форма (6) должна быть всюду на отрезке ахb неположительной,

если же для экстремали матрица () имеет, хотя бы при различных х, собственные значения обоих знаков, то при функционал имеет минимакс.

Необходимое условие Якоби

Пусть для некоторой функции удовлетворяются уравнение Эйлера и граничные условия, т.е. она придает функционалу при таких условиях стационарное значение. Обозначим для кратности  и т. д. Тогда, прежде всего, в силу условий Лагранжа, если  меняет знак на интервале а≤ х≤b, то значение минимаксное. Наличие нулей у  всегда вызывает существенные осложнения. Поэтому мы будем предполагать, что  сохраняет знак, для определённости  (axb).

Обозначим на минуту δу=z в функционале (3), куда поставлено  ; тогда уравнением Эйлера для него будет

.    (7)

Оно называется уравнением Якоби для исходного функционала. Обозначим через а* точку, сопряжённую с а относительно этого уравнения. Тогда, если а*>b, то функционал (3) имеет при δу=0 минимум, а потому функционал I{y} имеет при   слабый минимум; если же а*<b, то функционал I{y} имеет при слабый минимакс. Ясно, что если  (axb), то вместо минимума надо говорить о максимуме. Эти условия экстремума, выраженные в терминах сопряжённых точек, называются условиями Якоби.

 


Прямые методы

Классический метод решения вариационных задач, основанный на сведении их к дифференциальным уравнениям Эйлера, зачастую оказывается недостаточно эффективным, несмотря на большое теоретическое значение этого метода. Хотя мы видели ряд примеров, когда уравнение Эйлера оказывалось возможным решить в квадратурах и даже в элементарных функциях, но для сколько-нибудь более сложных задач, особенно для функций нескольких переменных, такого решения не существует, и мы приходим к необходимости численно решать линейную или нелинейную краевую задачу для дифференциального уравнения, что возможно, но отнюдь не просто и здесь рассматриваться не будет. Поэтому естественно, что были разработаны методы численного решения вариационной задачи в ее исходной постановке, без перехода к уравнению Эйлера; они получили название прямых методов вариационного исчисления. 

В различных разделах математического анализа имеется, грубо говоря, два основных класса методов приближенного отыскания неизвестных функций: методы сужения числа степеней свободы и методы дискретизации. (Конечно, имеются и методы смешанного типа, а также не укладывающиеся в эти два класса). В методах первого класса независимые переменные в принципе остаются непрерывными, но функция ищется в том или ином специальном виде, включающем несколько параметров, которые затем подбираются из требования наилучшим образом удовлетворить условиям задачи; типичными представителями здесь являются метод интерполяции или метод наименьших квадратов. В более сложных задачах эти методы предоставляют обширное поле приложения физической интуиции и аналитического искусства, так как, если удается правильно предвидеть форму искомого решения, применив лишь небольшое число параметров, и удачно выбрать критерий качества приближения, то метод может оказаться чрезвычайно эффективным (в частности, если сама исходная задача содержит параметры). В методах второго класса - они называются также сеточными - мы с самого начала заменяем искомую функцию набором ее значений в узлах некоторой сетки; здесь типичными являются методы численного интегрирования обыкновенных дифференциальных уравнений. Сеточные методы обычно бывают менее специфичны (более универсальны) и более алгоритмичны, чем методы предыдущего класса; поэтому они широко применяются при работе на ЭВМ.

 

Метод Ритца для квадратичного функционала

Meтод Ритца, предложенный в 1908 г. немецким физиком и математиком В. Ритцем – также один из типичных методов сужения числа степеней свободы.

Изложим его сначала на самом простом примере отыскания экстремали функционала при граничных условиях, предположив, что функционал квадратичный:

.   (1)

Отметим, что мы здесь рассматриваем более общий - неоднородный вид квадратичного функционала. Включение членов с уу' и у' не приводит к расширению общности, так как их можно устранить интегрированием по частям, что, впрочем, в конкретных примерах делать не обязательно.

Метод Ритца состоит в том, что приближенное выражение для искомой экстремали строится в виде

   (2)

где g0(x), g1(x), ..., gn(x) - некоторые выбранные функции, тогда как параметры ck будут подбираться из условия стационарности значения функционала (1). Функция g0(x) обычно выбирается удовлетворяющей граничным условиям, причем желательно, чтобы она по возможности лучше изображала искомое решение, если о последнем что-либо известно. (После ее выбора иногда делают замену y=g0(x)+z, чтобы перейти к однородным граничным условиям z(a)=z(b)=0). Базисные (иначе координатные) функции gk(x) (k = 1,2, ..., n) выбираются удовлетворяющими однородным граничным условиям, т.е. gk(а) = gk(b) = 0; тогда при любых значениях ck сумма (2) будет удовлетворять исходным граничным условиям и, таким образом, о них можно не беспокоиться.

В теоретических исследованиях функции g1,...,gn составляют часть бесконечной системы функций

g1(x), g2(x), …, gn(x), gn+1(x), …   (3)

линейно независимой и полной в пространстве функций , удовлетворяющих условиям f(а)=f(b)=0. При этом линейная независимость означает, что ни одна из этих функций не является линейной комбинацией конечного числа остальных, а полнота - что любую такую функцию f(x) можно как угодно хорошо приблизить (в смысле C1) линейной комбинацией конечного числа функций (3). Чаще всего, если не учитывается конкретный вид функционала (1), берутся системы

, k=1, 2, 3 …   (4)

или

, k=1, 2, 3, …    (5)

можно проверить, что каждая из этих систем линейно независимая и полная в С1). Можно доказать, что если Р(х)>0 и исходная задача имеет единственное решение, то приближенные решения, построенные по методу Ритца, при  сходятся к точному. Условие единственности выполнено, например, если Q(x).

В конкретных приложениях теоремы о сходимости использовать затруднительно, они скорее имеют утешительный характер. Более реальны теоремы с двусторонними оценками отличия точного решения от приближенного; такие теоремы для метода Ритца впервые получил в 1918 г. российский математик Н. М. Крылов (1879-1955). Однако такие оценки, удобные для практического использования, получены лишь для весьма узкого класса задач, так что их на практике обычно не применяют.

При практическом применении метода стремятся к его практической сходимости, т. е. к тому, чтобы при небольшом числе базисных функций он дал решение с хорошей точностью. Здесь также можно использовать первые члены систем (4) и (5) или каких-либо иных систем. Если удается использовать конкретный вид функционала (1), то обычно скорость сходимости метода улучшается. Например, если и по смыслу задачи решение должно быть четной функцией, то ясно, что при применении системы (4) нужно пользоваться только нечетными k; но если четность решения заранее неясна, то нельзя пользоваться только четными функциями gk(x), так как при этом мы навязываем решению свойство четности, которым оно могло не обладать. Если интуиция подсказывает, что точное решение будет где-то иметь «горбик», то желательно одну из первых функций gk(x) взять с таким горбиком и т. п.

Вариационные задачи бывают двух типов: можно искать функцию, реализующую экстремальное или стационарное значение функционала, а можно искать и само это значение функционала. Ясно, что искать стационарное значение выгоднее, чем реализующую его функцию, так как ошибка в отыскании такой функции даст в соответствующем стационарном значении ошибку высшего порядка малости (сравните с задачей о нахождении стационарного значения функции одной переменной). Поэтому желательно, когда это возможно, сводить более сложные задачи к задачам на отыскание стационарных значений.

Вернемся к приближенному решению (2). Подставив его в правую часть (1), раскрыв скобки и произведя интегрирование, мы получим многочлен второй степени относительно пока еще произвольных параметров

   (6)

Ясно, что если, например, исходная задача была задачей о минимуме, то желательно подобрать параметры ck так, чтобы и выражение (6) приняло минимально возможное значение. Это же относится и к любому стационарному значению функционала (1), так как в зоне медленного изменения функционала и выражение (6) должно медленно меняться при изменении параметров. Поэтому мы приходим к системе уравнений

, k=1, 2, …, n,   (7)

из которой и надо найти параметры ck.

Введем рабочее обозначение

Тогда квадратичная часть функции (6) имеет вид

,     (8)

Поэтому (7) представляет собой систему линейных алгебраических уравнений относительно с1, c2, …, сn с симметрической матрицей

, k=1, 2, …, n.

и потому при небольшом n легко решается. Отметим, что если Р(х)>0,  и функции g1, g2, ..., gn линейно независимы, то нетрудно доказать, что квадратичная форма (8) положительно определенная, что облегчает решение системы (7). Подставив найденное решение в правую часть (2), мы и получаем приближенное решение по методу Ритца.

Метод Канторовича

Этот метод, предложенный Л. В. Канторовичем в 1933 г., представляет собой развитие метода Ритца для функционалов от функций нескольких переменных. Он состоит в том, что в качестве коэффициентов при базисных функциях берутся не неизвестные константы, а неизвестные функции от некоторой одной переменной. Тогда после подстановки в функционал и применения условий стационарности (уже вариационных!) мы получаем краевую задачу для системы обыкновенных дифференциальных уравнений относительно этих неизвестных функций. Решая эту задачу точно или численно (что, по крайней мере, в линейном случае, т. е. для квадратичного функционала, вполне доступно современным вычислительным средствам), мы и получаем приближенное решение исходной вариационной задачи. Так как функции более гибки, чем константы, то с помощью их оптимального подбора (оптимальность обеспечивается самой структурой метода) удается значительно лучше приблизиться к точному решению, чем в методе Ритца.

Пусть

   (9)

.

При применении метода Ритца к функционалу (9) выбирается следующая система координатных функций:

.

Решение ищется в виде  где Сk – неизвестные постоянные. В методе Канторовича выражение для экстремали берется в виде

   (10)

где — неизвестные функции, определяемые таким образом, чтобы функционал (9) достигал экстремального значения. Отыскание решения в виде (10) позволяет расширить класс экстремалей.

После подстановки (10) в (9) и интегрирования полученного выражения по у получается следующий функционал:

Функции  k=1, 2, …, n, должны удовлетворять системе уравнений Эйлера-Лагранжа

, k=1, 2, …, n,

a приближенное решение вида (10) – заданным граничным условиям на прямых x=а и x=b.

Метод Галеркина

Этот метод применяется для отыскания приближенных решений как вариационных задач, так и краевых задач для обыкновенных дифференциальных уравнений и уравнений в частных производных, в частности, уравнений Эйлера-Лагранжа.

Пусть неизвестная функция u(Р) удовлетворяет в некоторой области D следующей краевой задаче:

 на y ( G).  (11)

Здесь L - некоторый линейный дифференциальный оператор, Г - линейный оператор граничных условий. Приближенное решение краевой задачи (11) ищется в виде суммы

где сk - неопределенные коэффициенты, (P) — система линейно независимых непрерывно дифференцируемых функций, удовлетворяющих однородным краевым условиям. Обозначим невязку

Коэффициенты сk определяются из условия ортогональности в области D невязки к функциям , k=1, 2, …, n.

  , k=1, 2, …, n.   (12)

Так как оператор L линеен, то (12) запишется в каноническом виде, удобном для вычислений сi:

,

или в виде

,

где .

3 а м е ч а н и е.

Можно использовать ортогональность невязки к другой линейно независимой системе функции  (Р) выбираемой из удобства вычислений получаемых интегралов.


 

А также другие работы, которые могут Вас заинтересовать

37914. ИЗУЧЕНИЕ ДИФРАКЦИИ СВЕТА НА ДВУМЕРНОЙ ДИФРАКЦИОННОЙ РЕШЕТКЕ 148 KB
  Теория одномерной дифракционной решетки достаточно подробно рассматривается в курсе общей физики. Положение главных максимумов в дифракционной картине такой решетки в случае нормального падения лучей определяется выражением
37915. Изучение вращения плоскости поляризации в растворах оптически активных веществ 181 KB
  4 Вращение плоскости поляризации в кристаллах.4 Вращение плоскости поляризации в аморфных веществах и растворах.7 Теория вращения плоскости поляризации8 Экспериментальная часть.18 Лабораторная работа № 70 Изучение вращения плоскости поляризации в растворах оптически активных веществ Цель работы 1.
37916. Изучение интерференции света в клиньях 2.01 MB
  Интерференция - одно из проявления волновых свойств света. Интерференция - частный случай сложения волн, при котором наблюдается устойчивая во времени картина перераспределения в пространстве энергии световых волн. Зрительно это проявляется в том, что возникают геометрические места (точки, линии, области)
37917. Изучение магнитного поля соленоида лабораторная работа 173.5 KB
  Изучение магнитного поля соленоида. Рассмотрены характеристики магнитного поля и методика экспериментального определения величины вектора магнитной индукции с помощью датчика Холла. Характеристики магнитного поля.
37918. Изучение Эффекта Холла 240.5 KB
  Эффект Холла Изучение зависимости холловской разности потенциалов от величины силы тока JД в датчике Холла [3. Контрольные вопросы [5] Список литературы Лабораторная работа № 56 Изучение Эффекта Холла 1.
37919. ИЗУЧЕНИЕ ВИХРЕВОГО ЭЛЕКТРИЧЕСКОГО ПОЛЯ 310.5 KB
  ЛАБОРАТОРНАЯ РАБОТА № 57 ИЗУЧЕНИЕ ВИХРЕВОГО ЭЛЕКТРИЧЕСКОГО ПОЛЯ Цель работы Изучение явления электромагнитной индукции и свойств вихревого электрического поля. Уравнение Максвелла для электрического поля В 1931 году М.1 Анализируя явление электромагнитной индукции Максвелл установил что причиной появления ЭДС индукции является возникновение в контуре электрического поля.
37920. ИЗУЧЕНИЕ МАГНИТНОГО ПОЛЯ ПРЯМОЛИНЕЙНОГО ТОКА 338.5 KB
  Шатохин Изучение магнитного поля прямолинейного тока. Детально рассмотрены характеристики магнитного поля прямолинейного тока. Изложена методика экспериментального определения магнитного поля токонесущих проводников.
37921. ИЗУЧЕНИЕ ИНТЕРФЕРЕНЦИИ СВЕТА 723.5 KB
  Сагитова Изучение интерференции света: Методические указания к лабораторной работе № 61 по курсу общей физики Уфимск. Методические указания знакомят студентов с явлением интерференции света методами получения когерентных волн.4 Порядок выполнения работы [8] 4 Контрольные вопросы [9] Список литературы Лабораторная работа № 61 ИЗУЧЕНИЕ ИНТЕРФЕРЕНЦИИ СВЕТА 1 Цель работы Изучение явления интерференции света.
37922. ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ПРЕЛОМЛЕНИЯ ЖИДКИХ И ТВЕРДЫХ ТЕЛ 235.5 KB
  Сагитова Определение показателей преломления жидких и твердых тел: Методические указания к лабораторной работе №62 по разделу Оптика Уфимск. Приведены краткая теория и методы измерения показателя преломления жидких и твердых тел.1 Определение показателя преломления стекла с помощью микроскопа [2.