9898

Вторая вариация и достаточные условия экстремума

Реферат

Математика и математический анализ

Вторая вариация и достаточные условия экстремума Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, иг...

Русский

2013-03-18

178 KB

8 чел.

PAGE 14

Вторая вариация и достаточные условия экстремума

Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, играющее в этом вопросе ту же роль, что дифференциал второго порядка при исследовании экстремума функций. Этим понятием является вторая вариация.

Вариации высших порядков

Замена приращения функционала на его вариацию, как и замена приращения функции на ее дифференциал, может быть уточнена с помощью добавления членов высшего порядка малости. Это приводит к разложению в ряд

 (1)

совершенно аналогичный ряду Тейлора для функций. Здесь δ2I, δ3I, … - вариации соответственно второго, третьего и т. д. порядков (коротко - вторая, третья и т. д. вариации) функционала I. Каждая из них получается с помощью варьирования предыдущей (т.е. и т.д.), в процессе которого считается не зависящим от у, т.е. не варьируется.

Каждая из этих вариаций обладает относительно свойством однородности с соответствующим показателем:

, С=const.

Это означает, что члены в правой части (1) имеют последовательно первый, второй, третий и т. д. порядки малости относительно (точнее говоря, относительно || ||, где норма берется в том пространстве, в котором рассматривается функционал), если только не обращаются в нуль.

Ранее мы пользовались только первым членом ряда (1). В этом разделе мы будем пользоваться также и вторым членом, т.е. более точной формулой

 (2)

В конкретных примерах разложение (1), а потому и (2) получаются с помощью обычного ряда Тейлора. Например, для функционала

получаем

,

где в F,  и т. д. должны быть подставлены значения х, у, у'. Отсюда получаем для второй вариации выражение

  (3)

Отметим, что здесь, конечно, .

Условия экстремума в терминах второй вариации

Пусть функционал I{у} принимает для стационарное значение, т. е. . Другими словами, пусть выполнено основное необходимое условие для экстремума. Тогда при в правой части (2) первый член отсутствует, и потому главным становится второй. Поэтому при рассмотрении экстремума функции нескольких переменных приходим к следующим выводам:

если >0 для любой (конечно, кроме вариации δу≡0, когда δ2I = 0), то при функционал I{у} имеет минимум;

если < 0 для любой δу, то при функционал I{у} имеет максимум;

если может принимать значения обоих знаков, то при функционал I{y} имеет минимакс и экстремума не будет.

Единственный случай, когда по нельзя судить о наличии экстремума, тот, когда знака менять не может, но может обращаться в нуль (в частности, если она тождественно по равна нулю). Мы не будем здесь разбирать этот случай.

Более тщательный анализ показывает, что достаточное условие минимума в общем случае имеет вид

(C = const > 0).

Это условие для функциональных пространств более сильное, чем просто > 0. Однако для обычных задач вариационного исчисления это уточнение несущественно.

Приведенные формулировки, как и изученное ранее необходимое условие, желательно преобразовать к равносильному виду требования, наложенного непосредственно на искомую функцию у(х). Это преобразование проводится различно для разных классов функционалов. Покажем его для некоторых таких классов. Отметим, что тип экстремума (слабый или сильный) определяется выбором пространства, в котором рассматриваются функционал I{у} и разложения (1) и (2).

Необходимые условия Лежандра

Рассмотрим функционал

при некоторых граничных условиях. Вторая вариация такого функционала выражается по формуле (3).


Легко проверить, что:

если  допускает при  (не обязательно для всех таких х) положительные значения, то и допускает положительные значения;

если  допускает при  отрицательные значения, то и допускает отрицательные значения.

В самом деле, обозначим для краткости коэффициенты квадратичной формы под знаком интеграла (3), после подстановки в них , соответственно через φ(x), ψ(x), χ(x), и пусть χ(x0)>0 (a<x0<b) (мы считаем все рассматриваемые функции и их производные непрерывными, так что если  при а<х<b, то это верно и при ). Выберем в качестве функцию, график которой изображен жирной линией на рисунке. (При этом, если желать иметь дело только с функциями из С1, то уголки можно как угодно мало скруглить.) Тогда

.  (5)

Заменяя при малом ε коэффициенты их значениями в точке х0, получаем приближенные выражения для слагаемых в правой части (5)

, ψ(x0)∙0, .

Значит, при малом ε вся сумма (5) положительна, что и требовалось доказать.

Сравнивая полученный результат с условиями экстремума, приведенными выше, приходим к необходимым условиям Лежандра:

если функционал при некоторых граничных условиях имеет при (хотя бы слабый) минимум, то

, (a≤x≤b)

если же максимум, то

, (a≤x≤b).

Заодно мы получаем достаточное условие для минимакса: если для экстремали функция  принимает при  значения обоих знаков, то при функционал имеет минимакс. Необходимые условия Лежандра не являются достаточными.

Аналогично рассматриваются функционалы от нескольких функций, например от двух функций. Здесь разложения (1) и (2) также имеют место, но у и δу уже являются векторными функциями. Вторая вариация, взамен (3), приобретает вид

,

где индексы i, j принимают независимо один от другого значения 1, 2 (а в случае n искомых функций - все n значений).

Рассуждая, как выше, приходим к необходимым условиям Лежандра и в этом случае:

если функция доставляет рассматриваемому функционалу при некоторых граничных условиях минимум, то квадратичная форма

    (6)

при любом х (аxb) не должна принимать отрицательные значения, т. е. должна быть неотрицательной (все собственные значения ее матрицы должны быть ≥0);

если для будет максимум, то форма (6) должна быть всюду на отрезке ахb неположительной,

если же для экстремали матрица () имеет, хотя бы при различных х, собственные значения обоих знаков, то при функционал имеет минимакс.

Необходимое условие Якоби

Пусть для некоторой функции удовлетворяются уравнение Эйлера и граничные условия, т.е. она придает функционалу при таких условиях стационарное значение. Обозначим для кратности  и т. д. Тогда, прежде всего, в силу условий Лагранжа, если  меняет знак на интервале а≤ х≤b, то значение минимаксное. Наличие нулей у  всегда вызывает существенные осложнения. Поэтому мы будем предполагать, что  сохраняет знак, для определённости  (axb).

Обозначим на минуту δу=z в функционале (3), куда поставлено  ; тогда уравнением Эйлера для него будет

.    (7)

Оно называется уравнением Якоби для исходного функционала. Обозначим через а* точку, сопряжённую с а относительно этого уравнения. Тогда, если а*>b, то функционал (3) имеет при δу=0 минимум, а потому функционал I{y} имеет при   слабый минимум; если же а*<b, то функционал I{y} имеет при слабый минимакс. Ясно, что если  (axb), то вместо минимума надо говорить о максимуме. Эти условия экстремума, выраженные в терминах сопряжённых точек, называются условиями Якоби.

 


Прямые методы

Классический метод решения вариационных задач, основанный на сведении их к дифференциальным уравнениям Эйлера, зачастую оказывается недостаточно эффективным, несмотря на большое теоретическое значение этого метода. Хотя мы видели ряд примеров, когда уравнение Эйлера оказывалось возможным решить в квадратурах и даже в элементарных функциях, но для сколько-нибудь более сложных задач, особенно для функций нескольких переменных, такого решения не существует, и мы приходим к необходимости численно решать линейную или нелинейную краевую задачу для дифференциального уравнения, что возможно, но отнюдь не просто и здесь рассматриваться не будет. Поэтому естественно, что были разработаны методы численного решения вариационной задачи в ее исходной постановке, без перехода к уравнению Эйлера; они получили название прямых методов вариационного исчисления. 

В различных разделах математического анализа имеется, грубо говоря, два основных класса методов приближенного отыскания неизвестных функций: методы сужения числа степеней свободы и методы дискретизации. (Конечно, имеются и методы смешанного типа, а также не укладывающиеся в эти два класса). В методах первого класса независимые переменные в принципе остаются непрерывными, но функция ищется в том или ином специальном виде, включающем несколько параметров, которые затем подбираются из требования наилучшим образом удовлетворить условиям задачи; типичными представителями здесь являются метод интерполяции или метод наименьших квадратов. В более сложных задачах эти методы предоставляют обширное поле приложения физической интуиции и аналитического искусства, так как, если удается правильно предвидеть форму искомого решения, применив лишь небольшое число параметров, и удачно выбрать критерий качества приближения, то метод может оказаться чрезвычайно эффективным (в частности, если сама исходная задача содержит параметры). В методах второго класса - они называются также сеточными - мы с самого начала заменяем искомую функцию набором ее значений в узлах некоторой сетки; здесь типичными являются методы численного интегрирования обыкновенных дифференциальных уравнений. Сеточные методы обычно бывают менее специфичны (более универсальны) и более алгоритмичны, чем методы предыдущего класса; поэтому они широко применяются при работе на ЭВМ.

 

Метод Ритца для квадратичного функционала

Meтод Ритца, предложенный в 1908 г. немецким физиком и математиком В. Ритцем – также один из типичных методов сужения числа степеней свободы.

Изложим его сначала на самом простом примере отыскания экстремали функционала при граничных условиях, предположив, что функционал квадратичный:

.   (1)

Отметим, что мы здесь рассматриваем более общий - неоднородный вид квадратичного функционала. Включение членов с уу' и у' не приводит к расширению общности, так как их можно устранить интегрированием по частям, что, впрочем, в конкретных примерах делать не обязательно.

Метод Ритца состоит в том, что приближенное выражение для искомой экстремали строится в виде

   (2)

где g0(x), g1(x), ..., gn(x) - некоторые выбранные функции, тогда как параметры ck будут подбираться из условия стационарности значения функционала (1). Функция g0(x) обычно выбирается удовлетворяющей граничным условиям, причем желательно, чтобы она по возможности лучше изображала искомое решение, если о последнем что-либо известно. (После ее выбора иногда делают замену y=g0(x)+z, чтобы перейти к однородным граничным условиям z(a)=z(b)=0). Базисные (иначе координатные) функции gk(x) (k = 1,2, ..., n) выбираются удовлетворяющими однородным граничным условиям, т.е. gk(а) = gk(b) = 0; тогда при любых значениях ck сумма (2) будет удовлетворять исходным граничным условиям и, таким образом, о них можно не беспокоиться.

В теоретических исследованиях функции g1,...,gn составляют часть бесконечной системы функций

g1(x), g2(x), …, gn(x), gn+1(x), …   (3)

линейно независимой и полной в пространстве функций , удовлетворяющих условиям f(а)=f(b)=0. При этом линейная независимость означает, что ни одна из этих функций не является линейной комбинацией конечного числа остальных, а полнота - что любую такую функцию f(x) можно как угодно хорошо приблизить (в смысле C1) линейной комбинацией конечного числа функций (3). Чаще всего, если не учитывается конкретный вид функционала (1), берутся системы

, k=1, 2, 3 …   (4)

или

, k=1, 2, 3, …    (5)

можно проверить, что каждая из этих систем линейно независимая и полная в С1). Можно доказать, что если Р(х)>0 и исходная задача имеет единственное решение, то приближенные решения, построенные по методу Ритца, при  сходятся к точному. Условие единственности выполнено, например, если Q(x).

В конкретных приложениях теоремы о сходимости использовать затруднительно, они скорее имеют утешительный характер. Более реальны теоремы с двусторонними оценками отличия точного решения от приближенного; такие теоремы для метода Ритца впервые получил в 1918 г. российский математик Н. М. Крылов (1879-1955). Однако такие оценки, удобные для практического использования, получены лишь для весьма узкого класса задач, так что их на практике обычно не применяют.

При практическом применении метода стремятся к его практической сходимости, т. е. к тому, чтобы при небольшом числе базисных функций он дал решение с хорошей точностью. Здесь также можно использовать первые члены систем (4) и (5) или каких-либо иных систем. Если удается использовать конкретный вид функционала (1), то обычно скорость сходимости метода улучшается. Например, если и по смыслу задачи решение должно быть четной функцией, то ясно, что при применении системы (4) нужно пользоваться только нечетными k; но если четность решения заранее неясна, то нельзя пользоваться только четными функциями gk(x), так как при этом мы навязываем решению свойство четности, которым оно могло не обладать. Если интуиция подсказывает, что точное решение будет где-то иметь «горбик», то желательно одну из первых функций gk(x) взять с таким горбиком и т. п.

Вариационные задачи бывают двух типов: можно искать функцию, реализующую экстремальное или стационарное значение функционала, а можно искать и само это значение функционала. Ясно, что искать стационарное значение выгоднее, чем реализующую его функцию, так как ошибка в отыскании такой функции даст в соответствующем стационарном значении ошибку высшего порядка малости (сравните с задачей о нахождении стационарного значения функции одной переменной). Поэтому желательно, когда это возможно, сводить более сложные задачи к задачам на отыскание стационарных значений.

Вернемся к приближенному решению (2). Подставив его в правую часть (1), раскрыв скобки и произведя интегрирование, мы получим многочлен второй степени относительно пока еще произвольных параметров

   (6)

Ясно, что если, например, исходная задача была задачей о минимуме, то желательно подобрать параметры ck так, чтобы и выражение (6) приняло минимально возможное значение. Это же относится и к любому стационарному значению функционала (1), так как в зоне медленного изменения функционала и выражение (6) должно медленно меняться при изменении параметров. Поэтому мы приходим к системе уравнений

, k=1, 2, …, n,   (7)

из которой и надо найти параметры ck.

Введем рабочее обозначение

Тогда квадратичная часть функции (6) имеет вид

,     (8)

Поэтому (7) представляет собой систему линейных алгебраических уравнений относительно с1, c2, …, сn с симметрической матрицей

, k=1, 2, …, n.

и потому при небольшом n легко решается. Отметим, что если Р(х)>0,  и функции g1, g2, ..., gn линейно независимы, то нетрудно доказать, что квадратичная форма (8) положительно определенная, что облегчает решение системы (7). Подставив найденное решение в правую часть (2), мы и получаем приближенное решение по методу Ритца.

Метод Канторовича

Этот метод, предложенный Л. В. Канторовичем в 1933 г., представляет собой развитие метода Ритца для функционалов от функций нескольких переменных. Он состоит в том, что в качестве коэффициентов при базисных функциях берутся не неизвестные константы, а неизвестные функции от некоторой одной переменной. Тогда после подстановки в функционал и применения условий стационарности (уже вариационных!) мы получаем краевую задачу для системы обыкновенных дифференциальных уравнений относительно этих неизвестных функций. Решая эту задачу точно или численно (что, по крайней мере, в линейном случае, т. е. для квадратичного функционала, вполне доступно современным вычислительным средствам), мы и получаем приближенное решение исходной вариационной задачи. Так как функции более гибки, чем константы, то с помощью их оптимального подбора (оптимальность обеспечивается самой структурой метода) удается значительно лучше приблизиться к точному решению, чем в методе Ритца.

Пусть

   (9)

.

При применении метода Ритца к функционалу (9) выбирается следующая система координатных функций:

.

Решение ищется в виде  где Сk – неизвестные постоянные. В методе Канторовича выражение для экстремали берется в виде

   (10)

где — неизвестные функции, определяемые таким образом, чтобы функционал (9) достигал экстремального значения. Отыскание решения в виде (10) позволяет расширить класс экстремалей.

После подстановки (10) в (9) и интегрирования полученного выражения по у получается следующий функционал:

Функции  k=1, 2, …, n, должны удовлетворять системе уравнений Эйлера-Лагранжа

, k=1, 2, …, n,

a приближенное решение вида (10) – заданным граничным условиям на прямых x=а и x=b.

Метод Галеркина

Этот метод применяется для отыскания приближенных решений как вариационных задач, так и краевых задач для обыкновенных дифференциальных уравнений и уравнений в частных производных, в частности, уравнений Эйлера-Лагранжа.

Пусть неизвестная функция u(Р) удовлетворяет в некоторой области D следующей краевой задаче:

 на y ( G).  (11)

Здесь L - некоторый линейный дифференциальный оператор, Г - линейный оператор граничных условий. Приближенное решение краевой задачи (11) ищется в виде суммы

где сk - неопределенные коэффициенты, (P) — система линейно независимых непрерывно дифференцируемых функций, удовлетворяющих однородным краевым условиям. Обозначим невязку

Коэффициенты сk определяются из условия ортогональности в области D невязки к функциям , k=1, 2, …, n.

  , k=1, 2, …, n.   (12)

Так как оператор L линеен, то (12) запишется в каноническом виде, удобном для вычислений сi:

,

или в виде

,

где .

3 а м е ч а н и е.

Можно использовать ортогональность невязки к другой линейно независимой системе функции  (Р) выбираемой из удобства вычислений получаемых интегралов.


 

А также другие работы, которые могут Вас заинтересовать

21324. Криптографическая защита информации 144.5 KB
  Кpиптоанализ исследование возможности расшифровывания информации без знания ключей.Шеннона €œТеория связи в секретных системах€ стала началом новой эры научной криптологии с секретными ключами. Классификация криптографических систем Тайнопись Криптография с ключом Симметричные криптоалгоритмы Шифры перестановки Шифры замены подстановки Простой замены Сложной замены Сложные составные шифры Асимметричные криптоалгоритмы Комбинированные гибридные криптосистемы Тайнопись Отправитель и получатель производят над сообщением...
21325. Симметричное и асимметричное шифрование 1.88 MB
  Шифрование это преобразование данных в нечитабельную форму используя ключи шифрования расшифрования дешифрования. Она состоит из: одного или более алгоритмов шифрования математических формул; ключей используемых этими алгоритмами шифрования; системы управления ключами; незашифрованного текста; и зашифрованного текста шифртекста. Существуют две методологии криптографической обработки информации с использованием ключей – симметричная и асимметричная. Симметричная секретная методология где и для шифрования и для расшифровки...
21326. Межсетевой экран 214 KB
  Владелец компьютера имеющего выход в Internet устанавливает межсетевой экран чтобы предотвратить получение посторонними конфиденциальных данных хранящихся на защищаемом компьютере рис. Если с другой стороны это приложение таково что по вашему мнению оно не должно взаимодействовать с другим компьютером например текстовый редактор или новая игра загруженная из Internet то скорее всего вы создадите правило которое будет блокировать передачу пакетов этим приложением. Но тем не менее самой защищенной является сеть которая...
21327. Основные понятия информационной безопасности 59 KB
  Информация и формы ее существования на объекте Информация Сведения о лицах предметах фактах событиях явлениях и процессах независимо от формы их представления закон об информации Информация это то что дает возможность получателю логически сформулировать или изменить представление о некоторой структуре образ схема модель. Информация Сведения раскрываемые технической разведкой через демаскирующие признаки объектов защиты или путем несанкционированного доступа к техническим средствам обработки информации. Справочник ВНИИ...
21328. СИСТЕМА ІНТЕЛЕКТУАЛЬНОЇ ВЛАСНОСТІ 80 KB
  Винахід (корисна модель) - це результат інтелектуальної діяльності людини в будь-якій сфері технології. Винахід (корисна модель) може бути секретним, якщо містить інформацію, віднесену до державної таємниці.
21329. Политика информационной безопасности 174 KB
  Лекция: Политика Рассмотрены вопросы политики информационной безопасности методика разработки политик создания развертывания и эффективного использования. Наверное самая неинтересная часть профессиональной работы в сфере информационной безопасности это разработка политики. Но политика имеет огромное значение для организации и вероятно является наиболее важной работой отдела информационной безопасности. Таким образом политика выполняет две основные функции: определяет безопасность внутри организации; определяет место каждого служащего...
21330. Протоколирование и аудит 94.5 KB
  Реализация протоколирования и аудита решает следующие задачи: обеспечение подотчетности пользователей и администраторов; обеспечение возможности реконструкции последовательности событий; обнаружение попыток нарушений информационной безопасности; предоставление информации для выявления и анализа проблем. Разумный подход к упомянутым вопросам применительно к операционным системам предлагается в Оранжевой книге где выделены следующие события: вход в систему успешный или нет; выход из системы; обращение к удаленной системе; операции с...
21331. Службы информационной безопасности 246.5 KB
  Службы информационной безопасности и типы атак Атаки Службы безопасности Конфиденциальность Целостность Доступность Идентифицируемость Доступа X X Модификации X X Отказ в обслуживании X Отказ от обязательств X X Конфиденциальность Служба конфиденциальности обеспечивает секретность информации. Правильно сконфигурированная эта служба открывает доступ к информации только аутентифицированным пользователям. Выполняя эту функцию служба конфиденциальности ограждает системы от атак доступа.
21332. Информационная культура 27 KB
  Для отражения этого факта был введен термин информационная культура. Информационная культура это умение целенаправленно работать с информацией и использовать для ее получения обработки и передачи компьютерную информационную технологию современные технические средства и методы. Информационная культура в узком смысле это уровень развития сферы информационного общения людей а также характеристика информационной сферы жизнедеятельности человека в которой мы можем отметить степень достигнутого количество и качество созданного...