9898

Вторая вариация и достаточные условия экстремума

Реферат

Математика и математический анализ

Вторая вариация и достаточные условия экстремума Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, иг...

Русский

2013-03-18

178 KB

8 чел.

PAGE 14

Вторая вариация и достаточные условия экстремума

Вспоминая о глубокой аналогии между дифференциальным и вариационным исчислениями, естественно ожидать, что при переходе к достаточным условиям экстремума функционалов будет введено понятие, играющее в этом вопросе ту же роль, что дифференциал второго порядка при исследовании экстремума функций. Этим понятием является вторая вариация.

Вариации высших порядков

Замена приращения функционала на его вариацию, как и замена приращения функции на ее дифференциал, может быть уточнена с помощью добавления членов высшего порядка малости. Это приводит к разложению в ряд

 (1)

совершенно аналогичный ряду Тейлора для функций. Здесь δ2I, δ3I, … - вариации соответственно второго, третьего и т. д. порядков (коротко - вторая, третья и т. д. вариации) функционала I. Каждая из них получается с помощью варьирования предыдущей (т.е. и т.д.), в процессе которого считается не зависящим от у, т.е. не варьируется.

Каждая из этих вариаций обладает относительно свойством однородности с соответствующим показателем:

, С=const.

Это означает, что члены в правой части (1) имеют последовательно первый, второй, третий и т. д. порядки малости относительно (точнее говоря, относительно || ||, где норма берется в том пространстве, в котором рассматривается функционал), если только не обращаются в нуль.

Ранее мы пользовались только первым членом ряда (1). В этом разделе мы будем пользоваться также и вторым членом, т.е. более точной формулой

 (2)

В конкретных примерах разложение (1), а потому и (2) получаются с помощью обычного ряда Тейлора. Например, для функционала

получаем

,

где в F,  и т. д. должны быть подставлены значения х, у, у'. Отсюда получаем для второй вариации выражение

  (3)

Отметим, что здесь, конечно, .

Условия экстремума в терминах второй вариации

Пусть функционал I{у} принимает для стационарное значение, т. е. . Другими словами, пусть выполнено основное необходимое условие для экстремума. Тогда при в правой части (2) первый член отсутствует, и потому главным становится второй. Поэтому при рассмотрении экстремума функции нескольких переменных приходим к следующим выводам:

если >0 для любой (конечно, кроме вариации δу≡0, когда δ2I = 0), то при функционал I{у} имеет минимум;

если < 0 для любой δу, то при функционал I{у} имеет максимум;

если может принимать значения обоих знаков, то при функционал I{y} имеет минимакс и экстремума не будет.

Единственный случай, когда по нельзя судить о наличии экстремума, тот, когда знака менять не может, но может обращаться в нуль (в частности, если она тождественно по равна нулю). Мы не будем здесь разбирать этот случай.

Более тщательный анализ показывает, что достаточное условие минимума в общем случае имеет вид

(C = const > 0).

Это условие для функциональных пространств более сильное, чем просто > 0. Однако для обычных задач вариационного исчисления это уточнение несущественно.

Приведенные формулировки, как и изученное ранее необходимое условие, желательно преобразовать к равносильному виду требования, наложенного непосредственно на искомую функцию у(х). Это преобразование проводится различно для разных классов функционалов. Покажем его для некоторых таких классов. Отметим, что тип экстремума (слабый или сильный) определяется выбором пространства, в котором рассматриваются функционал I{у} и разложения (1) и (2).

Необходимые условия Лежандра

Рассмотрим функционал

при некоторых граничных условиях. Вторая вариация такого функционала выражается по формуле (3).


Легко проверить, что:

если  допускает при  (не обязательно для всех таких х) положительные значения, то и допускает положительные значения;

если  допускает при  отрицательные значения, то и допускает отрицательные значения.

В самом деле, обозначим для краткости коэффициенты квадратичной формы под знаком интеграла (3), после подстановки в них , соответственно через φ(x), ψ(x), χ(x), и пусть χ(x0)>0 (a<x0<b) (мы считаем все рассматриваемые функции и их производные непрерывными, так что если  при а<х<b, то это верно и при ). Выберем в качестве функцию, график которой изображен жирной линией на рисунке. (При этом, если желать иметь дело только с функциями из С1, то уголки можно как угодно мало скруглить.) Тогда

.  (5)

Заменяя при малом ε коэффициенты их значениями в точке х0, получаем приближенные выражения для слагаемых в правой части (5)

, ψ(x0)∙0, .

Значит, при малом ε вся сумма (5) положительна, что и требовалось доказать.

Сравнивая полученный результат с условиями экстремума, приведенными выше, приходим к необходимым условиям Лежандра:

если функционал при некоторых граничных условиях имеет при (хотя бы слабый) минимум, то

, (a≤x≤b)

если же максимум, то

, (a≤x≤b).

Заодно мы получаем достаточное условие для минимакса: если для экстремали функция  принимает при  значения обоих знаков, то при функционал имеет минимакс. Необходимые условия Лежандра не являются достаточными.

Аналогично рассматриваются функционалы от нескольких функций, например от двух функций. Здесь разложения (1) и (2) также имеют место, но у и δу уже являются векторными функциями. Вторая вариация, взамен (3), приобретает вид

,

где индексы i, j принимают независимо один от другого значения 1, 2 (а в случае n искомых функций - все n значений).

Рассуждая, как выше, приходим к необходимым условиям Лежандра и в этом случае:

если функция доставляет рассматриваемому функционалу при некоторых граничных условиях минимум, то квадратичная форма

    (6)

при любом х (аxb) не должна принимать отрицательные значения, т. е. должна быть неотрицательной (все собственные значения ее матрицы должны быть ≥0);

если для будет максимум, то форма (6) должна быть всюду на отрезке ахb неположительной,

если же для экстремали матрица () имеет, хотя бы при различных х, собственные значения обоих знаков, то при функционал имеет минимакс.

Необходимое условие Якоби

Пусть для некоторой функции удовлетворяются уравнение Эйлера и граничные условия, т.е. она придает функционалу при таких условиях стационарное значение. Обозначим для кратности  и т. д. Тогда, прежде всего, в силу условий Лагранжа, если  меняет знак на интервале а≤ х≤b, то значение минимаксное. Наличие нулей у  всегда вызывает существенные осложнения. Поэтому мы будем предполагать, что  сохраняет знак, для определённости  (axb).

Обозначим на минуту δу=z в функционале (3), куда поставлено  ; тогда уравнением Эйлера для него будет

.    (7)

Оно называется уравнением Якоби для исходного функционала. Обозначим через а* точку, сопряжённую с а относительно этого уравнения. Тогда, если а*>b, то функционал (3) имеет при δу=0 минимум, а потому функционал I{y} имеет при   слабый минимум; если же а*<b, то функционал I{y} имеет при слабый минимакс. Ясно, что если  (axb), то вместо минимума надо говорить о максимуме. Эти условия экстремума, выраженные в терминах сопряжённых точек, называются условиями Якоби.

 


Прямые методы

Классический метод решения вариационных задач, основанный на сведении их к дифференциальным уравнениям Эйлера, зачастую оказывается недостаточно эффективным, несмотря на большое теоретическое значение этого метода. Хотя мы видели ряд примеров, когда уравнение Эйлера оказывалось возможным решить в квадратурах и даже в элементарных функциях, но для сколько-нибудь более сложных задач, особенно для функций нескольких переменных, такого решения не существует, и мы приходим к необходимости численно решать линейную или нелинейную краевую задачу для дифференциального уравнения, что возможно, но отнюдь не просто и здесь рассматриваться не будет. Поэтому естественно, что были разработаны методы численного решения вариационной задачи в ее исходной постановке, без перехода к уравнению Эйлера; они получили название прямых методов вариационного исчисления. 

В различных разделах математического анализа имеется, грубо говоря, два основных класса методов приближенного отыскания неизвестных функций: методы сужения числа степеней свободы и методы дискретизации. (Конечно, имеются и методы смешанного типа, а также не укладывающиеся в эти два класса). В методах первого класса независимые переменные в принципе остаются непрерывными, но функция ищется в том или ином специальном виде, включающем несколько параметров, которые затем подбираются из требования наилучшим образом удовлетворить условиям задачи; типичными представителями здесь являются метод интерполяции или метод наименьших квадратов. В более сложных задачах эти методы предоставляют обширное поле приложения физической интуиции и аналитического искусства, так как, если удается правильно предвидеть форму искомого решения, применив лишь небольшое число параметров, и удачно выбрать критерий качества приближения, то метод может оказаться чрезвычайно эффективным (в частности, если сама исходная задача содержит параметры). В методах второго класса - они называются также сеточными - мы с самого начала заменяем искомую функцию набором ее значений в узлах некоторой сетки; здесь типичными являются методы численного интегрирования обыкновенных дифференциальных уравнений. Сеточные методы обычно бывают менее специфичны (более универсальны) и более алгоритмичны, чем методы предыдущего класса; поэтому они широко применяются при работе на ЭВМ.

 

Метод Ритца для квадратичного функционала

Meтод Ритца, предложенный в 1908 г. немецким физиком и математиком В. Ритцем – также один из типичных методов сужения числа степеней свободы.

Изложим его сначала на самом простом примере отыскания экстремали функционала при граничных условиях, предположив, что функционал квадратичный:

.   (1)

Отметим, что мы здесь рассматриваем более общий - неоднородный вид квадратичного функционала. Включение членов с уу' и у' не приводит к расширению общности, так как их можно устранить интегрированием по частям, что, впрочем, в конкретных примерах делать не обязательно.

Метод Ритца состоит в том, что приближенное выражение для искомой экстремали строится в виде

   (2)

где g0(x), g1(x), ..., gn(x) - некоторые выбранные функции, тогда как параметры ck будут подбираться из условия стационарности значения функционала (1). Функция g0(x) обычно выбирается удовлетворяющей граничным условиям, причем желательно, чтобы она по возможности лучше изображала искомое решение, если о последнем что-либо известно. (После ее выбора иногда делают замену y=g0(x)+z, чтобы перейти к однородным граничным условиям z(a)=z(b)=0). Базисные (иначе координатные) функции gk(x) (k = 1,2, ..., n) выбираются удовлетворяющими однородным граничным условиям, т.е. gk(а) = gk(b) = 0; тогда при любых значениях ck сумма (2) будет удовлетворять исходным граничным условиям и, таким образом, о них можно не беспокоиться.

В теоретических исследованиях функции g1,...,gn составляют часть бесконечной системы функций

g1(x), g2(x), …, gn(x), gn+1(x), …   (3)

линейно независимой и полной в пространстве функций , удовлетворяющих условиям f(а)=f(b)=0. При этом линейная независимость означает, что ни одна из этих функций не является линейной комбинацией конечного числа остальных, а полнота - что любую такую функцию f(x) можно как угодно хорошо приблизить (в смысле C1) линейной комбинацией конечного числа функций (3). Чаще всего, если не учитывается конкретный вид функционала (1), берутся системы

, k=1, 2, 3 …   (4)

или

, k=1, 2, 3, …    (5)

можно проверить, что каждая из этих систем линейно независимая и полная в С1). Можно доказать, что если Р(х)>0 и исходная задача имеет единственное решение, то приближенные решения, построенные по методу Ритца, при  сходятся к точному. Условие единственности выполнено, например, если Q(x).

В конкретных приложениях теоремы о сходимости использовать затруднительно, они скорее имеют утешительный характер. Более реальны теоремы с двусторонними оценками отличия точного решения от приближенного; такие теоремы для метода Ритца впервые получил в 1918 г. российский математик Н. М. Крылов (1879-1955). Однако такие оценки, удобные для практического использования, получены лишь для весьма узкого класса задач, так что их на практике обычно не применяют.

При практическом применении метода стремятся к его практической сходимости, т. е. к тому, чтобы при небольшом числе базисных функций он дал решение с хорошей точностью. Здесь также можно использовать первые члены систем (4) и (5) или каких-либо иных систем. Если удается использовать конкретный вид функционала (1), то обычно скорость сходимости метода улучшается. Например, если и по смыслу задачи решение должно быть четной функцией, то ясно, что при применении системы (4) нужно пользоваться только нечетными k; но если четность решения заранее неясна, то нельзя пользоваться только четными функциями gk(x), так как при этом мы навязываем решению свойство четности, которым оно могло не обладать. Если интуиция подсказывает, что точное решение будет где-то иметь «горбик», то желательно одну из первых функций gk(x) взять с таким горбиком и т. п.

Вариационные задачи бывают двух типов: можно искать функцию, реализующую экстремальное или стационарное значение функционала, а можно искать и само это значение функционала. Ясно, что искать стационарное значение выгоднее, чем реализующую его функцию, так как ошибка в отыскании такой функции даст в соответствующем стационарном значении ошибку высшего порядка малости (сравните с задачей о нахождении стационарного значения функции одной переменной). Поэтому желательно, когда это возможно, сводить более сложные задачи к задачам на отыскание стационарных значений.

Вернемся к приближенному решению (2). Подставив его в правую часть (1), раскрыв скобки и произведя интегрирование, мы получим многочлен второй степени относительно пока еще произвольных параметров

   (6)

Ясно, что если, например, исходная задача была задачей о минимуме, то желательно подобрать параметры ck так, чтобы и выражение (6) приняло минимально возможное значение. Это же относится и к любому стационарному значению функционала (1), так как в зоне медленного изменения функционала и выражение (6) должно медленно меняться при изменении параметров. Поэтому мы приходим к системе уравнений

, k=1, 2, …, n,   (7)

из которой и надо найти параметры ck.

Введем рабочее обозначение

Тогда квадратичная часть функции (6) имеет вид

,     (8)

Поэтому (7) представляет собой систему линейных алгебраических уравнений относительно с1, c2, …, сn с симметрической матрицей

, k=1, 2, …, n.

и потому при небольшом n легко решается. Отметим, что если Р(х)>0,  и функции g1, g2, ..., gn линейно независимы, то нетрудно доказать, что квадратичная форма (8) положительно определенная, что облегчает решение системы (7). Подставив найденное решение в правую часть (2), мы и получаем приближенное решение по методу Ритца.

Метод Канторовича

Этот метод, предложенный Л. В. Канторовичем в 1933 г., представляет собой развитие метода Ритца для функционалов от функций нескольких переменных. Он состоит в том, что в качестве коэффициентов при базисных функциях берутся не неизвестные константы, а неизвестные функции от некоторой одной переменной. Тогда после подстановки в функционал и применения условий стационарности (уже вариационных!) мы получаем краевую задачу для системы обыкновенных дифференциальных уравнений относительно этих неизвестных функций. Решая эту задачу точно или численно (что, по крайней мере, в линейном случае, т. е. для квадратичного функционала, вполне доступно современным вычислительным средствам), мы и получаем приближенное решение исходной вариационной задачи. Так как функции более гибки, чем константы, то с помощью их оптимального подбора (оптимальность обеспечивается самой структурой метода) удается значительно лучше приблизиться к точному решению, чем в методе Ритца.

Пусть

   (9)

.

При применении метода Ритца к функционалу (9) выбирается следующая система координатных функций:

.

Решение ищется в виде  где Сk – неизвестные постоянные. В методе Канторовича выражение для экстремали берется в виде

   (10)

где — неизвестные функции, определяемые таким образом, чтобы функционал (9) достигал экстремального значения. Отыскание решения в виде (10) позволяет расширить класс экстремалей.

После подстановки (10) в (9) и интегрирования полученного выражения по у получается следующий функционал:

Функции  k=1, 2, …, n, должны удовлетворять системе уравнений Эйлера-Лагранжа

, k=1, 2, …, n,

a приближенное решение вида (10) – заданным граничным условиям на прямых x=а и x=b.

Метод Галеркина

Этот метод применяется для отыскания приближенных решений как вариационных задач, так и краевых задач для обыкновенных дифференциальных уравнений и уравнений в частных производных, в частности, уравнений Эйлера-Лагранжа.

Пусть неизвестная функция u(Р) удовлетворяет в некоторой области D следующей краевой задаче:

 на y ( G).  (11)

Здесь L - некоторый линейный дифференциальный оператор, Г - линейный оператор граничных условий. Приближенное решение краевой задачи (11) ищется в виде суммы

где сk - неопределенные коэффициенты, (P) — система линейно независимых непрерывно дифференцируемых функций, удовлетворяющих однородным краевым условиям. Обозначим невязку

Коэффициенты сk определяются из условия ортогональности в области D невязки к функциям , k=1, 2, …, n.

  , k=1, 2, …, n.   (12)

Так как оператор L линеен, то (12) запишется в каноническом виде, удобном для вычислений сi:

,

или в виде

,

где .

3 а м е ч а н и е.

Можно использовать ортогональность невязки к другой линейно независимой системе функции  (Р) выбираемой из удобства вычислений получаемых интегралов.


 

А также другие работы, которые могут Вас заинтересовать

80554. Джерела санації підрприємств 95 KB
  У цьому випадку мова іде насамперед про зменшення статутного фонду за рахунок зменшення номінальної вартості акцій та зменшення їх кількості з метою: одержання санаційного прибутку з наступним спрямуванням його на покриття балансових збитків; приведення у відповідність розміру основних та оборотних засобів підприємства з розміром його власного капіталу та ін. Санаційний прибуток це прибуток який виникає внаслідок викупу підприємством власних корпоративних прав акцій паїв за курсом нижчим від номінальної вартості цих...
80555. Реорганізація і банкрутство підприємства 157.5 KB
  Тема: Реорганізація і банкрутство підприємства. Зовнішнім показником банкрутства неспроможності підприємства є припинення його поточних платежів і нездатність забезпечити виконання вимог кредиторів якщо вони сукупно складають не менше 300 мінімальних розмірів заробітної плати і не були задоволені боржником протягом як правило трьох місяців з дня настання строків їх виконання. До зовнішніх можна віднести: скорочення попиту на продукцію підприємства і спад цін на неї; зростання цін на сировину матеріали й енер горесурси; економічна...
80556. Особливості організації фінансів на підприємствах різних форм господарювання. Фінансовий механізм 142 KB
  Корпоративними є підприємства створені у формі господарських товариств: повного товариства товариства з обмеженою відповідальністю товариства з додатковою відповідальністю командитного товариства акціонерного товариства тощо. Підприємство колективної власності корпоративне або унітарне підприємство що діє на основі колективної власності засновників зокрема господарські товариства це підприємства...
80557. Доходність і прибутковість підприємств 231 KB
  Для кожного підприємства важливо знати його фінансовий стан у плановому періоді згідно з передбачуваними витратами і конюнктурою ринку на ті види продукції які воно виробляє і реалізує. Насамперед менеджерам підприємства треба знати при якому обсязі реалізації того чи іншого виду продукції обсяг продажу досягається беззбитковість виробництва нульова рентабельність. Менеджерам підприємства також важливо знати на скільки потрібно збільшити обсяг виробництва і реалізації продукції щоб одержати бажану суму прибутку і як вплине на...
80558. Непрямі податки, податки і платежі за майно і ресурси підприємств 239.5 KB
  Акцизний збір — це непрямий податок, що встановлюється на підакцизні товари та включається в їхню ціну. Акцизний збір (далі – АЗ) – специфічний акциз, що застосовується для обмеженої кількості товарів, які називаються підакцизними.
80559. Місцеві податки і збори. Спрощена система оподаткування 160 KB
  Особливості їх стягнення і впливу на фінансовогосподарську діяльність субєктів господарювання полягають у такому: Місцеві податки і збори включають до складу валових витрат що вираховуються зі скоригованого валового доходу а отже зменшують суму оподатковуваного прибутку. Місцеві податки і збори субєкти господарювання відносятьна собівартість продукції робіт послуг що впливає на формування бухгалтерського прибутку. Платниками цього податку є субєкти підприємницької діяльності їхні філії відділення представництва постійні...
80560. Визначення потреби в оборотних коштах 42.5 KB
  Нормування незавершеного виробництва і готової продукції. Аналогічно нормується запас палива за видами на виробничі і невиробничі цілі норматив на тару з урахуванням часу виготовлення або транспортування прошивки та інших стадій підготовки до запакування продукції. Усі витрати на початі але незавершені вироби – у цехах майстернях інших виробничих приміщеннях після видачі зі складу матеріалів до моменту передачі продукції на склад визначаються вартістю незавершеного виробництва. Нароматив незавершеного виробинцтва залежить від: обсягу і...
80561. Використання і контроль обігового капіталу 72 KB
  Ефективність використання оборотного капітал може бути досягнення шляхом прискорення їх обертання. Шляхи прискорення обігу оборотних активів для вивільнення оборотних коштів
80562. Банківське кредитування підприємств 165.5 KB
  Слово «кредит» походить від латинського, що означає борг, позика. В сучасному понятті кредит - це капітал, який береться під позику у вигляді грошової форми і надається в тимчасове використання госпорганам на умовах забезпеченості, повернення, терміновості, оплати та цільового використання.