9896

Примеры простейших задач вариационного исчисления

Реферат

Математика и математический анализ

Примеры простейших задач вариационного исчисления Исторически первой задачей, известной в глубокой древности и отнесенной впоследствии к задачам вариационного исчисления, явилась так называемая задача Дидо. Легенда говорит, что Дидо - царица од...

Русский

2013-03-18

214.5 KB

45 чел.

Примеры простейших задач вариационного исчисления

Исторически первой задачей, известной в глубокой древности и отнесенной впоследствии к задачам вариационного исчисления, явилась так называемая задача Дидо. Легенда говорит, что Дидо – царица одного из государств Древней Греции, преследуемая царем соседнего государства, бежала в Северную Африку и попросила у местного населения участок земли, который можно охватить шкурой вола. Получив согласие на столь ничтожную просьбу, она на глазах у изумленных зрителей разрезала шкуру на тонкие  ремешки и, связав их друг с другом, охватила полученной нитью изрядных по тем временам участок; развернув на нем строительство, она основала на этом участке знаменитый в древности город Карфаген.

Уже античные ученые заинтересовались математической стороной этой легенды: допустим, что нить уже связана; как тогда надо расположить ее, чтобы охваченный ею участок имел наибольшую площадь?

Пусть концы нити расположены в заданных точках А(a,0) и В(b,0) на берегу моря.

y

0       А             B       x

Если тогда выбрать оси координат как на рисунке, то задача сводится к максимизации площади, т.е. интеграла

S =

(y = y(x) – уравнение сухопутной границы участка), при заданном значении длины нити, т.е. интеграла

L = ,

и заданных краевых значениях

y(a) = 0, y(b) = 0.

Уже в древности было обнаружено, что искомой формой нити служит дуга окружности.

Задача о кратчайшем расстоянии

      На плоскости xOy даны две точки А1(x1, y1) и А2(x2, y2). Расстояние между этими точками определяется по формуле длины дуги:

     (1)

      Это выражение является функционалом, потому что численная величина его зависит от вида или формы кривых, проходящих через точки А1 и А2. Через эти же точки можно провести бесчисленное множество кривых. Из этого множества нужно найти экстремаль, т.е. такую кривую, при которой интеграл (1) имеет минимум. Такой кривой будет прямая линия – это совпадает с определением Евклида, который определил прямую как кратчайшее расстояние между двумя точками.

      Задача о катеноиде

      Через две заданные точки А1(x1, y1) и А2(x2, y2) в верхней полуплоскости проходит некоторая кривая, не пересекающая ось x. Эта кривая вращается вокруг оси x.

Боковая поверхность тела вращения определяется по формуле:   

   (2)

       Выражение (2) является функционалом, потому что численная величина его зависит от вида или формы кривой, проходящей через точки А1 и А2. Из всевозможных кривых, соединяющих эти точки, нужно выбрать экстремаль, т.е. такую  кривую, при которой интеграл (2) будет иметь минимум. При этом y(x1)=y1, y(x2)=y2. Такой кривой окажется цепная линия, откуда и само название задачи.

   

  Задача о брахистохроне.

Тяжелая материальная точка M с массой m скатывается под действием силы тяжести из положения А1(x1, y1) в положение А2(x2, y2) по идеально гладкой кривой.

Возьмем какую-либо промежуточную точку В(x,y). Пусть скорость движения в точке А1 будет v1, а в точке В – v. Тогда по закону сохранения энергии

,

где g – ускорение свободного падения, а h = y1y. Для упрощения примем v1=0, т.е. начальная скорость равна 0. Тогда

,    ; .

С другой стороны, скорость есть производная от пути по времени

.

Сравнивая формулы для скоростей, получим

,

Откуда

,

и время ската из положения А1 в положение А2 определится по формуле

            (3)                                

Выражение (3) является функционалом, потому что численная величина его зависит от формы кривой, соединяющей А1 и А2. Из множества всех кривых нужно выбрать такую, при которой интеграл (3) имеет наименьшее значение. При этом y(x1)=y1, y(x2)=y2. Кривая кратчайшего времени называется брахистохроной.

Функционал

Нетрудно уяснить общие черты приведенных задач. Прежде всего, все они являются задачами на экстремум – максимум и минимум. Ранее мы решали задачи на экстремум средствами дифференциального исчисления. Если задача сводилась к рассмотрению экстремума функции f(x) одного переменного, то искомым было значение x – это задача с одной степенью свободы. Если надо было найти экстремум функции от n переменных, то искомым был набор значений – это задача с n степенями свободы. В рассмотренных выше задачах искомой является линия, или функция, от которой требуется только, чтобы она удовлетворяла заданным граничным условиям. Но при произвольном выборе такой функции имеется бесконечное число степеней свободы; таким образом, можно сказать, что вариационное исчисление изучает экстремумы в задачах с бесконечным числом степеней свободы.

К сказанному возможен ещё такой подход. Рассмотрим, любой из интегралов (1)-(3). Если в него вместо y(x) подставить любую функцию y(x), заданную в указанных пределах и удовлетворяющую граничным условиям, то он примет определенное численное значение.

Закон, по которому каждой функции из некоторого класса функций ставится в соответствие определенное число, называется функционалом.  Задача состоит в подборе функции у(х), для которой интеграл принимает экстремальное (максимальное или минимальное) значение. Таким образом, вариационное исчисление изучает экстремумы функционалов.

Приведем несколько конкретных примеров функционалов. Пусть

                      (4)

Этот функционал определен для всех функций y(x), заданных при  и принимающих там конечные значения (или даже бесконечные, если интеграл получится сходящимся). Например,

для функции ()      получится ;              

                      ()                            

                         ()                      ,     

и т.д.                                                                

Можно сказать что функционал – это функция, у которой значениями независимой переменной y(x) служат обычные функции, а значениями зависимой переменной I служат числа.

Формула

                                     

определяет другой функционал, причем линейный, т.е.

  J{Cy}=CJ{y}  (C= const),    . (5)

Формула

определяет еще один функционал, отличный от (4), так как K{y} задан на другом классе функций y(x), именно, определенных при . В то же время функционал    

совпадает с (4), т.е. можно написать  и т.д.

Функциональные пространства

При рассмотрении функционалов и их экстремумов бывает полезно уточнить область определения функционала, т.е. совокупность функций, для которых он рассматривается. Обычно эта совокупность представляет собой некоторое линейное пространство – или его часть, – состоящее из функций, над которыми линейные действия выполняются по простейшим правилам. Такие пространства называются функциональными пространствами, они чаще всего бесконечномерные.

Функциональные пространства обычно являются нормированными, т.е. в них имеется понятие нормы, характеризующей уклонение функции от тождественного нуля. Норма функции f обозначается через || ||, она представляет собой конечное действительное число и должна удовлетворять следующим требованиям (аксиомы нормы):

1. || f ||≥0, причем || ||=0 только для тождественно нулевой функции f.

2. || af ||=| a|·||f||   (a=const).

3. || +g||≤|| ||+|| g||.

Понятие уклонения функций может быть введено по-разному. Соответственно этому, рассматривают различные функциональные пространства, состоящие из функций, заданных на каком-либо интервале . (Отметим, что все функции, составляющие линейное функциональное пространство, должны быть заданы на одном и том же интервале, так как в противном случае их нельзя было бы складывать друг с другом.) Эти пространства подробно изучаются в курсе функционального анализа; наиболее употребительны следующие пространства. (Считаем все участвующие величины вещественными, а все области определения функций конечными.)

1. Пространство C[a, b] функций, заданных и непрерывных на конечном интервале , с нормой

                                 

Эта норма отвечает равномерному уклонению функций друг от друга.

2. Пространство С1[a, b] функций, заданных и непрерывных при  вместе со своей производной, с нормой

   (6)

(В качестве нормы в С1 можно взять также не сумму, а наибольшее из слагаемых, стоящих в правой части; это различие оказывается несущественным.)

Аналогично вводятся пространства  при n=2, 3,....

3. Пространство Гильберта L2[a, b] функций, заданных при  и не обязательно непрерывных, для которых норма

|| f ||=    (7)                        

принимает конечное значение. При конечных a, b это означает, что функция f(x) должна быть либо конечной, либо, во всяком случае, квадратично суммируемой (термин суммируемая функция всегда означает абсолютно интегрируемая). Это норма отвечает среднеквадратичному уклонению двух функций друг от друга.

Можно проверить, что каждая из указанных здесь норм удовлетворяет необходимым аксиомам 1 – 3.

Если из текста не ясно, какая именно норма имеется в виду, то надо писать более подробно: || f ||C[a, b] и т.п. Подчеркнем, что в нормированном пространстве норма каждого элемента конечна. Например,

                                   ,    ;  

поэтому, функция входит в пространство L2[0, 1] (является его элементом, обобщенным вектором), а функция не входит.

В нормированном пространстве вводится понятие расстояния p между любыми элементами  f, g по формуле

p(f, g) = || fg ||;

для функциональных пространств такое расстояние есть как раз уклонение функций f и g друг от друга.

Отчетливое представление о функциональных пространствах полезно при рассмотрении экстремумов функционалов. В самом деле, пусть функционал I{y} имеет при  локальный максимум. Это значит, что для всех функций y(x), не тождественно равных и достаточно близких к  , будет . Но что означает выражение “достаточно близкие функции”?

Например, можно ли считать две функции на рисунке близкими? Так как существуют различные виды уклонений функций, то ответ на этот вопрос зависит от того, какой вид уклонения, т.е. какое функциональное пространство, принять за основу. Так они могут быть близкими, если их рассматривать в C[a, b], но далекими в C1[a, b].

Соответственно этому рассматриваются различные типы экстремумов функционалов. В дальнейшем мы будем исследовать, как правило, функционалы, которые естественно рассматривать либо в С1, либо в С. Тогда, если  для всех y, близких к в смысле C, то говорят, что на функции достигается сильный максимум функционала I{y}; если же  для всех y, близких к в смысле C1, то говорят о слабом максимуме. При этом сильный экстремум всегда будет также и слабым, но обратное не обязательно.      

Вариация функционала

 

Вариация одно из центральных понятий при изучении нелинейных функционалов, оно играет ту же роль, что понятие дифференциала при изучении нелинейных функций. Дифференциал нелинейной функции равен главной линейной части ее приращения, замена приращения на дифференциал означает линеаризацию функции при малом изменении аргумента;

Вариация нелинейного функционала равна главной линейной части его приращения, замена приращения на вариацию означает линеаризацию функционала при переходе от одной функции (от которой зависит значение функционала) к другой, близкой функции.

Рассмотрим, например, функционал (4). Пусть функция y(x), от которой зависит его значение, сначала совпадала с некоторой , а затем мы перешли к некоторой другой, близкой функции .

Здесь - это вариация  функ-

ции  у(х), т.е. произвольная функция, 

мало уклоняющаяся от нуля и добавляемая к исходной функции  для получения новой, проварьированной функции  (см. рисунок). (При этом малое уклонение от нуля понимается в смысле той нормы, которая принята за основу,

например, на рисунке  малость понимается в смысле С1).

 При переходе от к  функционал (4) получит приращение

I. (10)

Пусть теперь функция  зафиксирована, а функцию можно выбирать произвольно. Мы видим, что тогда ∆I состоит из двух частей, каждая из которых представляет собой функционал относительно . Первая часть

                                                   (11)                   

обладает свойством линейности по δу, т.е. это линейный функционал, тогда как вторая часть

                                         

при малых имеет высший порядок малости. Таким образом, (11) представляет собой главную (т. е. с точностью до члена высшего порядка малости) линейную часть приращения (10) функционала (4) при переходе от  к  . Выражение (11) и называется (первой) вариацией δI функционала; можно написать

.

(в силу произвольности функции  мы заменили ее обозначение на у(х)).

Разобранный пример является типичным. Если задан произвольный функционал I{у} и мы переходим от функции у(х) к функции у(х)+ δу(х), то, как правило, приращение функционала

можно представить в виде суммы двух слагаемых

  (12)

первое из которых при фиксированной функции у(х) представляет собой линейный функционал относительно δу(x), а второе имеет относительно δу(x) высший порядок малости. Тогда первое слагаемое, в правой части (12) и называется вариацией функционала I, т. е.

В случаях, когда слагаемым высшего порядка малости можно пренебречь, можно сказать просто, что вариация функционала – это его бесконечно малое изменение, т.е. изменение, полученное за счет бесконечно малой вариации функции, от которой зависит этот функционал. Замена приращения функционала на его вариацию означает линеаризацию этого функционала, аналогично рассуждениям, приводимым при введении понятия дифференциала функции.

В конкретных примерах вариация функционалов вычисляется с помощью формулы Тейлора. Пусть, например, рассматривается функционал вида

,     (13)

где в процессе интегрирования y считается зависящим от х, у=у(х). Тогда

.   (14)

Но, так как {члены высшего порядка малости}, то, подставляя в (14) и отбрасывая эти члены, получим

  (15)

Для функционала

    (16)

аналогично получаем

,   (17)

где  можно понимать и как , и как , так как производная от разности двух функций равна разности их производных.

Необходимое условие экстремума

Это условие совершенно аналогично необходимому условию экстремума функции одной или нескольких переменных. Допустим, что некоторая функция  реализует локальный максимум или минимум функционала I{у} в выбранном функциональном пространстве (R), причем этот функционал имеет вариацию  , т. е.  допускает вблизи   линеаризацию. Кроме того, будем считать, что рассматривается  внутренний (не граничный) экстремум, т.е. функционал I{у} определен для всех у, достаточно близких к  в смысле выбранной нормы; это будет предполагаться  всюду далее, если не оговорено противоположное.

Тогда для любой  должно быть

.      (18)

В самом деле, пусть для определенности при функционал I имеет минимум и >0 для некоторой . Подставим в (12) kδy вместо δу, где k - скаляр: получим

Однако при малых |k| левая часть должна быть положительной, а правая имеет знак k, т.е. может быть как больше нуля, так и меньше нуля. Полученное противоречие и доказывает необходимость условия (18).

      Как видно из описания постановок задач вариационного исчисления в конкретных задачах часто рассматривается экстремум функционала не среди всех функций, составляющих определенное функциональное пространство, а только среди функций, удовлетворяющих некоторым добавочным линейным неоднородным условиям, например

       .     (19)

В этом случае условие (18) должно выполняться для любой вариации δу, удовлетворяющей соответствующим однородным условиям, т.е. для условий (19)

, .

В самом деле, для таких δу функция  y+kδy  также удовлетворяет условиям (19), а потому можно повторить то же доказательство, что было приведено выше для (18).

Линейные неоднородные условия определяют в пространстве (R) гиперплоскость (речь идет о гиперплоскостях в бесконечномерном функциональном пространстве). Если ставится задача об экстремуме функционала на некотором криволинейном многообразии (S) пространства (R), то, проводя линеаризацию в точке экстремума, получим, что условие (18) должно выполняться для любой y, принадлежащей касательной гиперплоскости к (S), проведенной в точке экстремума.

   

Мышкис А.Д. Математика для технических вузов: Специальные курсы. 2-е изд. – СПб.: Изд-во "Лань", 2002. – 640 с. – Гл. VI.


 

А также другие работы, которые могут Вас заинтересовать

76033. Система CREDO GEO в комплексе с другим системами CREDO 127.87 KB
  Система CREDO GEO представляет с собой программу, предназначенную для построения чертежей инженерно-геологических разрезов и колонок, а также создания объемной геологической модели местности и экспорта её в проектирующие системы.
76034. ЮРИДИЧЕСКОЕ ЗНАЧЕНИЕ ЗАКЛЮЧЕНИЯ БРАКА. ПРАВА И ОБЯЗАННОСТИ СУПРУГОВ В БРАКЕ 254.5 KB
  Тем не менее, государство сохраняет свою заинтересованность в правовой регламентации семейных отношений, поскольку современное общество заинтересовано в прочных и стабильных брачных союзах, ибо они способствуют умиротворению и положительным стремлениям в иных сферах жизни.
76035. Тепловой расчет подогревателя питательной воды низкого давления 733.5 KB
  Назначение регенеративных подогревателей питательной воды низкого давления и подогревателей сетевой воды – использование в качестве греющей среды пара промежуточных отборов турбин для снижения потерь теплоты в конденсаторах и повышения термического КПД тепловых электрических станций и ТЭЦ.
76036. Особенности рельефа Горного Урала 1.84 MB
  Рельеф - совокупность неровностей земной поверхности разного размера. Их называют формами рельефа. Изучение форм рельефа немыслимо без знания их внутреннего строения. Науку о строении, происхождении, истории развития и современной динамики рельефа земной поверхности называют геоморфологией.
76039. Функциональный преобразователь «напряжение переменного тока - код» 181.5 KB
  Цель работы –- изучение этого устройства и принципа работы выпрямителя среднеквадратичного значения переменного напряжения изучение работы интегральных микросхем в учебных целях; проектирование преобразователя напряжения переменного тока промышленной частоты в цифровой код.