74564

Нелінійні оптимізаційні моделі економічних систем

Лекция

Экономическая теория и математическое моделирование

Основні труднощі розв’язування задач нелінійного програмування. Раніше було розглянуто методи розв’язування задач лінійного програмування. Галузі об’єднання та окремі підприємства народного господарства функціонують і розвиваються за умов невизначеності а тому адекватно їх можна описати нелінійними стохастичними динамічними моделями. Зауважимо що сучасний рівень розвитку комп’ютерної техніки і методів математичного моделювання створює передумови для застосування нелінійних методів а це може суттєво підвищити якість розроблюваних планів...

Украинкский

2015-01-04

910 KB

4 чел.


  1.  Нелінійні оптимізаційні моделі економічних систем

Анотація

Економічна і математична постановка задачі нелінійного програмування. Геометрична інтерпретація задачі нелінійного програмування. Основні труднощі розв’язування задач нелінійного програмування. Класичний метод оптимізації. Метод множників Лагранжа. Необхідні умови існування сідлової точки. Теорема Куна—Таккера. Опукле програмування.

Раніше було розглянуто методи розв’язування задач лінійного програмування. Ці методи найкраще розроблені, легко реалізуються на ПЕОМ, а тому набули широкого застосування в багатьох галузях науки, техніки та економіки. Проте лінійні моделі відображають лише певну й вельми обмежену сукупність властивостей навколишнього світу. Адже, скажімо, соціально-економічні процеси переважно не є лінійними. Галузі, об’єднання та окремі підприємства народного господарства функціонують і розвиваються за умов невизначеності, а тому адекватно їх можна описати нелінійними, стохастичними, динамічними моделями. Отже, для ефективного управління народним господарством в цілому, його галузями і окремими об’єктами господарювання потрібне застосування нелінійних економіко-математичних моделей та методів.

Зауважимо, що сучасний рівень розвитку комп’ютерної техніки і методів математичного моделювання створює передумови для застосування нелінійних методів, а це може суттєво підвищити якість розроблюваних планів, надійність та ефективність рішень, які приймаються.

9.1 Економічна і математична постановка задачі нелінійного програмування

Досить детально розглянута в лекціях, присвячених лінійному програмуванню, задача пошуку оптимальних обсягів виробництва ґрунтується на допущеннях про лінійність зв’язку між витратами ресурсів і обсягами виготовленої продукції; між ціною, рекламою та попитом тощо. Але такі зв’язки насправді є нелінійними, тому точніші математичні моделі доцільно формулювати в термінах нелінійного програмування.

Нехай для деякої виробничої системи необхідно визначити план випуску продукції за умови найкращого способу використання її ресурсів. Відомі загальні запаси кожного ресурсу, норми витрат кожного ресурсу на одиницю продукції та ціни реалізації одиниці виготовленої продукції. Критерії оптимальності можуть бути різними, наприклад, максимізація виручки від реалізації продукції. Така умова подається лінійною залежністю загальної виручки від обсягів проданого товару та цін на одиницю продукції.

Однак, загальновідомим є факт, що за умов ринкової конкуренції питання реалізації продукції є досить складним. Обсяг збуту продукції визначається передусім її ціною, отже, як цільову функцію доцільно брати максимізацію не всієї виготовленої, а лише реалізованої продукції. Необхідно визначати також і оптимальний рівень ціни на одиницю продукції, за якої обсяг збуту був би максимальним. Для цього її потрібно ввести в задачу як невідому величину, а обмеження задачі мають враховувати зв’язки між ціною, рекламою та обсягами збуту продукції. Цільова функція в такому разі буде виражена добутком двох невідомих величин: оптимальної ціни одиниці продукції на оптимальний обсяг відповідного виду продукції, тобто буде нелінійною. Отже, маємо задачу нелінійного програмування.

Також добре відома транспортна задача стає нелінійною, якщо вартість перевезення одиниці товару залежить від загального обсягу перевезеного за маршрутом товару. Тобто коефіцієнти при невідомих у цільовій функції, що в лінійній моделі були сталими величинами, залежатимуть від значень невідомих (отже, самі стають невідомими), що знову приводить до нелінійності у функціоналі.

І нарешті, будь-яка задача стає нелінійною, якщо в математичній моделі необхідно враховувати умови невизначеності та ризик. Як показник ризику часто використовують дисперсію, тому для врахування обмеженості ризику потрібно вводити нелінійну функцію в систему обмежень, а мінімізація ризику певного процесу досягається дослідженням математичної моделі з нелінійною цільовою функцією.

Загальна задача математичного програмування формулюється так: знайти такі значення змінних xj , щоб цільова функція набувала екстремального (максимального чи мінімального) значення:

  (9.1)

за умов:

 (); (9.2)

 . (9.3)

Якщо всі функції  та ,  є лінійними, то це задача лінійного програмування, інакше (якщо хоча б одна з функцій є нелінійною) маємо задачу нелінійного програмування.

9.2 Геометрична інтерпретація задачі нелінійного програмування

Геометрично цільова функція (9.1) визначає деяку поверхню, а обмеження (9.2)-(9.3) – допустиму підмножину n-вимірного евклідового простору. Знаходження оптимального розв’язку задачі нелінійного програмування зводиться до відшукання точки з допустимої підмножини, в якій досягається поверхня найвищого (найнижчого) рівня.

Якщо цільова функція неперервна, а допустима множина розв’язків замкнена, непуста і обмежена, то глобальний максимум (мінімум) задачі існує.

Найпростішими для розв’язування є задачі нелінійного програмування, що містять систему лінійних обмежень та нелінійну цільову функцію. В цьому разі область допустимих розв’язків є опуклою, непустою, замкненою, тобто обмеженою.

Розглянемо приклад геометричного способу розв’язування задачі нелінійного програмування.

Приклад 9.1. Знайти мінімальне і максимальне значення функції:

за умов:

.

Розв’язання. Область допустимих розв’язків утворює чотирикутник АВСD (рис.9.1).

Рисунок 9.1

Геометрично цільова функція являє собою коло з центром у точці М(2;2), квадрат радіуса якого . Це означає, що її значення буде збільшуватися (зменшуватися) зі збільшенням (зменшенням) радіуса кола. Проведемо з точки М кола різних радіусів. Функція Z має два локальних максимуми: точки В(0;6) і С(8;0). Обчислимо значення функціонала в цих точках:

,

.

Оскільки , то точка С(8;0) є точкою глобального максимуму.

Очевидно, що найменший радіус , тоді:

.

Тобто точка М є точкою мінімуму, оскільки їй відповідає найменше можливе значення цільової функції.

Зазначимо, що в даному разі точка, яка відповідає оптимальному плану задачі (мінімальному значенню функціонала), знаходиться всередині багатокутника допустимих розв’язків, що в задачах лінійного програмування неможливо.

Приклад 9.2. Знайти мінімальне значення функції:

за умов:

.

Розв’язування. У даному прикладі множина допустимих розв’язків складається з двох окремих частин, необмежених зверху (рис.9.2).

Рисунок 9.2

Цільова функція аналогічно попередньому випадку є колом з центром у точці М(4;4). Функція Z має два локальних мінімуми: в точці А(), і в точці В().

Значення функціонала в цих точках однакове і дорівнює:

.

Отже, маємо два альтернативні оптимальні плани.

Даний приклад ілюструє ще одну особливість задач нелінійного програмування: на відміну від задач лінійного програмування багатогранник допустимих розв’язків задачі нелінійного програмування не обов’язково буде опуклою множиною.

Наведемо основні особливості задач нелінійного програмування, що зумовлюють необхідність застосування відповідних методів їх розв’язання.

9.3 Основні труднощі розв’язування задач нелінійного програмування

Часто задачу нелінійного програмування намагаються звести до лінійного вигляду, що призводить до значних похибок. Наприклад, як правило, собівартість продукції y визначають за формулою:  де х – обсяг виробництва. Ввівши заміну: , маємо:  тобто приходимо до лінійної функції. За такої заміни похибок не допускають. Однак, якщо функцією собівартості буде  то використання замість неї деякої лінійної функції  невиправдане, що видно з рис.9.3.

Рисунок 9.3

У точках х1 і х3 величина собівартості для двох цих функцій однакова. Однак у всіх інших точках ці значення відрізняються, причому у точці х2 у значній мірі, тобто на величину:

.

Отже, лінеаризація нелінійних процесів є досить складною математичною задачею. Зведення нелінійної задачі до лінійної дає змогу отримати симплексним методом розв’язок, близький до розв’язку початкової нелінійної задачі. Однак з вище розглянутого прикладу бачимо, що при побудові наближених лінійних задач можна отримати надто неточний розв’язок, який непридатний для використання.

Навіть питання щодо існування розв’язку задачі нелінійного програмування потребує окремого дослідження.

Розглянемо основні труднощі розв’язування нелінійних задач.

  1.  Для лінійних задач можна завжди знайти оптимальний розв’язок універсальним методом – симплексним. При цьому не існує проблеми стосовно доведення існування такого розв’язку, тобто в результаті застосування алгоритму симплексного методу завжди отримують один з таких варіантів відповіді:

а) отримали оптимальний розв’язок;

б) умови задачі суперечливі, тобто розв’язку не існує;

в) цільова функція необмежена, тобто розв’язку також не існує.

Для задач нелінійного програмування не існує універсального методу розв’язання, що зумовило розроблення значної кількості різних методів розв’язування окремих типів задач нелінійного програмування. Для кожного специфічного методу необхідно доводити існування розв’язку задачі та його єдиність, що також є досить складною математичною задачею.

Відомі точні методи розв’язування нелінійних задач, але в такому разі існують труднощі обчислювального характеру, тобто навіть для сучасних ЕОМ такі алгоритми є досить трудомісткими, тому здебільшого для розв’язування нелінійних задач виправданим є застосування наближених методів.

  1.  Для задач лінійного програмування доведено наявність єдиного екстремуму, що досягається в одній (або кількох одночасно) з вершин багатогранника допустимих розв’язків задачі. Однак у задачах нелінійного програмування існують кілька локальних оптимумів, що потребує пошуку серед них глобального.

На рис.9.4 маємо на відрізку, що зображений, локальні оптимуми у точках    глобальний – у точках  та .

Рисунок 9.4

Більшість наближених методів уможливлюють, як правило, знаходження локального оптимуму. Можна, звичайно, користуючись простим способом, визначити всі локальні оптимуми, а потім їх зіставленням знайти глобальний. Однак для практичних розрахунків такий метод є неефективним. Часто глобальний оптимум наближені методи «не уловлюють». Наприклад, у разі, коли глобальний оптимум знаходиться досить близько біля локального. Якщо відрізок  поділити на десять підвідрізків і глобальний оптимум попаде у відрізок  (рис.8.4), а зліва від  та справа від  крива  буде зростати, то глобальний оптимум буде пропущеним.

  1.  У задачах лінійного програмування точка оптимуму завжди була граничною точкою багатогранника допустимих планів. Для нелінійних задач точка, яка визначає оптимальний план, може бути як граничною, так і знаходитися всередині допустимої області розв’язків (планів), що було проілюстровано в прикладі 9.1.
  2.  Доведено, що множина допустимих планів задачі лінійного програмування завжди є опуклою. У разі, коли система обмежень задачі є нелінійною, вона може визначати множину допустимих розв’язків як неопуклу, або навіть складатися з довільних, не зв’язаних між собою частин (приклад 9.2).

Одним з найпоширеніших прикладів зазначеної особливості є задачі цілочислового програмування. Нагадаємо, що вимога цілочисловості змінних задачі приводить до множини допустимих розв’язків, утвореної окремими точками, що зумовлює розглянуті вище ускладнення відшукання розв’язків такого типу задач.

Кожна із зазначених особливостей задач вимагає застосування специфічних методів пошуку розв’язку, тому безперечно найскладнішими для розв’язування є задачі нелінійного програмування, в яких поєднується кілька або всі згадані особливості.

9.4. Класичний метод оптимізації. Метод множників Лагранжа

Як уже згадувалось, для розв’язування задач нелінійного програмування не існує універсального методу, тобто до них необхідно застосовувати широке коло різних методів і обчислювальних алгоритмів. Вони в основному базуються на застосуванні диференційного числення і залежать від конкретної постановки задачі та форми економіко-математичної моделі.

Методи розв’язування задач нелінійного програмування бувають прямі та непрямі. За допомогою прямих методів знаходження оптимальних планів здійснюють у напрямку найшвидшого збільшення (зменшення) значення цільової функції. Типовим представником цієї групи методів є градієнтні. Методика застосування непрямих методів передбачає зведення задачі до такої, оптимум якої слід знаходити простішими методами. Серед непрямих найкраще розробленими є методи розв’язування задач квадратичного та сепарабельного програмування.

Найпростішими для розв’язування є задачі нелінійного програмування, в яких система обмежень складається лише з рівнянь.

9.4.1 Умовний та безумовний екстремуми функції

У теорії дослідження функцій задача на відшукання екстремальних значень не містить ніяких додаткових умов щодо змінних і такі задачі належать до задач відшукання безумовного екстремуму функції. Локальний та глобальний екстремуми тоді визначаються з необхідних та достатніх умов існування екстремуму функції.

Нагадаємо, що необхідна умова існування локального екстремуму функції двох змінних формулюється так: для того, щоб точка  була точкою локального екстремуму, необхідно, щоб функція  була неперервною і диференційовною в околі цієї точки і перші частинні похідні за змінними  та  у цій точці дорівнювали нулю:

.

Точка  називається критичною.

Достатня умова існування локального екстремуму функції двох змінних формулюється так: для того, щоб критична точка  була точкою локального екстремуму, достатньо, щоб функція  була визначена в околі критичної точки  та мала в цій точці неперервні частинні похідні другого порядку.

Тоді, якщо

,

то в точці  функція  має екстремум, причому, якщо

,

тоді  – точка локального максимуму функції , а якщо

,

тоді  – точка локального мінімуму функції .

У разі, якщо

,

то в точці  функція  екстремуму не має.

Якщо

,

то питання про існування екстремуму залишається відкритим.

Якщо задача полягає у відшуканні локального чи глобального екстремуму деякої функції за умови, що на змінні такої функції накладаються додаткові обмеження, то маємо задачу пошуку умовного екстремуму функції. Термін «умовний» означає, що змінні задачі мають задовольняти деякі умови.

Розглянемо таку задачу для випадку двох змінних:

знайти

 (9.4)

за умови, що

 . (9.5)

Найпростіший спосіб розв’язання задачі такого виду полягає в тому, що спочатку з обмеження (9.5) знаходять вираз однієї змінної через іншу. Приміром, визначають  через . Отриманий вираз виду  підставляють у функцію (9.4), що після цього стає функцією однієї змінної , і далі знаходять її безумовний екстремум.

Якщо деяка точка  є точкою екстремуму функції , то точка  є точкою умовного екстремуму функції (9.4) за умови (9.5).

Однак не завжди вдається відшукати аналітичний вираз однієї змінної через іншу в умові (9.5). Часто це досить важко здійснити або неможливо. Також іноді складно узагальнити даний спосіб для функції n змінних, на які накладено m обмежень. Тому описана досить проста ідея зведення задачі відшукання умовного екстремуму функції кількох змінних до задачі на безумовний екстремум функції однієї змінної не може бути використана як основа універсального методу розв’язування задач на умовний екстремум. Цікавий метод розв’язування задач типу (9.4)-(9.5) запропонував Лагранж.

8.4.2 Метод множників Лагранжа

Ідея методу множників Лагранжа полягає в заміні початкової задачі простішою. Для цього цільову функцію замінюють іншою, з більшою кількістю змінних, тобто такою, яка включає в себе умови, що подані як обмеження. Після такого перетворення подальше розв’язування задачі полягає в знаходженні екстремуму нової функції, на змінні якої не накладено ніяких обмежень. Тобто від початкової задачі пошуку умовного екстремуму переходимо до задачі відшукання безумовного екстремального значення іншої функції. Отже, завдяки такому перетворенню можливе застосування методів класичного знаходження екстремуму функції кількох змінних.

У попередньому пункті наведена необхідна умова існування локального екстремуму неперервної та диференційовної функції двох змінних.

Узагальнення необхідної умови існування локального екстремуму функції n змінних має аналогічний вигляд. Отже, для розв’язування задачі необхідно знайти вирази частинних похідних нової цільової функції за кожною змінною і прирівняти їх до нуля. В результаті отримаємо систему рівнянь. Її розв’язок визначає так звані стаціонарні точки, серед яких є і шукані екстремальні значення функції.

Розглянемо метод множників Лагранжа для розв’язування задачі нелінійного програмування, що має вигляд:

 (9.6)

за умов:

 , (9.7)

де функції  і  мають бути диференційовними.

Задача (9.6)-(9.7) полягає в знаходженні екстремуму функції  за умов виконання обмежень .

Переходимо до задачі пошуку безумовного екстремуму. Теоретично доведено, що постановки та розв’язання таких задач еквівалентні.

Замінюємо цільову функцію (9.6) на складнішу. Ця функція називається функцією Лагранжа і має такий вигляд:

  (9.8)

де   деякі невідомі величини, що називаються множниками Лагранжа.

Знайдемо частинні похідні і прирівняємо їх до нуля:

 (9.9)

Друга група рівнянь системи (9.9) забезпечує виконання умов (9.7) початкової задачі нелінійного програмування.

Система (9.9), як правило, нелінійна.

Розв’язками її є  і   стаціонарні точки. Оскільки, ці розв’язки отримані з необхідної умови екстремуму, то вони визначають максимум, мінімум задачі (9.6)-(9.7) або можуть бути точками перегину (сідловими точками).

Для діагностування стаціонарних точок і визначення типу екстремуму необхідно перевірити виконання достатніх умов екстремуму, тобто дослідити в околі стаціонарних точок диференціали другого порядку (якщо для функцій  існують другі частинні похідні і вони неперервні).

Узагальнення достатньої умови існування локального екстремуму для функції n змінних приводить до такого правила: за функцією Лагранжа виду (9.8) будується матриця Гессе, що має блочну структуру розмірністю :

де О матриця розмірністю , що складається з нульових елементів,

 Р матриця розмірністю , елементи якої визначаються так:

,

  транспонована матриця до Р розмірністю ,

Q  матриця розмірністю  виду:

, де .

Розглянемо ознаки виду екстремуму розв’язку системи (9.9). Нехай стаціонарна точка має координати  і .

1. Точка  є точкою максимуму, якщо, починаючи з головного мінору порядку (m+1), наступні (nm) головних мінорів матриці Н утворюють знакозмінний числовий ряд, знак першого члена якого визначається множником .

2. Точка  є точкою мінімуму, якщо, починаючи з головного мінору порядку (m+1), знак наступних (nm) головних мінорів матриці Н визначається множником .

Розглянемо задачу, розв’язок якої знайдемо методом множників Лагранжа.

Приклад 9.3. Акціонерне товариство з обмеженою відповідальністю виділило 1200 га ріллі під основні сільськогосподарські культури – озиму пшеницю і цукрові буряки. У табл.8.1 маємо техніко-економічні показники вирощування цих культур:

Таблиця 9.1

Необхідно знайти оптимальні площі посіву озимої пшениці та цукрових буряків.

Нехай: х1  площа ріллі під озимою пшеницею, сотні га;

х2  площа ріллі під цукровими буряками, сотні га.

Звернемо увагу на те, що собівартість тонни пшениці та цукрових буряків залежить від відповідної площі посіву.

Запишемо економіко-математичну модель цієї задачі. Критерієм оптимальності візьмемо максимізацію чистого доходу:

за умов:

Запишемо функцію Лагранжа:

Візьмемо частинні похідні і прирівняємо їх до нуля:

З цієї системи рівнянь визначаємо координати сідлових точок. З першого та другого рівняння знаходимо 1 і, прирівнюючи вирази, маємо:

 (9.10)

або, скоротивши на 100 обидві частини і розкривши дужки, отримаємо:

. (9.11)

Із останнього рівняння системи маємо: .

Підставимо вираз для  у рівність (8.11). Отримаємо:

або

Отже, ;

.

(553 га);

(178 га).

Відповідно дістаємо:

га);

га).

Тобто отримали дві сідлові точки:

 

Перевіримо за допомогою достатньої умови існування екстремуму спочатку сідлову точку .

Матриця Гессе має такий вигляд:

.

За вищезазначеним правилом визначаємо головні мінори, починаючи з 2-го порядку ():

,

.

Отже, головні мінори утворюють знакозмінний ряд та, починаючи з головного мінору 2-го порядку, наступний мінор визначається знаком , тобто  є точкою максимуму.

Обчислимо значення цільової функції в цій точці:

Аналогічні обчислення для точки  показують, що вона не є екстремальною.

Отже, цільова функція набуде максимального значення, якщо озима пшениця вирощуватиметься на площі 647 га, а цукрові буряки – на площі 553 га.

Метод множників Лагранжа може застосовуватися також у разі наявності обмежень на знаки змінних і обмежень-нерівностей.

Розглянемо таку задачу в загальному вигляді:

,

причому всі функції, що входять у задачу, мають бути диференційовними хоча б один раз.

Очевидно, що введення в ліві частини нерівностей системи обмежень задачі додаткових невід’ємних змінних  перетворює початкову задачу в таку, що містить лише обмеження-рівності, тобто яка за формою та методом розв’язування збігатиметься з задачею (8.6)-(8.7).

9.5 Необхідні умови існування сідлової точки

Для розроблення методів розв’язування окремих типів задач нелінійного програмування важливе значення має поняття сідлової точки, а також визначення необхідних і достатніх умов існування сідлових точок функції Лагранжа  у (n+m)-вимірному просторі змінних  за довільних умов, які можуть накладатися на їх знаки (необхідні і достатні умови існування сідлової точки функції Лагранжа за відсутності обмежень на знаки змінних розглянуто в п.9.4).

Розглянемо нелінійну задачу:

,

.

Причому на компоненти векторів  накладено обмеження на знаки. Позначимо множину точок, що задовольняють такі обмеження, через .

Функція Лагранжа для цієї задачі має вигляд:

=. (9.12)

Точка  називається сідловою точкою функції Лагранжа (9.12), якщо для всіх  виконується співвідношення:

 . (9.13)

Для диференційовних функцій  та  знайдемо необхідні умови існування сідлової точки.

Сідлова точка  функції  виду (9.12) за означенням задовольняє умову:

.

Нерівність виконується для всіх точок Х, тобто також і для тих, у яких лише одна координата відрізняється від Х*. Допустимо, що це хk, а всі інші збігаються з координатами сідлової точки .

Оскільки права частина нерівності є фіксованою, а в лівій частині змінюється лише одна координата хk, то приходимо до функції однієї змінної , яку можна зобразити графічно на координатній площині.

Розглянемо спочатку випадок, коли , тобто лише частину координатної площини, для якої .

Можливі такі випадки:

1) коли всі , то максимальне значення функції L(xk) досягатиметься в точці, для якої  (рис.9.5).

Рисунок 9.5

2) коли максимум функції L(xk) досягатиметься в точці  і розглядувана частинна похідна також дорівнюватиме нулю:  (рис.9.6).

Рисунок 9.6

3) коли точка максимуму функції L(xk) досягатиметься також у точці
, а частинна похідна  (рис.
9.7).

Рисунок 9.7

Узагальнюючи всі три ситуації, маємо:

для

та

.

Розглядаючи другу частину нерівності (9.13):

аналогічними міркуваннями, що проілюстровані рис.9.8-9.9, встановлюються необхідні умови для похідних по  функції Лагранжа в сідловій точці.

Рисунок 9.8                                            Рисунок 9.9

Об’єднуючи всі три випадки для невід’ємних координат, маємо необхідні умови сідлової точки:

 для тих індексів j, де . (9.14)

Зауважимо, що для  маємо ті самі випадки, які зображено на рис.9.5-9.9, причому графіки будуть симетрично відображені відносно осі Оy, тобто для недодатних координат необхідна умова має вигляд:

  для тих індексів j, де . (9.15)

І нарешті, як відомо з попереднього параграфа, якщо на знак хj умови не накладаються, то необхідною умовою є:

,   довільного знака. (9.16)

Узагальнення всіх випадків приводить до рівняння:

 . (9.17)

Розглядаючи другу частину нерівності (9.13), за допомогою аналогічних міркувань встановлюємо необхідні умови для похідних по  функції Лагранжа в сідловій точці:

 для тих індексів і, де , (9.18)

 для тих індексів і, де , (9.19)

  для тих індексів і, де  має довільний знак. (9.20)

Отже, справджується рівняння:

. (9.21)

Сукупність співвідношень (9.14)-(9.21) становить необхідні умови, які має задовольняти сідлова точка  функції Лагранжа для точок, що належать множині . При цьому  повинна мати частинні похідні по всіх компонентах векторів .

9.6 Теорема Куна-Таккера

Розглянутий метод множників Лагранжа уможливлює знаходження лише локальних сідлових точок функції Лагранжа.

Теорема Куна-Таккера дає змогу встановити типи задач, для яких на множині допустимих розв’язків існує лише один глобальний екстремум зумовленого типу. Вона тісно пов’язана з необхідними та достатніми умовами існування сідлової точки.

Розглянемо задачу нелінійного програмування, яку, не зменшуючи загальності, подамо у вигляді:

, (9.22)

, (9.23)

. (9.24)

(Очевидно, що знак нерівності можна змінити на протилежний множенням лівої і правої частин обмеження на (– 1)).

Теорема 9.1. (Теорема Куна-Таккера). Вектор Х* є оптимальним розв’язком задачі (9.22)-(9.24) тоді і тільки тоді, коли існує такий вектор , що при  для всіх  точка  є сідловою точкою функції Лагранжа

,

і функція мети  для всіх  угнута, а функції   опуклі.

Умови теореми Куна — Таккера виконуються лише для задач, що містять опуклі функції.

9.6.1 Опуклі й угнуті функції

Наведемо основні означення та теореми. Нехай задано n-вимірний лінійний простір Rn. Функція , що задана на опуклій множині , називається опуклою, якщо для будь-яких двох точок  та  з множини X і будь-яких значень  виконується співвідношення:

. (9.25)

Якщо нерівність строга і виконується для , то функція  називається строго опуклою.

Функція , яка задана на опуклій множині , називається угнутою, якщо для будь-яких двох точок  та  з множини X і будь-якого  справджується співвідношення:

. (9.26)

Якщо нерівність строга і виконується для , то функція  називається строго угнутою.

Слід зазначити, що опуклість та угнутість функції визначаються лише відносно опуклих множин у , оскільки за наведеними означеннями разом з двома будь-якими точками  та  множині X належать також точки їх лінійної комбінації:  для всіх значень , що можливо лише у разі, коли множина X є опуклою.

Теорема 9.2. Нехай  – опукла функція, що задана на замкненій опуклій множині X, тоді будь-який локальний мінімум  на цій множині є і глобальним.

Теорема 9.3. Нехай   опукла функція, що визначена на опуклій множині Х, і крім того, вона неперервна разом з частинними похідними першого порядку в усіх внутрішніх точках Х. Нехай   точка, в якій . Тоді в точці  досягається локальний мінімум, що збігається з глобальним.

Як наслідок теореми можна показати, що коли Х замкнена, обмежена знизу, опукла множина, то глобального максимуму опукла функція f(X) досягає на ній у одній чи кількох точках (при цьому допускається, що в точці Х значення функції скінченне). Застосовуючи за розв’язування таких задач процедуру перебору крайніх точок, можна отримати точку локального максимуму, однак не можна встановити, чи є вона точкою глобального максимуму.

Для угнутих функцій отримані результати формулюють так. Нехай f(X) угнута функція, що задана на замкненій опуклій множині . Тоді будь-який локальний максимум f(X) на множині Х є глобальним. Якщо глобальний максимум досягається в двох різних точках множини, то він досягається і на нескінченній множині точок, що лежать на відрізку, який сполучає ці точки. Для строго угнутої функції існує єдина точка, в якій вона досягає глобального максимуму.

Градієнт угнутої функції f(X) у точках максимуму дорівнює нулю, якщо f(X) – диференційовна функція. Глобальний мінімум угнутої функції, якщо він скінченний на замкненій обмеженій зверху множині, має досягатися в одній чи кількох її крайніх точках за умови скінченності функції f(X) у кожній точці цієї множини.

9.7 Опукле програмування

Опукле програмування розглядає методи розв’язування задач нелінійного програмування, математичні моделі яких містять опуклі або угнуті функції.

Загальний вигляд задачі опуклого програмування такий:

, (9.27)

,; (9.28)

, (9.29)

де ,   угнуті функції.

Аналогічний вигляд має задача для опуклих функцій.

Позначимо: , тоді , і маємо:

 , (9.30)

 ; (8.31)

, (9.32)

де ,   опуклі функції.

Оскільки ці задачі еквівалентні, то нижче розглянемо задачу (9.27)-(9.29).

Множина допустимих планів задачі, що визначається системою (9.28), є опуклою.

Як наслідок теорем 9.2 та 9.3 справджується таке твердження: точка локального максимуму (мінімуму) задачі опуклого програмування (9.27)-(9.29) є одночасно її глобальним максимумом (мінімумом).

Отже, якщо визначено точку локального екстремуму задачі опуклого програмування, то це означає, що знайдено точку глобального максимуму (мінімуму).

У разі обмежень-нерівностей задачу опуклого програмування розв’язують, застосовуючи метод множників Лагранжа.

Функція Лагранжа для задачі (9.27)-(9.29) має вид:

 (9.33)

де   множники Лагранжа.

Використовуючи теорему Куна-Таккера, маємо необхідні та достатні умови існування оптимального плану задачі опуклого програмування.

Теорема 8.4. Якщо задано задачу нелінійного програмування виду (9.27)-(9.29), де функції   диференційовні і вгнуті по Х, то для того, щоб вектор  був розв’язком цієї задачі, необхідно і достатньо, щоб існував такий вектор , що пара (,) була б сідловою точкою функції Лагранжа, тобто щоб виконувалися умови:

(І) ,; (9.34)

(ІІ) , ; (9.35)

(ІІІ) , ; (9.36)

(IV) , . (9.37)

Для задачі мінімізації (9.30)-(9.32), де всі функції   диференційовні і опуклі по Х, маємо умови, аналогічні вищенаведеним, але зі знаком «≥» в нерівностях (9.35) та (9.37).


 

А также другие работы, которые могут Вас заинтересовать

25467. Философские основания и проблемы социальной работы 13.31 KB
  Философские основания и проблемы социальной работы Как система научных знаний соц. Первый раздел включает в себя методологические основы познания законы строгий общий категориальный аппарат; второй – сведения практического применения общих теоретических положений относящихся непосредственно к соц. Соц.работник в любой из сфер своей деятельности так или иначе связан с человеком с взаимоотношениями между личностью и коллективом между соц.