5776

Теорія автоматичного управління спеціальними системами

Конспект

Коммуникация, связь, радиоэлектроника и цифровые приборы

Нелінійні системи та їх аналіз Нелінійні системи - це системи, що описуються нелінійними диференціальними рівняннями. Система автоматичного управління (САУ) називається нелінійною, якщо до її складу входить хоча б один нелінійний елемент. На пр...

Украинкский

2012-12-21

1.92 MB

92 чел.

Нелінійні системи та їх аналіз

Нелінійні системи – це системи, що описуються нелінійними диференціальними рівняннями. Система автоматичного управління (САУ) називається нелінійною, якщо до її складу входить хоча б один нелінійний елемент. На практиці найчастіше зустрічаються системи з безінерційними нелінійними елементами. Нелінійності в таких системах автоматичного керування зумовлені нелінійними статичними характеристиками елементів, що входять до складу системи. Такими елементами, зазвичай, є релейні елементи, в яких вихідна величина змінюється стрибкоподібно при неперервній зміні вхідної величини, логічні перемикаючі пристрої, які дозволяють змінювати структуру системи залежно від значення деяких її координат, підсилювачі із насиченням, в яких відбувається обмеження координат, машини та механізми з мертвими зонами і люфтами тощо.

Ми будемо розглядати вузький клас нелінійних САУ, що характеризуються такими особливостями:

- САУ складається з лінійної частини, яка описується лінійним диференціальним рівнянням із постійними коефіцієнтами, і нелінійного елемента;

-  нелінійний елемент є безінерційним, і його вхідна та вихідна величини пов’язані нелінійними алгебраїчними рівняннями;

- нелінійних елементів може бути декілька, але вони не повинні розділятись лінійними інерційними ланками.

Нелінійні системи, в порівнянні з лінійними, мають ряд принципових особливостей. Зокрема, такими особливостями є:

- не виконується принцип суперпозиції, і дослідження нелінійної системи при декількох впливах не можна зводити до дослідження при одному впливі;

- стійкість та характер перехідного процесу залежать від величини початкового відхилення від положення рівноваги;

- при фіксованих зовнішніх впливах можливі декілька (а іноді і безліч) положень рівноваги;

- у нелінійних системах виникають вільні усталені процеси, які в лінійних системах неможливі (наприклад, автоколивання).

Універсальих аналітичних (математичних) методів дослідження нелінійних систем не існує. В процесі розвитку теорії автоматичного управління було розроблено різні математичні методи аналізу та синтезу нелінійних систем, кожен з яких може бути застосованим до певного класу систем та задач. Найбільш широко застосовними методами дослідження нелінійних систем є:

- метод фазового простору (площини);

- метод функцій Ляпунова;

- метод гармонічної лінеаризації (метод гармонічного балансу);

- методи дослідження абсолютної стійкості.

Будь-яке дослідження більш чи менш складних нелінійних систем, як правило, закінчується математичним моделюванням. І у цьому відношенні математичне моделювання є одним із універсальних (не аналітичних) методів дослідження.

Статичні характеристики нелінійних елементів.

Більшість статичних характеристик реальних нелінійних елементів може бути зведена до обмеженого числа типових. Характеристики типових нелінійних елементів зведено в табл. 1.1.

Таблиця 1.1.

Назва елемента

Характеристика

Математичний опис

1

Ланка із зоною нечутливості

2

Пропорційна ланка із насиченням

3

Ідеальне двопозиційне реле

4

Характеристика з люфтом

5

Ідеальне трипозиційне реле

6

Реальне двопозиційне реле

У керуючих пристроях автоматичних систем поряд з релейними елементами використовуються так звані особливі нелінійності: добуткова ланка, елементи зі змінною структурою, елементи логічного типу.

Добуткова ланка використовується в обчислювальних блоках систем для обчислення квадрату сигналу і для визначення модуля сигналу.

Використання керуючих пристроїв зі змінною структурою створює великі можливості для покращення якості систем. У таких пристроях до основного контуру системи залежно від визначених умов вмикається або лінійна ланка W1, або лінійна ланка W2.

Нелінійності логічного типу залежно від комбінацій значень вхідних змінних видають сигнал, що дорівнює +1, -1 або 0.

Види з’єднань нелінійних елементів та розрахунок сумарних характеристик.

Якщо у систему входить декілька нелінійних елементів, з’єднаних послідовно, паралельно або зустрічно-паралельно, то сумарну характеристику можна побудувати за певними правилами.

Паралельне з’єднання нелінійних елементів. При паралельному з’єднанні нелінійних елементів сумарну характеристику будують як геометричну суму нелінійних характеристик окремих елементів (рис. 1.1).

Послідовне з’єднання двох нелінійних елементів. При послідовному з’єднанні нелінійних елементів, вихідна величина одного нелінійного елемента є вхідною для наступного нелінійного елемента (рис. 1.2 а). Тому під час побудови сумарної нелінійної характеристики систему координат другої характеристики повертають на 90, сполучаючи осі  і .

У першій чверті будують характеристику НЕ1, в другій – НЕ2, в третій проводять бісектрису, за допомогою якої у четвертій чверті отримують сумарну нелінійну характеристику (рис. 1.2 б).

З’єднання нелінійних елементів зі зворотнім зв’язком.

Рис. 1.3.  а) структурна схема з’єднання елементів зі зворотнім звязком; б) побудова сумарної (ІІІ) нелінійної характеристики; в) побудова сумарної (ІІІ) нелінійної характеристики при додатньому зворотньому звязку

 

При побудові результуючої характеристики нелінійного елемента НЕ1, охопленого нелінійним зворотнім зв’язком з характеристикою НЕ2 (рис. 1.3 а) в першому квадранті будуємо характеристику елемента НЕ1, а в другому – елемента НЕ2, повернувши систему координат протигодинникової стрілки на 90 градусів (щоб  вісь вихідного сигналу НЕ1 співпала з віссю вхідного сигналу НЕ2). В цьому випадку результуюча характеристика отримається як геометрична сума характеристик НЕ1 та НЕ2, просумованих в напрямку осі хвх.

Зображення процесів на фазовій площині

Якщо рівняння системи представлені у нормальній формі, то вектор стану системи однозначно визначає її стан. Кожному стану системи в просторі станів відповідає точка. Точка, яка відповідає поточному стану системи називається зображуючою точкою. При зміні стану зображуюча точка описує траекторію. Ця траекторія називається фазовою траекторією. Сукупність фазових траекторій, яка відповідає різним можливим початковим умовам, називається фазовим портретом.

Наочно фазову траекторію та фазовий портрет можна представити у випадку двомірного фазового простору. Двомірний фазовий простір називається фазовою площиною.

Фазова площина – це координатна площина, в якій по осях координат відкладаються дві змінні (фазові координати), які однозначно визначають стан системи другого порядку. Метод аналізу та синтезу системи управління, який базується на побудові фазового портрета, називається методом фазової площини.

Через будь-яку точку фазового простору може проходити лише одна траекторія. Однак, на фазовій площині існують особливі точки – точки в яких фазова швидкість рівна нулю, а отже це точки які є положенням рівноваги системи. Через особливі точки може проходити більше одної  фазової траекторії.

Часто при зображенні процесів на фазовій площині за фазову координату , яку відкладають по осі ординат, приймають похідну  координати , що відкладається по осі абсцис. В цьому випадку диференціальне рівняння фазових траекторій матиме вигляд:

.

Тоді фазові траекторії матимуть наступні властивості. У верхній півплощині зображуюча точка рухається зліва направо, оскільки  та  зростає. В нижній півплощині, навпаки, зображуюча точка рухається справа наліво так як  та  спадає. На осі абсцис () похідна  (за винятком точок рівноваги), і тому фазові траекторії перетинають вісь абсцис під прямим кутом.

Фазові портрети нелінійних систем характеризуються більшим різномаїттям, ніж  фазові портрети лінійних систем. Однак типи особливих точок лінійних та нелінійних систем співпадають. Тут маються на увазі ті особливі точки, в околі яких рівняння нелінійних систем допускають лінеаризацію.

Фазові портрети та типи особливих точок лінійних систем. Нехай лінійна система другого порядку описується рівнянням

,

або в нормальній формі,

.   (*)

Розв’язок, фазовий портрет та типи особливих точок залежать від коренів характеристичного рівняння

.

З рівняння (*) випливає, що система що розглядається має одну особливу точку в початку координат. В залежності від вигляду фазового портрету в околі особливих точок, останні поділяються на різні типи.

В табл. 1.2 наведені часові характеристики, фазові портрети та типи особливих точок при різних коренях характеристичного рівняння.

Таблиця 1.2

Тип коренів

Крива перехідного процесу

Фазовий портрет

Тип особливої точки

Чисто уявні

Центр

Комплексні з від’ємною дійсною частиною

Стійкий фокус

Комплексні з додатньою дійсною частиною

Нестійкий фокус

Дійсні від’ємні

Стійкий вузол

Дійсні додатні

Нестійкий вузол

Дійсні різних знаків

Сідло

Коли корені характеристичного рівняння є чисто уявними,фазові траекторії є еліпсами або колами, тобто вони є замкнутими.

Замкнутим фазовим траекторіям відповідають незатухаючі коливання. Однак ці коливання не є автоколиваннями, так як їх амплітуда залежить від початкових умов і вони не є асимптотично орбітально стійкими.

Фазові портрети нелінійних систем. Нелінійні системи можуть мати декілька положень рівноваги (особливих точок) і характеризуються більшим різномаїттям фазових портретів. Якщо праві частини нелінійних рівнянь допускають лінеаризацію в околі особливих точок, то ці особливі точки можуть бути лише тих самих типів, що й особливі точки у випадку лінійних систем.

При наявності декількох точок рівноваги можливі різні типи фазових траекторій. Особливі криві, що розділяють фазову площину на області з різними типами фазових траекторій, називаються сепаратрисами.

Фазові портрети нелінійних систем можуть мати інший тип особливої кривої – ізольовані замкнуті траекторії. Ці криві називаються граничними циклами. Якщо зсередини та зовні фазові траекторії сходяться до граничного циклу (рис. 1.3*,а), то такий граничний цикл називається стійким граничним циклом. Стійкому граничному циклу відповідає асимптотично орбітально стійкий періодичний рух (автоколивання). В системі, у якої фазовий портрет має вигляд, представлений на рис. 1.3*,а, автоколивання виникають самовільно при будь-яких початкових умовах.

Рис. 1.3*. Граничні цикли

Якщо фазові траекторії зсередини та зовні граничного цикла віддаляються від нього (рис. 1.3*,б), такий граничний цикл називається нестійким граничним циклом. Періодичний процес що відповідає нестійкому граничному циклу неможливо спостерігати. Якщо рух починається всередині такого граничного цикла, то процес зходиться до положення рівноваги. Якщо рухпочинається зовні такого граничного циклу, то процес розходиться. Нестійкий граничний цикл є границею області притягання, або границею стійкості положення рівноваги (початку координат).

Можливі два граничні цикли (рис. 1.3*,в,г). Внутрішній граничний цикл на рис. 1.3*,в стійкий, і йому відповідають автоколивання, а зовнішній граничний цикл нестійкий і є границею області автоколивань: автоколивання виникають при будь-яких початкових відхиленнях, що не виходять за зовнішній граничний цикл.

Зовнішній граничний цикл на рис. 1.3*,г є стійким і відповідає автоколиванням, а внутрішній граничний цикл є нестійким і є границею області притягання положення рівноваги. В системі з таким фазовим портретом автоколивання виникають при досить значному відхиленні системи від положення рівноваги – відхиленні, яке виходить за межі внутрішнього граничного цикла. Якщо рух системи починається всередині нестійкого граничного цикла, то вона наближається до положення рівноваги.

Побудова часових характеристик за фазовою траекторією

За фазовим портретом можна судити про характер перехідних процесів. Зокрема, по фазовій траекторії можна побудувати без розрахунків якісно часову характеристику – криву залежності  від часу, і, навпаки, за часовою характеристикою можна побудувати фазову траекторію.

В якості прикладу спершу за фазовою траекторією побудуємо часову характеристику, а потім, за часовою характеристикою – фазову траекторію. Нехай задана фазова траекторія (рис. 1.4,а).

Рис. 1.4. Побудова часової характеристики за фазовою траекторією

Позначивши на ній характерні точки (початкову точку, точки перетину з осями координат), нанесем відповідні їм точки на часовій площині і з’єднаємо їх плавною кривою (рис. 1.4,б).

Рис. 1.5. До побудови фазової траекторії за часовою характеристикою

Нехай тепер задана часова характеристика (рис. 1.5,а). Позначивши на ній характерні точки (початкову точку, точки екстремума та точки перетину з віссю часу), нанесем відповідні їм точки на фазову площину і з’єднаємо плавною кривою (рис. 1.5,б).

Методи розрахунку та побудови фазових портретів

До основних методів розрахунку та побудови фазових портретів відносять: аналітичні; графічний наближений (метод ізоклін) та методи побудови за допомогою компьютерного моделювання.

Аналітичний метод.

Даний метод базується на розвязуванні диференціальних рівнянь руху системи.

Для початку необхідно отримати дифереціальні рівняння фазових траекторій, для чого нелінійне диференціальне рівняння системи другого порядку необхідно привести до нормальної форми Коші. Для цього спочатку диференціальне рівняння динаміки системи розв’язується відносно старшої похідної. Результат такого розв’язку можна записати у вигляді:

 - загальний вигляд нелінійного диференціального рівняння, розв’язаного відносно старшої похідної,

де  - регульована величина;  - нелінійна функція.

Наприклад, маємо нелінійне рівняння другого порядку

Розв’язавши його відносно старшої похідної отримаємо

.

Для переходу до нормальної форми Коші здійснюємо підстановку

і отримаємо диференціальне рівняння системи у формі Коші:

Для отримання диференціального рівняння фазових траекторій, необхідно з диференціальних рівнянь у формі Коші виключити час. Цього можна досягти, поділивши перше диференціальне рівняння на друге. Отримаємо:

- диференціальне рівняння фазових траекторій.

Для побудови фазового портрету розв’язуємо диференціальне рівняння траекторій (розділяємо змінні та інтегруємо). Після чого проводимо побудову.

Якщо змінні у диференціальному рівнянні траекторій розділити не вдається, то використовують наближений метод побудови.

Метод ізоклін.

Ізокліною називається геометричне місце точок фазової площини, в яких фазові траєкторії мають однаковий нахил, тобто лінія, яку всі фазові траекторії перетинають під одним кутом. Із геометричного змісту похідної (тангенс кута нахилу дотичної до графіка функції) та диференціального рівняння фазових траекторій можна записати:

,                    /*/

де  - нахил фазової траекторії на фазовій площині.

Отже у кожній точці фазової площини можна знайти цілком визначену величину нахилу фазової траекторії.

Спосіб побудови полягає у наступному. Із рівняння /*/ знаходимо функцію

,    /**/

яка являє собою рівняння ізоклін.

Побудуємо ряд ізоклін 1-4 за рівнянням (**). У точці  ізокліни 1 (рис. 1.6) проведемо дві прямі  і  з нахилами  і  відповідно до перетину з ізокліною 2. Отриманий на ній відрізок  поділимо навпіл і через точку  проведемо дві прямі  і  з нахилами  і  до перетину з ізокліною 3. Потім відрізок  поділимо навпіл точкою , через яку проводимо прямі  і  з нахилами  і  і т.д. Через знайдені точки , , , … ,  проводимо фазову траєкторію. Точність побудови фазової траєкторії за методом ізоклін буде тим вища, чим частіше на графіку нанесені ізокліни.

Рис. 1.6 - Побудова фазової траєкторії за методом ізоклін

Метод гармонічної лінеаризації

Метод гармонічної лінеаризації, або метод гармонічного балансу першочергово було розроблено для дослідження періодичних режимів. Однак з часом він став використовуватися для аналізу стійкості та синтезу нелінійних систем.

Основна ідея методу полягає в наступному. Керовані системи (об’єкти), як правило, мають властивості фільтра низьких частот: при виникненні періодичних режимів вони не пропускають або пропускають зі значним ослабленням другі та більш високі гармоніки. І суть методу гармонічної лінеаризації полягає в описі нелінійної ланки лінійним рівнянням, яке отримується при нехтуванні (відкиданні) вказаними гармоніками в розкладі нелінійної функції в ряд Фур’є.

Метод гармонічної лінеаризації є наближеним методом. Однак його перевагою є те, що його можна застосовувати до систем будь-якого порядку, на відміну від методу фазової площини.

Структурну схему замкнутої нелінійної системи, яка складається з нелінійної ланки та лінійної частини – лінійної ланки, будемо називати типовою структурною схемою нелінійної системи (рис.1.7).

Рис1.7. Типова структурна схема нелінійної САУ

Розглядати будемо лише нелінійні системи, які представлені такою структурною схемою. Або які зводяться до неї.

Приймемо, що задаючий вплив . Рівняння системи мають вигляд:

,  ,  .   (+*)

Припустимо, що в системі виникає періодичний режим. Тоді нелінійна функція буде періодичною функцією часу, і її можна буде розкласти в ряд Фур’є:

,

де  - коефіцієнти Фур’є; ;  - період; трьома крапками позначені вищі (другі та більш високі) гармоніки.

Припустимо, що лінійна частина має властивості фільта низьких частот, тобто виконується умова

,  ,   

За цієї умови вищі гармоніки не здійснюють суттєвого впливу на вихідну величину  лінійної частини. Тому при визначенні  вищими гармоніками можна знехтувати, і рівняння системи (+*) представити у вигляді

,  ,  .   (+*+)

Якщо в системі виникає періодичний режим і лінійна частина є фільтром низьких частот, тобто справедлива гіпотеза фільтра, то коливання на виході лінійної частини і відповідно на вході нелінійної ланки є гармонічними.

Виберемо початок відліку так, щоб на вході нелінійної ланки . Тоді маємо

,  .

Підставивши ці вирази в (+*+), при отримаємо

,  ,  ,  (+**+)

де

,

,

або, якщо  - однозначна нечітка функція,

, .

Система (+**+) при фіксованих амплітуді та частоті є лінійною. Перехід від вихідної системи (+*) до лінеаризованої системи (+**+) називається гармонічною лінеаризацією. Коефіцієнти  та  називають коефіцієнтами гармонічної лінеаризації. Передаточну функцію

називають передаточною функцією нелінійної ланки і відповідно вираз

,

який отримується при підстановці в передаточну функцію нелінійної ланки , називають частотною передаточною функцією нелінійної ланки. В останньому виразі коефіцієнти  та  являють собою дійсну та уявну частини. Тому  будемо називати дійсним, а  -  уявним коефіцієнтом гармонічної лінеаризації.

Розрахунок коефіцієнтів гармонічної лінеаризації базується на побудові графіка вихідного сигналу нелінійної ланки, коли на її вхід подається гармонічний сигнал .

Коефіцієнти гармонічної лінеаризації типових нелінійностей неведено в таблиці

Таблиця

1

0

2

0

3

4

0

5

0

Дослідження параметрів автоколивань методом гармонічного балансу

При використанні методу гармонічної лінеаризації приймається, що гіпотеза фільтра виконується. Тоді, в системі виникає періодичний процес і на виході лінійної частини і на вході нелінійної ланки він є гармонічним . Тому періодичний режим однозначно визначається частотою  та амплітудою , і дослідження періодичного процесу зводиться до визначення цих параметрів.

Основна умова виникнення періодичного процесу. В лінеаризованій системі можуть виникати  гармонічні коливання, якщо її характеристичне рівняння має чисто уявні корені, або, якщо амплітудно-фазова характеристика розімкнутої системи проходить через точку , тобто якщо виконується рівність

.    (-+)

Це співвідношення є рівнянням відносно невідомих параметрів, частоти  та амплітуди  і визначає основну умову виникнення періодичних процесів у системі що розглядається. Автоколивання в системі можливі якщо дане рівняння має дійсні додатні корені.

Є кілька методів дослідження автоколивань. Першим розглянемо аналітичний метод.

Підставивши в рівняння (-+) вирази для передаточних функцій лінійної та лінеаризованої частин, та позбувшись дробу, отримаємо рівняння у вигляді

,

або

 (--++)

Якщо остання система рівнянь має розв’язок  (, ), то це означає, що гармонічно лінеаризоване рівняння має розв’язок  яке описує періодичний процес.

Розв’язок  описує автоколивання, якщо він асимптотично орбітально стійкий. Таким чином, дослідження автоколивань зводиться до розв’язку рівнянь (--++) та визначення асимптотичної орбітальної стійкості.

У випадку коли нелінійна ланка має однозначну характеристику і її передаточна функція має вигляд , асимптотичну орбітальну стійкість можна перевірити, скориставшись умовою, що коефіцієнт гармонічної лінеаризації  повинен бути спадаючою функцією в околі точки , тобто повинна виконуватися нерівність

.

У випадку, коли нелінійна ланка має неоднозначну характеристику, для отримання умови асимптотичної орбітальної стійкості потрібно скористатися критерієм стійкості Михайлова. Основна умова виникнення періодичного процесу відповідає проходженню кривої Михайлова через початок координат. Умова асимптотичної орбітальної стійкості при неоднозначній характеристиці нелінійної ланки матиме вигляд

Зірочка при частинних похідних  означає, що похідні визначаються в початку координат.

Графічний (частотний метод) дослідження автоколивань.

Рівняння , що визначає умову виникнення періодичного процесу, можна розв’язати графічно. Для цього представимо його наступним чином:

.

Будуємо амплітудно-фазову характеристику лінійної частини, тобто годограф функції , та обернену амплітудно-фазову характеристику нелінійної ланки з від’ємним знаком, тобто годограф функції . При побудові годографа  змінюється частота, при побудові годографа  змінюється амплітуда.

Якщо рівняння що розглядається має розв’язок, то вказані характеристики перетнуться. В точці перетину за годографом  знаходимо частоту, а за годографом  - амплітуду періодичного процесу.

Стійкість періодичного процесу встановлюється наступним чином. Якщо лінійна частина стійка, то періодичний процес буде асимптотично орбітально стійким, коли точка на годографі , що відповідає амплітуді   знаходиться зліва від амплітудно-фазової частотної характеристики при русі по ній в сторону збільшення частоти.

Розглянутий графічний (частотний) метод був запропонований Л.С.Гольдфарбом та називається методом Гольдфарба.

Дослідження стійкості нелінійних систем

Стійкість нелінійних систем є значно більш складним поняттям, ніж стійкість лінійних систем. Стійкість лінійних систем, для яких виправдовується принцип суперпозиції, є їх властивістю, тобто вимога стійкості до системи визначає структуру та значення її параметрів. При цьому фіксовані стани системи у визначені моменти часу і вхідні сигнали не мають ніякого значення. Лінійна система є або стійкою, або нестійкою і для дослідження стійкості існують порівняно прості математичні методи.

У зв’язку з тим, що у нелінійних системах може існувати особливий вид усталеного режиму – автоколивання, то необхідно дати коректне визначення стійкості. Таке визначення дав А.М.Ляпунов:

Незбурений рух стійкий, якщо при достатньо малих відхиленнях збурений рух наскільки завгодно мало відрізняється від незбуреного. При цьому система асимптотично стійка, якщо збурений рух прямує до незбуреного.

Для нелінійних систем розрізняють різні види стійкості в залежності від величини зовнішнього впливу:

-  стійкість у "малому" – це стійкість системи при безмежно малих відхиленнях від усталеного режиму;

-  стійкість у "великому" – стійкість при великих але обмежених відхиленнях (зовнішніх впливах) від усталеного режиму;

- стійкість у "цілому" – стійкість при будь-яких необмежених відхиленнях.

Стійкість називається асимптотичною, якщо система повертається до вихідного стану, тобто в ту саму точку з якої її вивів зовнішній вплив.

Стійкість називається неасимптотичною, якщо система повертається в деяку точку в певному околі від вихідного режиму.

Абсолютна стійкість – стійкість цілого класу нелінійних систем, які мають таку нелінійність, яку можна вкласти в межі певного кута.

Перший непрямий метод дослідження стійкості Ляпунова. Використовується для дослідження стійкості в "малому". Він полягає в тому, що нелінійну систему лінеаризують, використовуючи розклад в ряд Тейлора. Тоді нелінійна система стійка, якщо лінеаризована система також стійка, і навпаки. Проте, якщо лінеаризована система виявиться на межі стійкості, то про стійкість нелінійної системи судити по ній не можна.

Для нелінійних систем вирішення питання стійкості є досить складним. Наприклад, рух або рівновага, стійкі у малому, можуть з’явитися нестійкими при великих відхиленнях. З іншого боку, при одних і тих самих вхідних сигналах система може мати декілька рівноважних станів. Тобто перший метод Ляпунова, що ґрунтується на дослідженні стійкості за рівняннями першого наближення, є недостатнім для повного дослідження стійкості нелінійних систем. Унаслідок цього для дослідження стійкості “у великому” і “у цілому” використовують спеціальні методи, до яких належать другий (прямий) метод Ляпунова та критерій стійкості Попова.

Другий (прямий) метод Ляпунова. Метод ґрунтується на побудові спеціальних функцій Ляпунова, які дозволяють отримати достатні умови стійкості рівноваги "у великому". Дані функції V мають зміст відстані у спеціальному просторі станів між досліджуваним незбуреним і збуреним рухами. Якщо з часом ця функція спадає, тобто , то незбурений рух стійкий, а при  - нестійкий.

Дослідження стійкості зводиться до аналізу швидкості зміни функції V. Умови стійкості сформульовані у двох теоремах Ляпунова.

Теорема 1.  Якщо існує знаковизначена функція , похідна якої  за часом у силу диференціальних рівнянь руху є знакопостійною функцією протилежного з V знаку, або тотожно дорівнює нулю, то незбурений рух стійкий.

Теорема 2. Якщо, крім того, функціязнаковизначена, то незбурений рух стійкий асимптотично.

Відзначимо, що знакопостійною називається функція, яка при всіх значеннях своїх аргументів набуває значення тільки одного знаку або нульове значення. Знаковизначеною називається знакопостійна функція, яка набуває нульове значення тільки при нульовому значенні всіх її аргументів (на початку координат).

Складність даного методу полягає у тому, що задача вірного вибору функції Ляпунова пов’язана зі складнощами. Відсутні загальні методи побудови цих функцій.  Більше того, зустрічаються випадки, коли система є стійкою, а внаслідок невірно вибраної функції Ляпунова цей факт установити не вдається. У такому випадку для розв’язання технічних задач метод Ляпунова не є досить ефективним.

Критерій стійкості Попова. Важливою особливістю загальної теорії стійкості нелінійних систем є те, що розглядаються не конкретні види функцій (параболи, експоненти тощо), а класи функцій, які задовольняють тим чи іншим обмеженням. Якщо стан рівноваги системи асимптотично стійкий "у цілому" при будь-якій нелінійній функції із заданого класу, то вона називається абсолютно стійкою у цьому класі. Будемо розглядати клас функцій, що задовольняють секторним обмеженням. Їх характеристики на площині вміщаються у кутовому секторі, що утворений двома прямими:  і , (k2 k1).

Кажуть, що такі нелінійності належать до класу (). Можна виділити деякі підкласи цього класу:

- підклас () задовольняє умовам:

.   

Тобто, нелінійність  має будь-який контур, який не виходить за межі заданого кута .

- підклас () – будь-яка , що розташована тільки у першому і третьому квадрантах площини (x; y).

.   

Дослідження абсолютної стійкості рівноваги системи з нелінійністю із підкласу () досить просто виконується за допомогою частотного методу, запропонованого румунським вченим В.М. Поповим (1959 р.). При цьому припускається, що лінійна частина системи стійка та її комплексна передаточна функція має вигляд:

.    

Введемо поняття перетвореної комплексної передаточної функції лінійної частини:

,  

у якої дійсна частина така сама, як у , а уявна – .

Тоді можна дати таке геометричне трактування критерію Попова:

Система зі стійкою лінійною частиною абсолютно стійка у класі стаціонарних нелінійних характеристик y = (x) підкласу (), якщо через точку –1/k  на дійсній осі комплексної площини  можна провести пряму так, щоб перетворена частотна характеристика  знаходилась праворуч від цієї прямої.

На рис. +++ а), б) наведені випадки, коли умова Попова виконується, а на рис. +++, в) – не може бути виконана.

Рис. +++ - Ілюстрація критерію Попова

Загальні поняття про коректування нелінійних систем

Коректування нелінійних САК здійснюється з метою забезпечення стійкості або з метою отримання автоколивань із заданими амплітудою та частотою. Коректування можна здійснити зміною характеристик як лінійної частини, так і нелінійного елемента.

Зміна характеристики лінійної частини досягається відомими способами:

- увімкненням послідовних коректувальних пристроїв (введення похідних та інтегралів до законів регулювання);

- увімкненням зустрічно-паралельних коректувальних пристроїв (уведення жорстких і гнучких зворотних зв’язків, інерційних і безінерційних);

- увімкненням коректувальних пристроїв за збуренням (комбіноване керування).

Зміна характеристики нелінійного елемента може бути досягнута декількома способами. Деякі статичні нелінійності можна компенсувати за допомогою відповідних обернених нелінійностей. Для цього паралельно або послідовно з основною нелінійністю  вмикають компенсуючу нелінійність, яка має обернену характеристику . Еквівалентне з’єднання при цьому буде лінійним.

Під час зміни характеристики нелінійного елемента слід з’ясувати вплив різних нелінійностей регулятора на процес автоматичного керування. Розглянемо основні з них.

Ширина зони нечутливості. У більшості випадків збільшення цього параметра сприяє заспокоєнню коливань, тобто покращується стійкість системи, але при цьому з’являються додаткові усталені помилки, зокрема, статична помилка, яка пропорційна ширині зони нечутливості.

У багатоконтурній системі зона нечутливості може завдати й інших неприємностей, тобто, при охопленні зворотним зв’язком вона може утворити петльову характеристику, що сприяє утворенню автоколивань.

Характеристика з обмеженням вихідної величини. У випадку, якщо (табл. 1.1, 2), ланка працює як лінійна, значить, дана нелінійність грає роль лише при досить великих вхідних величинах : .

Така характеристика в одноконтурній системі регулювання, змінюючи форму кривої перехідного процесу при значних відхиленнях, як правило, не впливає на межу стійкості системи. Позитивний її вплив полягає у тому, що вона робить межу стійкості системи “безпечною”. Пояснимо це таким чином. На самій межі стійкості  у лінійній системі (при ) мають місце періодичні коливання. За цією межею коливання розходяться, причому розходяться до нескінченності. У нелінійній системі ці коливання будуть розходитися за лінійним законом тільки до . Далі, при , вихідна величина y буде обмежена сталою . Це буде аналогічно якби зниженню загального коефіцієнта підсилення регулятора, внаслідок чого розкачування коливань припиниться.

Такий вплив нелінійних характеристик з обмеженням або насиченням в одноконтурній системі. У багатоконтурних системах, тобто у системах із додатковими зворотними зв’язками, вплив цих нелінійних характеристик може бути негативним, особливо якщо така характеристика охоплюється зворотним зв’язком. Вона може викликати звуження зони стійкості й погіршення якості перехідного процесу порівняно з такою самою багатоконтурною лінійною системою.

Ширина гістерезисної петлі. У більшості випадків поява гістерезисної петлі у одноконтурній системі сприяє коливанням з тим більшою амплітудою, чим більша ширина петлі, що є негативним наслідком. Петлю можна розцінювати як специфічний нелінійний вираз запізнення. Якщо така нелінійність входить до складу додаткового зв’язку регулятора, то запізнення, що вводиться цією нелінійністю до зворотного зв’язку, може позитивно впливати на якість процесу керування у багатоконтурній системі подібно інерційному зворотному зв’язку.

Зазначимо також додаткові особливості введення зворотного зв’язку в релейних системах регулювання:

- уведення жорсткого зворотного зв’язку у релейний регулятор (таке, щоб реле входило до числа ланок, що охоплюються зворотним зв'язком) може перетворити розривний релейний закон регулювання у безперервний, приблизно лінійний. Це дозволяє застосовувати до нелінійної системи у першому наближенні звичайні лінійні методи розрахунку;

- уведення гнучкого зворотного зв’язку при вдалому підборі параметрів також дозволяє отримати безперервний лінійний закон регулювання, але швидкісний (астатичний);

- жорсткий зворотний зв’язок у релейній системі регулювання є сильним засобом пригнічення автоколивань, при цьому зі збільшенням коефіцієнта зворотного зв’язку розширюється зона стійкості рівноважного стану системи та прискорюється затухання перехідних процесів.

Слід зазначити також, що всі види нелінійності не тільки мають враховуватися, але часто їх можна використовувати спеціально, як нелінійні коректувальні засоби для покращання процесу регулювання.

Моделювання нелінійних систем

Протилежно до теорії лінійних систем, яка є наочною та поширеною внаслідок її завершеності, розробка теорії та методів аналізу нелінійних систем скрутна через значну багатогранність форм нелінійностей і відсутність універсальних принципів, таких, як принцип суперпозиції для лінійних систем.

Тому всі розглянуті методи аналізу нелінійних САК мають обмежене використання:

- методи лінеаризації дозволяють використовувати при розрахунках переваги лінійної теорії, але вони обмежені допустимою зоною зміни сигналів, у межах якої лінеаризація є справедливою і можливою;

- метод фазової площини обмежується аналізом систем другого порядку з постійними вхідними сигналами;

- теорія функцій Ляпунова не має обмежень, але підбір правильних функцій Ляпунова стає складною задачею.

Складні нелінійні системи, які застосовують для керування з високою точністю, за допомогою наведених методів досліджувати не можна. Для цього слід використовувати моделювання, тобто відтворення систем і сигналів на аналогових чи цифрових ЕОМ. Аналогові, цифрові та гібридні ЕОМ, що застосовуються для моделювання, мають специфічні властивості.

Важлива проблема для всіх методів моделювання полягає в тому, щоб процес розрахунку завжди починався за заданих початкових умов, оскільки від цього залежить поведінка нелінійної системи. Тому постає необхідність визначення прийнятних початкових умов на базі грубого аналізу системи за допомогою відомих наближених методів.


Випадкові процеси в автоматичних системах управління

При попередніх розрахунках ми припускали, що зовнішні впливи (керуючі дії та збурення), є визначеними відомими функціями часу. У цих випадках стан системи, що описується звичайними диференціальними рівняннями, у будь-який момент часу t однозначно визначається станом системи у попередній момент часу t0 < t. Звичайно вибирають t0 = 0 і кажуть, що стан системи однозначно визначається початковими умовами і може бути точно передбаченим для будь-якого моменту часу t. Такі системи називаються детермінованими.

Однак на практиці часто зустрічаються впливи, закон зміни яких має випадковий характер і не може бути наперед точно визначений. Такими випадковими впливами є, наприклад, добові зміни навантаження енергосистеми; пориви вітру, що діють на літак; удари хвиль у гідродинамічних системах; флуктуаційні шуми у радіотехнічних пристроях тощо. При випадкових впливах даних про стан системи у момент t0 недостатньо, щоб судити про її стан у подальший момент часу t > t0.

Випадкові дії можуть прикладатися до системи зовні (зовнішні дії) або виникати усередині деяких її елементів (внутрішні шуми). Випадкові  зміни властивостей системи звичайно можна звести до еквівалентного впливу деяких випадкових завад, що діють на неї, тому далі будемо вважати, що на систему діють тільки зовнішні випадкові впливи.

Розрахунок систем автоматичного управління при випадкових діях виконують за допомогою спеціальних статистичних методів. САУ, що спроектована на основі цих методів, буде забезпечувати виконання вимог, до цієї системи не тільки для одного детермінованого впливу, а для цілої сукупності впливів, що задані за допомогою статистичних характеристик.

Статистичні методи дозволяють з’ясувати лише закономірності, що є притаманними випадковим явищам масового характеру. Наприклад, якщо помилка системи має випадковий характер, то точне її значення у будь-який момент часу за допомогою статистичного розрахунку передбачити неможливо. Однак, якщо провести багато вимірювань помилки у однакових умовах, то, наприклад, середнє значення помилки шляхом статистичного розрахунку можна передбачити з достатньою точністю.

Випадкові процеси та їх основні статистичні характеристики

Функція, значення якої при кожному значенні незалежної змінної є випадковою величиною, називається випадковою функцією. Випадкові функції, для яких змінною є час t, називають випадковими процесами або стохастичними процесами.

Якщо, наприклад, проведено n окремих випробувань, то у результаті випадковий процес X(t) може прийняти n різних невипадкових (регулярних) функцій часу xi(t), де і = 1, 2, ..., n. Будь-яка з цих функцій xi(t), якій, у результаті випробування, виявився рівним випадковий процес X(t) називається реалізацією випадкового процесу (або можливим значенням випадкового процесу). Сказати наперед, за якою з реалізацій піде процес, неможливо.

Розглянемо, наприклад, випадковий дрейф на виході підсилювача постійного струму при вхідній напрузі, що дорівнює нулю. Щоб вивчити характеристики дрейфу, можна узяти n однакових підсилювачів, помістити їх у однакові умови роботи, одночасно увімкнути і отримати n осцилограм дрейфу на виходах підсилювачів. Кожна з осцилограм є конкретною реалізацією xi(t) випадкового процесу X(t). Для будь-якого фіксованого моменту часу t = t1 реалізація випадкового процесу xi(t1) є конкретною величиною, а значення випадкової функції X(t1) є випадковою величиною, що називається перерізом випадкового процесу у момент часу t1. Тому не можна стверджувати, що випадковий процес у даний момент часу має деяке детерміноване значення, можна говорити лише про ймовірність того, що у даний момент часу значення випадкового процесу, як випадкової величини, буде знаходитись у певних границях.

Статистичні методи вивчають не кожну з реалізацій xi(t), що утворюють множину X(t), а властивості всієї множини у цілому. Тому під час дослідження автоматичної системи управління роблять висновок про її поведінку не відносно до будь-якого певного впливу, а відносно до цілої сукупності впливів.

Статистичні властивості випадкової величини х визначають за її функцією розподілу (інтегральним законом розподілу) F(x) або за щільністю ймовірності (диференціальним законом розподілу) w(x).

Випадкові величини можуть мати різні закони розподілу: рівномірний, нормальний, експоненціальний тощо. У багатьох задачах автоматичного керування дуже часто використовують нормальний закон розподілу (закон Гауса), який має місце, якщо випадкова величина визначається сумарним ефектом від впливу великої кількості різних незалежних факторів.

З курсу теорії ймовірності відомо, що випадкова величина х при нормальному законі розподілу повністю визначається математичним сподіванням (середнім значенням) mx і середнім квадратичним відхиленням х.

Аналітичний вираз функції розподілу у цьому випадку має вигляд:

  (2.1)

Аналітичний вираз щільності ймовірності для нормального закону розподілу:

 (2.2)

Для випадкового процесу використовують також поняття функції розподілу F(x, t) і щільності ймовірності w(x, t), що залежать від фіксованого моменту часу t і від деякого вибраного рівня х, тобто є функціями двох змінних: х і t.

Розглянемо випадкову величину X(t1), тобто переріз випадкового процесу у момент часу t1. Одномірною функцією розподілу (функцією розподілу першого порядку) випадкового процесу X(t) називають ймовірність того, що поточне значення випадкового процесу X(t1) у момент часу t1 не перевищує деякого заданого рівня (числа) х1, тобто:

  (2.3)

Якщо функція F1(x1, t1) має частинну похідну за х1, тобто:

     (2.4)

то функцію w1(x1, t1) називають одномірною щільністю ймовірності (щільністю ймовірності першого порядку) випадкового процесу.

Величина

 (2.5)

являє собою ймовірність того, що X(t) знаходиться у момент часу t = t1 в інтервалі від х1 до х1 + dx1.

Прикладом випадкового процесу, що повністю характеризується одномірною щільністю ймовірності, є так званий "білий шум". Значення X(t) у цьому процесі, узяті у різні моменти часу t, цілковито незалежні одне від одного, як би близько не були вибрані ці моменти часу. Це означає, що крива "білого шуму" містить викиди, що затухають за нескінченно малі проміжки часу.

Функції  F1(x, t) і w1(x, t) є простішими статистичними характеристиками випадкового процесу. Вони характеризують випадковий процес ізольовано в окремих його перерізах, не розкриваючи взаємного зв’язку між перерізами випадкового процесу, тобто між можливими значеннями випадкового процесу у різні моменти часу.

Знання цих функцій ще недостатньо для опису випадкового процесу у загальному випадку. Необхідно охарактеризувати також взаємний зв’язок випадкових величин у різні моменти часу.

Розглянемо тепер випадкові величини X(t1) і X(t2), що відносяться до двох різних моментів часу t1 і t2 спостереження випадкового процесу.

Ймовірність того, що X(t) буде не більше х1 при t=t1 і не більше х2 при t=t2, тобто

 (2.6)

називають двомірною функцією розподілу (функцією розподілу другого порядку).

Якщо функція F2(x1, t1; x2, t2) має частинні похідні за х1 і  х2 тобто:

 ,  (2.7)

то функцію w2(x1, t1; x2, t2) називають двомірною щільністю ймовірності (щільністю ймовірності другого порядку) випадкового процесу.

Величина

 (2.8)

являє собою ймовірність того, що X(t) знаходиться у момент часу t = t1 в інтервалі від х1 до х1 + dx1, а у момент часу t = t2 - в інтервалі від х2 до х2 + dx2.

Двомірною щільністю ймовірності (2.7) повністю характеризуються так звані марковські випадкові процеси (за ім’ям відомого математика, академіка Петербурзької АН Андрія Андрійовича Маркова, який уперше дослідив ці процеси), для яких знання значення процесу у момент часу tk містить усю можливу інформацію про подальший хід процесу.

Аналогічно можна увести поняття про n-мірну функцію розподілу і   n-мірну щільність ймовірності. Чим вище порядок n, тим повніше описуються статистичні властивості випадкового процесу, але багатомірні закони розподілу є громіздкими і незручними для використання. Тому частіше обмежуються випадками, коли для опису випадкового процесу достатньо знати тільки одномірний чи двомірний закон розподілу.

У практиці досліджень систем автоматичного управління широке розповсюдження отримали порівняно більш прості, хоча й менш повні характеристики випадкових процесів, аналогічні числовим характеристикам випадкових величин: математичне сподівання, дисперсія, середнє значення квадрата випадкового процесу, кореляційна функція, спектральна щільність та інші.

Математичним сподіванням (середнім значенням) mx(t) випадкового процесу X(t)  називають величину:

  (2.9)

де w1(x, t) – одномірна щільність ймовірності випадкового процесу X(t).

Математичне сподівання випадкового процесу X(t) являє собою деяку невипадкову (регулярну) функцію часу mx(t), біля якої групуються і відносно якої коливаються усі реалізації даного випадкового процесу. Математичне сподівання називають середнім значенням випадкового процесу за множиною (статистичним середнім), оскільки воно являє собою ймовірносно усереднене значення нескінченної множини реалізацій випадкового процесу.

Середнім значенням квадрата випадкового процесу називають величину:

  (2.10)

Часто розглядають так званий центрований випадковий процес - відхилення випадкового процесу X(t) від його середнього значення mx(t):

   (2.11)

Тоді випадковий процес X(t) можна розглядати як суму двох складових: регулярної складової, що дорівнює математичному сподіванню mx(t), і центрованої випадкової складової , тобто:

   (2.12)

Зрозуміло, що математичне сподівання центрованого випадкового процесу дорівнює нулю:

 (2.13)

Для того, щоб урахувати ступінь розкидання реалізацій випадкового процесу відносно його середнього значення, застосовують поняття дисперсії випадкового процесу, яка дорівнює математичному сподіванню квадрата центрованого випадкового процесу:

 (2.14)

Дисперсія випадкового процесу є невипадковою (регулярною) функцією Dx(t), значення якої у кожен момент часу tk дорівнює дисперсії відповідного перерізу X(tk) випадкового процесу.

Математичне сподівання mx(t), дисперсія Dx(t) і середнє значення квадрата  випадкового процесу зв’язані співвідношенням:

   (2.15)

Із (2.15) видно, що середнє значення квадрата випадкового процесу  у деякій мірі ураховує і середнє значення випадкового процесу, і ступінь розкидання його реалізацій відносно цього середнього значення, тому воно широко використовується як оцінка точності систем автоматичного управління.

Іноді зручно використовувати статистичні характеристики випадкового процесу, які мають ту саму розмірність, що й сама випадкова величина:

- середнє квадратичне значення випадкового процесу:

  (2.16)

що дорівнює арифметичному значенню квадратного кореня із середнього значення квадрата випадкового процесу;

- середнє квадратичне відхилення випадкового процесу:

    (2.17)

що дорівнює арифметичному значенню квадратного кореня із дисперсії випадкового процесу.

Характеристику (2.17) використовують тільки для центрованих випадкових процесів.

Знання указаних вище статистичних характеристик часто є достатнім для вирішення багатьох задач теорії автоматичного керування.

Кореляційні функції випадкових процесів

Математичне сподівання й дисперсія є важливими характеристиками випадкового процесу, але вони не дають достатнього уявлення про те, який характер матимуть його окремі реалізації. Тобто для двох випадкових процесів, що мають цілковито різні структури, значення математичного сподівання й дисперсії можуть бути однаковими.

Для того, щоб охарактеризувати внутрішню структуру випадкового процесу, тобто врахувати зв’язок між його значеннями у різні моменти часу або, інакше кажучи, врахувати ступінь мінливості випадкового процесу, необхідно ввести поняття кореляційної функції випадкового процесу.

Кореляційною функцією випадкового процесу X(t) називають невипадкову функцію двох аргументів Rx(t1, t2), яка для кожної пари довільно вибраних значень аргументів (моментів часу) t1 і t2 дорівнює математичному сподіванню добутку двох випадкових величин  і  відповідних перерізів випадкового процесу:

  (2.18)

Різні випадкові процеси діляться на стаціонарні та нестаціонарні залежно від того, як з часом змінюються їхні статистичні характеристики. Розділяють стаціонарність у вузькому і в широкому розумінні.

Стаціонарним у вузькому розумінні називають випадковий процес X(t), якщо його n–мірні функції розподілу й щільності ймовірності при будь-якому n не залежать від зсуву всіх точок t1, t2, …, tn уздовж осі часу на однакову величину , тобто:

(2.19)

Це означає, що статистичні характеристики випадкового стаціонарного процесу незмінні у часі.

Стаціонарний випадковий процес є своєрідним аналогом усталеного процесу в детермінованих системах. Будь-який перехідний процес не є стаціонарним.

Стаціонарним у широкому розумінні називають випадковий процес X(t), математичне сподівання якого є постійним:

  (2.20)

а кореляційна функція залежить тільки від однієї змінної – різниці аргументів =t2 - t1; при цьому кореляційну функцію позначають:

 (2.21)

Процеси, що є стаціонарними у вузькому розумінні, обов’язково є стаціонарними в широкому розумінні, однак, супротивне твердження не є вірним.

Для випадкового процесу з нормальним законом розподілу математичне сподівання й кореляційна функція цілком визначають його n-мірну щільність ймовірності, тому для нормальних випадкових процесів поняття стаціонарності в широкому й вузькому розумінні співпадають.

Теорія стаціонарних процесів розроблена найбільш повно і дозволяє порівняно просто виконувати розрахунки для багатьох практичних випадків. Тому припущення щодо стаціонарності іноді доцільно робити й для тих випадків, коли випадковий процес не є стаціонарним, але на інтервалі часу, що розглядають, статистичні характеристики сигналів не встигають істотно змінитися.

У теорії випадкових процесів використовують два поняття середніх значень:

- середнє значення за множиною (математичне сподівання) (12.9), що визначається на підставі спостережень за множиною реалізацій випадкового процесу в один й той самий момент часу; середнє значення за множиною позначають хвилястою лінією над виразом, що описує випадкову функцію, тобто ;

- середнє значення за часом, що визначається на підставі спостереження за окремою реалізацією випадкового процесу x(t) протягом достатньо тривалого часу Т; середнє значення за часом позначають прямою рисою над виразом, що описує випадкову функцію, і визначають за формулою:

  ,    (2.22)

якщо ця границя існує.

Взагалі, для одного й того самого випадкового процесу величини  є різними. Однак, існує клас стаціонарних випадкових процесів, що називають ергодичними, для яких середнє за множиною дорівнює середньому за часом, тобто:

      (2.23)

Кореляційна функція Rx() ергодичного стаціонарного випадкового процесу X(t) необмежено зменшується за модулем при ||.

Властивість ергодичності має дуже велике практичне значення. Для визначення статистичних властивостей деяких об’єктів, якщо важко здійснити одночасне спостереження за ними у довільно вибраний момент часу (наприклад, за наявності одного дослідного зразка), його можна замінити тривалим спостереженням за одним об’єктом. Іншою мовою, окрема реалізація ергодичного випадкового процесу на нескінченному інтервалі часу цілком визначає весь випадковий процес із його нескінченними реалізаціями. Цей факт лежить в основі методу експериментального визначення кореляційної функції стаціонарного випадкового процесу за одною реалізацією.

Для ергодичних випадкових процесів за умови, що середнє значення випадкового процесу дорівнює нулю (), кореляційну функцію можна визначити за виразом:

.   (2.24)

Крім того для ергодичних випадкових процесів можна встановити дуже важливий зв’язок між дисперсією й кореляційною функцією – дисперсія стаціонарного випадкового процесу дорівнює початковому значенню кореляційної функції:

Dx = Rx(0) = const.    (2.25)

Звідси випливає, що дисперсія стаціонарного випадкового процесу є постійною, отже постійним є й середнє квадратичне відхилення:

 .    (2.26)

Статистичні властивості двох випадкових процесів X(t) і G(t) можна охарактеризувати взаємною кореляційною функцією Rxg(t1, t2), яка для кожної пари довільно вибраних значень аргументів t1 і t2 дорівнює:

  (2.27)

Для ергодичних випадкових процесів можна записати:

(2.28)

де x(t) і g(t) – будь-які реалізації стаціонарних випадкових процесів X(t) і G(t) відповідно.

Взаємна кореляційна функція (2.28) характеризує взаємний статистичний зв’язок двох випадкових процесів X(t) і G(t) у різні моменти часу, що віддалені один від одного на відрізок часу . Значення Rxg(0) характеризує цей зв’язок в один і той самий момент часу.

Якщо випадкові процеси X(t) і G(t) статистично не зв’язані між собою і мають нульові середні значення, то їх взаємна кореляційна функція для всіх дорівнює нулю. Однак, супротивне твердження про те, що за нульової взаємної кореляційної функції процеси є незалежними, слушне тільки для процесів із нормальним законом розподілу.

Наведемо без доказу деякі основні властивості кореляційних функцій Rx().

1. Початкове значення кореляційної функції (див. 2.25) дорівнює дисперсії випадкового процесу:  Rx(0) = Dx.

2. Значення кореляційної функції за будь-якого не може перевищувати її початкового значення, тобто:

Rx(0) |Rx()|.    (2.29)

3. Кореляційна функція є парною функцією , тобто:

Rx() = Rх(-).    (2.30)

4. Кореляційну функцію суми випадкових процесів Z(t) = X(t) + G(t) визначають виразом:

Rz() = Rх() + Rg() + Rxg() + Rgx(),  (2.31)

де Rxg() і Rgx() – взаємні кореляційні функції.

5. Кореляційна функція сталої величини x(t) = A0 дорівнює квадрату цієї сталої величини A02 (рис. 2.1, а).

6. Кореляційна функція періодичної функції, наприклад x(t)=Asin(1t+), являє собою косинусоїду (рис. 2.1, д), що має ту саму частоту 1, що й x(t), і не залежну від зсуву фази , тобто:

Rх() = (А2/2)cos1,    (2.32)

7. Кореляційна функція часової функції, що розкладається у ряд Фур’є:

має такий вигляд:

  (2.33)

8. Типову кореляційну функцію стаціонарного випадкового процесу (рис. 2.1, б) можна апроксимувати таким аналітичним виразом:

   (2.34)

де Dx – дисперсія, = const – параметр затухання.

Рис. 2.1 – Реалізації випадкового процесу x(t) і відповідні їм кореляційні функції Rx() і спектральні щільності Sx()

Зі збільшенням зв’язок між X(t) і X(t+) послаблюється і кореляційна функція стає менше. На рис. 2.1, б,в наведені дві кореляційні функції й дві реалізації випадкового процесу, що їм відповідають. Легко помітити, що кореляційна функція, яка відповідає випадковому процесу з більш тонкою (більш мінливою) структурою, зменшується швидкіше. Іншою мовою, чим більш високі частоти присутні у випадковому процесі, тим швидкіше убуває відповідна кореляційна функція.

9. Кореляційна функція стаціонарного випадкового процесу, на який накладена періодична складова з частотою k, також буде містити періодичну складову тієї самої частоти.

10. Чим слабкіший зв’язок між X(t) і X(t+), тим швидкіше убуває кореляційна функція Rx(). Для білого шуму, де цей зв’язок відсутній, кореляційна функція являє собою -функцію (рис. 2.1, г):

Rx() = N(),     (2.35)

де N = const.

Зазначимо, що випадковий процес типа білого шуму є фізично нереальним, оскільки йому відповідає нескінченно велике значення дисперсії й середнє значення квадрату випадкової величини , а отже, й нескінченно велика потужність.

Під час вирішення практичних задач часто використовують нормовану кореляційну функцію:

х() = Rx()/Dx.     (2.36)

Ця функція зручна тим, що завжди х(0) = 1.

Іноді розглядають нормовану взаємну кореляційну функцію:

,   (2.37)

причому можна показати, що .

Кореляційні функції випадкових процесів можна визначити за експериментальними даними (за експериментальною реалізацією випадкового процесу). Але такий спосіб є трудомістким, тому на практиці звичайно кореляційні функції визначають за допомогою спеціальних приборів – кореляторів, що автоматично обчислюють середні добутки двох координат осцилограм, які знаходяться одна від одної на відстані .

Спектральні щільності випадкових процесів

Під час дослідження автоматичних систем керування користуються ще однією характеристикою стаціонарного випадкового процесу – спектральною щільністю Sx(), яка у багатьох випадках є більш зручною, ніж кореляційна функція.

Термін “спектральна щільність” походить з теорії електричних коливань. Фізичний зміст спектральної щільності полягає в тому, що вона характеризує розподіл потужності сигналу за частотним спектром (кожна елементарна потужність, яка відповідає нескінченно малій ділянці спектра від до + d, пропорційна значенню функції Sx() для даної частоти ). Спектральну щільність можна визначити експериментально через середню величину квадрата амплітуди гармонік реалізації випадкового процесу. Прилади, що застосовують для цього, називаються спектрометрами.

Аналітично спектральна щільність Sx() випадкового процесу X(t) визначається як перетворення Фур’є кореляційної функції Rx():

     (2.38)

За допомогою формули Ейлера  вираз (2.38) можна подати у вигляді:

 (2.39)

Оскільки  - непарна функція , то другий інтеграл у виразі (2.39) дорівнює нулю. Тоді з урахуванням, що  - парна функція , отримаємо:

 (2.40)

Оскільки , то з (2.40) випливає:

Sx() = Sx(-).     (2.41)

Таким чином, спектральна щільність Sx() є дійсною і парною функцією частоти , тому графік цієї функції завжди симетричний відносно осі ординат.

Якщо спектральна щільність відома, то за формулою оберненого перетворення Фур’є можна знайти відповідну кореляційну функцію:

 (2.42)

З урахуванням (2.25) і (2.42) можна встановити важливий зв’язок між дисперсією Dx і спектральною щільністю Sx() випадкового процесу:

 (2.43)

Взаємну спектральну щільність Sxg(j) двох стаціонарних випадкових процесів X(t) і G(t) визначають як перетворення Фур’є від взаємної кореляційної функції Rxg():

  (2.44)

Взаємна спектральна щільність Sxg(j) є мірою статистичного зв’язку між двома стаціонарними випадковими процесами X(t) і G(t). Якщо ці процеси некорельовані й мають рівні нулю середні значення, то взаємна спектральна щільність дорівнює нулю, тобто Sxg(j)=0.

На відміну від спектральної щільності Sx() взаємна спектральна щільність не є парною функцією і являє собою не дійсну, а комплексну функцію.

Розглянемо без доказу деякі властивості спектральної щільності Sx().

1. Спектральна щільність білого шуму є постійною на всьому діапазоні частот (рис. 2.1, г):

Sx() = N = const.     (2.45)

Це означає, що енергія білого шуму розподілена за всім спектром рівномірно, а сумарна енергія процесу дорівнює нескінченності, що фізично неможливо. Тобто білий шум є математичною ідеалізацією реального процесу. Походження терміну “білий шум” пояснюється аналогією такого процесу з білим світлом, що має однакові інтенсивності всіх компонент.

2. Спектральна щільність постійного сигналу x(t) = A0 являє собою -функцію, що розташована на початку координат (рис. 2.1, а):

Sx() = 2A02().    (2.46)

Фізично це означає, що вся потужність постійного сигналу зосереджена на нульовій частоті.

3. Спектральна щільність періодичного сигналу x(t)=Asin(1t+) являє собою дві -функції, що розташовані симетрично відносно початку координат при = 1 і = -1 (рис. 2.1, д):

.  (2.47)

Це означає, що вся потужність періодичного сигналу зосереджена на двох частотах: 1 і -1 (для зони додатних частот уся потужність періодичного сигналу зосереджена на одні частоті 1).

4. Спектральна щільність часової функції, що розкладається у ряд Фур’є має вигляд:

. (2.48)

Цій спектральній щільності відповідає лінійчатий спектр (рис. 2.2) із -функціями, що розташовані на додатних і від’ємних частотах гармонік (-функції умовно зображені так, що їх висоти показані пропорційними коефіцієнтам при одиничній -функції, тобто величинам .

5. Спектральна щільність випадкового процесу, що не містить періодичну складову, являє собою графік без чітко виражених піків (рис. 2.1, б, в). У цьому випадку спектральна щільність апроксимується аналітичним виразом:

Sx()=2Dx/(2+2)= =2DxTx/(1+2 Tx2),       (2.49)

де Dx – дисперсія; = const – параметр затухання; Тх = 1/ - сталий коефіцієнт.

Із рис. 2.1, б, в видно, що чим ширше графік спектральної щільності Sx(), тим вуже графік відповідної кореляційної функції Rx(), і навпаки.

6. Спектральна щільність випадкового процесу, на який накладені періодичні складові, містить безперервну частину й окремі -функції, що відповідають частотам цих періодичних складових.

Окремі піки на графіку спектральної щільності вказують на те, що випадковий процес змішаний із захованими періодичними складовими. На рис. 2.3 наведено графік спектральної щільності випадкового процесу, на який накладено один періодичний сигнал з частотою k.

Іноді розглядають нормовану спектральну щільність х(), яка має розмірність часу:

х() = Sx()/Dx.     (2.50)

Проходження випадкового сигналу крізь лінійну систему

Розглянемо стійку стаціонарну лінійну систему автоматичного керування з передаточною функцією W(s) й імпульсною перехідною функцією w(t). Припустимо, що на вхід цієї системи надходить стаціонарний випадковий процес X(t) із середнім значенням, що дорівнює нулю, кореляційною функцією Rx() і спектральною щільністю Sx(). Усталений вихідний сигнал Y(t) також буде стаціонарним випадковим процесом, середнє значення якого дорівнює нулю, однак, його статистичні характеристики Rу() і Sу() будуть відрізнятися від статистичних характеристик вхідного сигналу.

Зв’язок між кореляційними функціями вхідного і вихідного сигналів можна визначити за допомогою інтеграла Дюамеля :

,  (2.51)

де - незалежна змінна інтегрування.

Для моменту часу (t + ) отримуємо:

, (2.52)

де - нове позначення незалежної змінної інтегрування.

Кореляційна функція стаціонарного випадкового процесу на підставі (2.24) дорівнює:

.   (2.53)

Підставивши до (2.53) вирази (2.51) і (2.52) після перетворень отримаємо шукану залежність:

.  (2.54)

Вираз (2.54) дозволяє за відомою кореляційною функцією Rx() випадкового процесу на вході системи і відомою імпульсною перехідною функцією w(t) системи знайти кореляційну функцію Rу() випадкового процесу на виході системи.

На підставі (2.38) і (2.54) з урахуванням того, що зображенням Фур’є імпульсної перехідної функції є комплексна передавальна функція, тобто F{w(t)} = W(j), можна визначити зв’язок між спектральними щільностями вхідного і вихідного випадкових процесів:

.     (2.55)

Таким чином, спектральна щільність стаціонарного випадкового процесу на виході лінійної системи дорівнює спектральній щільності випадкового процесу на вході системи, помноженій на квадрат модуля комплексної передавальної функції цієї системи.

За виразами (2.54) і (2.55) можна розв’язувати не тільки задачу аналізу (визначення характеристик випадкової функції на виході системи), а й задачу синтезу, тобто вибирати параметри динамічної системи таким чином, щоб отримати Rу() і Sy() близькими до заданих.

Розглянемо два важливих випадки проходження випадкового сигналу крізь лінійну систему.

Статистичне диференціювання. Під час надходження випадкового сигналу до ідеального диференціювального пристрою з передавальною функцією W(s) = s маємо: .

Тоді спектральна щільність вихідної величини (похідної від вхідної величини) буде:

.     (2.56)

У разі подвійного диференціювання Sх() помножується на  4 і т.д.

Таким чином, чим більш високі частоти містить спектр випадкового сигналу, тим сильніше вони підсилюються. Це завжди необхідно мати на увазі під час уведення до системи коректувального диференціювального пристрою. У разі значного рівня випадкових завад уведення такої ланки може не привести до поліпшення динамічних властивостей, а навіть погіршити їх.

Статистичне інтегрування. Під час надходження випадкового сигналу до ідеального інтегрувального пристрою з передавальною функцією W(s) = 1/s маємо: .

Тоді спектральна щільність вихідної величини (інтегралу від вхідної величини) буде:

.    (2.57)

У разі подвійного інтегрування Sх() ділиться на  4 і т.д.

У даному випадку високі частоти послаблюються (відфільтровуються) інтегрувальною ланкою, на виході якої отримуємо більш згладжений сигнал.

Рівняння Вінера-Хопфа.

Це рівняння встановлює зв’язок між кореляційними функціями вхідного X(t) і вихідного Y(t) сигналів, що діють у лінійній динамічній системі.  

Відповідно до (2.28) взаємна кореляційна функція цих сигналів має вигляд:

  (2.58)

Тоді з урахуванням (2.51) запишемо:

(2.59)

Цей вираз має назву рівняння Вінера-Хопфа.

Застосувавши до інтегрального рівняння (2.59) пряме перетворення Фур’є, можна записати:

Syx() = W(j)Sx() або W(j) = Syx() / Sx(),  (2.60)

де Syx() і Sx() – взаємна і власна спектральні щільності.

Застосовуючи до (2.60) обернене перетворення Фур’є, маємо:

.    (2.61)

Рівняння (2.60) і (2.61) дозволяють знайти динамічні характеристики системи W(j) і w(t) за відомими імовірнісними характеристиками входу X(t) і виходу Y(t), що визначаються за реалізаціями випадкового процесу.


3.
Дискретні та цифрові системи

Система управління називається дискретною, якщо вона містить хоча б один дискретний елемент. Елемент називається дискретним, якщо його вихідний сигнал квантується по часу або по рівню. Кажуть, що сигнал квантований по часу, якщо він являє собою послідовність імпульсів, і квантованим по рівню, якщо він приймає дискретні значення, тобто значення, кратні певній мінімальній величині, яку називають рівнем квантування, або квантом.

Розрізняють три види квантування сигналів: за рівнем, за часом, за рівнем і за часом одночасно.

Квантування за рівнем полягає у фіксації визначених дискретних значень безперервного сигналу. При цьому безперервний сигнал замінюється сигналом, який змінюється східчасто. Суміжні дискретні значення відрізняються одне від одного на постійну величину , яка називається кроком квантування. Перехід з одного рівня на інший відбувається у моменти часу, коли безперервний сигнал досягає чергового фіксованого значення (рис. 3.1, а), або коли сигнал проходить середину інтервалу між двома суміжними значеннями (рис. 3.1, б).

Квантування за часом полягає у фіксації значень безперервного сигналу в рівновіддалені один від одного дискретні моменти часу. При цьому квантований сигнал може мати східчасту форму (рис. 3.1, в) або являти собою послідовність імпульсів (рис. 3.1, г). Суміжні моменти відрізняються один від одного на постійну величину t = T, яка називається інтервалом дискретності або періодом повтору.

Під час сумісного квантування за рівнем і за часом фіксуються дискретні за рівнем значення, найближчі до значень безперервного сигналу в дискретні моменти часу (рис. 3.1, д, е).

Залежно від виду квантування, що застосовується, всі дискретні системи можна розділити на три класи:

- релейні; у них квантування відбувається за рівнем;

- імпульсні, в яких квантування відбувається за часом;

- цифрові (релейно-імпульсні) з квантуванням і за рівнем, і за часом.

Рис. 3.1 - Види квантування сигналів: за рівнем (а; б), за часом (в; г), за рівнем і за часом (д; е)

Квантування за рівнем у релейних системах відбувається за допомогою спеціальних елементів – квантувачів. Найпростішим квантувачем є дво- та трипозиційні реле. Вони квантують безперервний сигнал відповідно за двома і трьома рівнями.

Квантування за часом відбувається за допомогою імпульсного елемента.

Одночасне квантування сигналів за рівнем і за часом у цифрових системах виконується за допомогою аналого-цифрових перетворювачів (АЦП).

На другому етапі перетворення квантований сигнал відповідно до одного із законів модуляції перетворюється на імпульсну послідовність.

Розрізняють такі типи імпульсної модуляції (рис.3.2):

Амплітудно - імпульсну модуляцію (AІМ), при якій змінюється амплітуда вихідних імпульсів у залежності від значень вхідної величини в моменти квантування , де - коефіцієнт передачі імпульсного елемента.

Широтно-імпульсну модуляцію (ШІМ), при якій змінюється ширина імпульсів  в залежності від значень вхідної величини в моменти квантування. Величину - називають відносною тривалістю імпульсів. Вона показує яку частину періоду слідування імпульсів складає його тривалість.

Фазово–імпульсну модуляцію (ФІМ), при якій відбувається часовий зсув імпульсів  у залежності від значень вхідної величини в моменти квантування.

З усіх видів імпульсної модуляції найпростішою є АІМ. У випадку АІМ імпульсний елемент є лінійною динамічною ланкою. При амплітудно-імпульсній модуляції імпульсний елемент виробляє прямокутні імпульси однакової тривалості з амплітудою, пропорційною величині вхідного сигналу в моменти квантування.

Широке застосування систем керування з різними видами модуляції сигналу пояснюється низкою їх переваг:

- можливість багатоканального керування, тобто дискретний керуючий пристрій можна використовувати для одночасного керування декількома однотипними об’єктами;

- можливість стикування з цифровими обчислювальними пристроями, що дозволяє реалізувати більш складні закони керування;

- можливість тривалого збереження і запам’ятовування інформації;

- висока завадостійкість, надійність; підвищена точність передавання і перетворення сигналів;

- менші габарити та вага; зручність для агрегатного-блочної побудови систем.

Рис.3.2. Види імпульсної модуляції.

САК з імпульсною модуляцією сигналу відрізняється від безперервної системи наявністю імпульсного модулятора, який перетворює безперервний вхідний сигнал на послідовність імпульсів. Залежно від того, який з параметрів імпульсної послідовності модулюється, тобто змінюється під дією модулюючого сигналу, розрізняють:

- амплітудно-імпульсний модулятор, якщо модулюється амплітуда вихідних імпульсів; при цьому тривалість імпульсів = const і період слідування ;

- широтно-імпульсний модулятор, якщо модулюється ширина (тривалість) вихідних імпульсів; при цьому амплітуда ; ;

- частотно-імпульсний модулятор, якщо модулюється частота повтору імпульсів у вихідній імпульсній послідовності; амплітуда і тривалість імпульсів постійні, тобто ; = const.


3.1. Математичний апарат для дослідження імпульсних САК

Решітчасті функції. Вихідний сигнал імпульсного елемента визначається величиною вхідного сигналу тільки у дискретні моменти часу на початку кожного періоду слідування імпульсів і надалі не залежить від зміни вхідного сигналу до початку наступного періоду слідування (модуляція першого роду). Тому достатньо знати значення вхідного сигналу лише у дискретні моменти часу, тобто у моменти nT0, де n – ціле число. На підставі цього безперервну функцію на вході імпульсного елемента можна замінити так званою решітчастою функцією.

Решітчастою функцією називається функція дискретного аргументу, значення якої визначені у дискретні моменти часу t = nT0. Між цими моментами функція дорівнює нулю.  Решітчасту функцію звичайно позначають f [nT0] або, якщо перейти до відносного часу, f [n] (рис. 3.3). Тоді можна записати

Використовують також поняття зміщеної решітчастої функції. Аргумент цієї функції t = nT0 + t, тобто дискретні значення функції вибираються для моментів часу, зміщених на t=const  відносно nT0. Зміщення може бути додатним або від’ємним, за умови, що |t| Т0. Зміщена решітчаста функція позначається f [nT0, t] або, при використанні відносного часу, - f [n, ], де =t/Т0 – відносне зміщення. Надалі будемо вважати, що у решітчастої функції f [n, ] аргумент n 0 і параметр 0.

Різниці решітчастих функцій та різницеві рівняння. Різниці решітчастих функцій є аналогами похідних безперервних функцій. Різниця першого порядку (перша різниця) решітчастої функції f [n] дорівнює

f [n] = f [n+1] - f [n].   (3.1)

Аналогію між першою різницею і першою похідною видно з того, що перша різниця, як і перша похідна дорівнює відношенню приросту функції до приросту аргументу f [n]/n, але через те, що n = (n+1)–n = 1, перша різниця дорівнює f [n].

Різниця другого порядку (друга різниця) обчислюється за формулою

2f [n] = f [n+1] - f [n],   (3.2)

або, якщо розкрити перші різниці, за формулою (3.1),

2f [n] = f [n+2] - 2f [n+1] + f [n].   (3.3)

Різниця k-го порядку має вигляд:

kf [n] = k-1f [n+1] - k-1f [n] =  (3.4)

де  - коефіцієнт бінома Ньютона.

Різниці (3.1)-(3.4) називаються прямими. Є також зворотні різниці:

перша

f [n] = f [n] - f [n-1];   (3.5)

друга

2f [n] = f [n] - f [n-1] = f [n] - 2f [n-1] + f [n-2];      (3.6)

k-го порядку

kf [n] = k-1f [n] - k-1f [n-1] =   (3.7)

Аналогами інтеграла безперервної функції у межах від 0 до t для решітчастої функції f [n] є неповна сума

  (3.8)

і повна сума

  (3.9)

У повній сумі, на відміну від неповної, значення f [n] у момент часу t=nT0 також бере участь у формуванні результату.

Аналогами диференціальних рівнянь є різницеві рівняння (рівняння у кінцевих різницях). Лінійні різницеві рівняння зі сталими коефіцієнтами при використанні прямих різниць мають вигляд:

b0my[n] + b1m-1y[n] + … + bmy[n] = f [n],  (3.10)

де f [n], y[n] – відповідно задана і шукана решітчасті функції.

Якщо f [n] 0, то рівняння (3.10) називається однорідним.

Приклад 3.1 Отримати різницеве рівняння з диференціального рівняння:

З урахуванням (3.1) і (3.3) запишемо:

 

Тоді задане рівняння матиме вигляд:

або  

Для розв’язування різницевих рівнянь (3.10) необхідно задавати початкові умови у вигляді значень шуканої функції y[n] та її різниць від першої до різниці (m-1)–го порядку.

Різницеві рівняння можна розглядати як рекурентні співвідношення, які дають змогу обчислювати значення y[n] при n=1, 2, 3, … для заданих початкових умов. З урахуванням (3.4) рівняння (3.10) матиме вигляд:

a0y[n+m] + a1y[n+m-1] + … + amy[n] = f [n],  (3.11)

де

Наприклад, якщо задане різницеве рівняння (3.11) третього порядку:

a0y[n+3] + a1y[n+2] + a2y[n+1]+a3y[n] = f [n],

і відомі функції f [n] та початкові умови y[0], y[1], y[2], то дискретні значення функції y[n] обчислюються так:

при n=0:  a0y[3] + a1y[2] + a2y[1]+a3y[0] = f [0],

     y[3] = (f [0] - a1y[2] - a2y[1] - a3y[0]) / a0;

при n=1:  a0y[4] + a1y[3] + a2y[2]+a3y[1] = f [1],

     y[4] = (f [1] - a1y[3] - a2y[2] - a3y[1]) / a0;

і т.д.

Рівняння (3.10) є більш близьким аналогом диференціального рівняння, однак рівняння (3.11) легше використовувати, і тому воно більш розповсюджене.

Різницеві рівняння можна розв’язувати також класичним і операторним методами, аналогічними методам розв’язування диференціальних рівнянь. З операторних методів найбільшого поширення набув метод, що ґрунтується на використанні z-перетворення.

Основи z - перетворення. Дискретну функцію f [nT0] можна аналітично записати у вигляді ряду:

  (3.12)

де f(t) – породжувальна безперервна функція; (t-nT0) – зміщена на час nT0 дельта-функція.

Перетворення  Лапласа від функції (3.12) має вигляд:

 (3.13)

Це перетворення називається дискретним перетворенням Лапласа. У символічній формі його записують так:

Якщо аргументом безперервної функції є відносний час t/T0, то формула дискретного перетворення матиме вигляд:

  (3.14)

де q=pT0 – комплексне число, яке називається параметром дискретного перетворення Лапласа.

Зображення F(p) і F(q) є трансцендентними функціями від  p і q, що робить неможливим застосування звичайних методів аналізу в площині p або q для дослідження імпульсних систем. Більш прийнятним є  z - перетворення. Формула z–перетворення випливає з формули (3.14), якщо виконати підстановку eq = z. Вона має вигляд:

 (3.15)

Приклад 3.2 Визначити z-перетворення одиничної решітчастої функції f[n]=1[n].

За формулою (3.15) запишемо

Сума цієї геометричної прогресії:

z- перетворення деяких функцій подано в таблиці 3.1.

Таблиця 3.1  

z- перетворення основних функцій

Безперервна функція f(t)

Решітчаста функція f [n]

Перетворення Лапласа F(p)

z-перетворення F(z)

1(t)

1[n]

1/p

z/(z-1)

t

nT0

1/p2

T0z / (z-1)2

t2

(nT0)2

2/p3

T0 2z(z+1) / (z-1)3

t3

(nT0)3

6/p4

T0 3z(z2+4z+1) / (z-1)4

e-t

1/(p + )

z/(z-d), d =

1 - e-t

/[p(p+)]

(1-d)z / [(z-1)(z-d)],

d =

sin t

sin nT0

/(p2 + 2)

zsin T0/(z2

-2zcos T0 + 1)

Розглянемо основні властивості z-перетворення відносно незміщених решітчастих функцій.

  1.  Властивість лінійності. Зображення лінійної комбінації решітчастих функцій дорівнює такій самій лінійній комбінації їх зображень.
  2.  Запізнення і випередження (зсув за часом на ціле число періодів). Для решітчастої функції, зсунутої вправо (запізнюючої) на m періодів, маємо:

Z{f [n-m]}= z-mF(z),    (3.16)

де F(z) – зображення функції f [n].

Для решітчастої функції, зсунутої вліво (випереджуючої) на m періодів, маємо:

Z{f [n + m]}=  (3.17)

  1.  Множення оригіналу на експоненту  Зображення незміщеної решітчастої функції записуємо у вигляді:

  (3.18)

  1.  Зображення різниць (аналог зображення похідної). Для різниці k-го порядку за нульових початкових умов, тобто n=0, маємо:

Z{k f [n]} = (z-1)k F(z),   (3.19)

звідки для першої різниці (k=1)

Z{ f [n]} = (z-1) F(z).

5. Зображення суми (аналог зображення інтеграла). Зображення суми має вигляд:

 (3.20)

6. Початкове значення решітчастої функції. При n=0 значення решітчастої функції обчислюється за формулою:

  (3.21)

7. Кінцеве значення решітчастої функції. При n = запишемо:

  (3.22)

8. Згортка решітчастих функцій. Якщо

Z{f1[n]} = F1(z) і Z{f2[n]} = F2(z),

то

F1(z)F2(z) =  (3.23)

9. Зображення функції  Маємо

Z{F(p)} = F1(z) Z{F2(p)}.   (3.24)

За допомогою z-перетворення можна розв’язувати різницеві рівняння, причому алгоритм розв’язку аналогічний послідовності розв’язування диференціальних рівнянь при використанні перетворення Лапласа безперервних функцій. Спочатку треба перейти від різницевих рівнянь відносно оригіналів до алгебраїчних рівнянь відносно їх z-зображень, потім визначити   z-зображення шуканої функції, розв’язавши знайдене алгебраїчне рівняння, і нарешті перейти від z-зображення до оригіналу – шуканої решітчастої функції.

Для переходу до оригіналу зображення доцільно подати у вигляді простих дробів, для яких оригінали можна знайти у таблицях z-перетворень функцій часу, і знайти оригінал y[n] як суму оригіналів, що відповідають простим дробам.

Значення функції y[n] у дискретних точках можна обчислити без знаходження аналітичного виразу для неї, якщо розкласти зображення Y(z) в ряд Лорана

Y(z) = c0 + c1z-1 + c2z-2 + c3z-3 + …   (3.25)

За формулою (3.15) отримаємо:

 (3.26)

Із (3.25) і (3.26) випливає, що y[0] = c0, y[1] = c1, y[2] = c2 і т.д.

Найзручнішим способом розкладання в ряд Лорана дробово-раціональних функцій є ділення чисельника на знаменник.

Приклад 3.3 За відомим z-перетворенням Y(z) = 3z/(z2 – 0,7z + 0,1) визначити оригінал y[n].

Розкладемо Y(z) на суму простих дробів. Для цього визначимо корені рівняння z2 – 0,7z + 0,1 = 0. Маємо z1=0,5; z2=0,2. Тоді можна записати:

Y(z) = 3z/(z – 0,5)(z - 0,2) = 10[z / (z-0,5) – z / (z-0,2)].

З таблиці 3.1 знаходимо, що доданку z/(z-0,5) відповідає оригінал , де =d = z1 = 0,5. Тобто оригінал має вигляд 0,5n Аналогічно для доданка z/(z-0,2) маємо оригінал 0,2n. Отже, шукана решітчаста функція має вигляд:

y[n] = 10(0,5n - 0,2n).

Звідси знаходимо дискретні значення функції y[n]: y[0] = 0; y[1] = 3; y[2] = 2,1; y[3] = 1,17 і т.д.

Визначимо тепер дискретні значення функції y[n], розклавши зображення Y(z) в ряд Лорана діленням чисельника на знаменник:

3z / (z2 – 0,7z + 0,1) = 3z-1 + 2,1z-2  + 1,17z-3 + …

Отже,  Y(z) = 0 + 3z-1 + 2,1z-2  + 1,17z-3 + …, тобто y[0] = 0; y[1] = 3; y[2] = 2,1; y[3] = 1,17.


3.2. Функціональна та алгоритмічна структури системи з амплітудно-імпульсною модуляцією

Розглянемо структуру найпоширенішої  імпульсної системи – системи з амплітудною модуляцією першого роду.

У загальному випадку імпульсний елемент системи може входити до складу будь-якого з її функціональних блоків, але найчастіше імпульсний характер системи зумовлений особливостями функціонування її сприймаючого або порівнюючого блока. Наприклад, у системах керування технологічними процесами часто використовують датчики дискретної дії.

Типова функціональна схема імпульсної САУ зображена на рис.3.4, а. Для полегшення аналізу імпульсної САУ реальний імпульсний елемент (ІЕ) замінимо еквівалентним послідовним з’єднанням найпростішого імпульсного елемента (НІЕ) і формувача імпульсів (ФІ) (рис. 3.4, б).

НІЕ перетворює безперервний сигнал на послідовність миттєвих рівновіддалених один від одного імпульсів, яку можна подати у вигляді послідовності -функцій, промодульованих дискретними значеннями вхідного сигналу  (рис. 3.5). Формувач імпульсів перетворює ці -імпульси на імпульси заданої форми (у розповсюдженому випадку – прямокутної форми тривалості ).

Оскільки реакція ланки на - імпульси становить імпульсну перехідну або вагову функцію ω(t), то передаточна функція формувача імпульсів у цьому випадку:

  (3.27)

де wф(t) – імпульсна перехідна функція формувача імпульсів.

Прямокутний імпульс на виході формувача можна зобразити як суму додатної та від’ємної ступінчастих функцій, що зсунуті на час = Т0 (рис. 3.6), тобто

wф(t) = 1(t) – 1(t-).    (3.28)

Тоді

      (3.29)

де Т0 – період слідування імпульсів;   = 0 – відносна тривалість імпульсів.

За умови =1 (сигнал на виході імпульсного елемента зберігається протягом усього періоду Т0 слідування імпульсів) передаточна функція формувача має вигляд:

   (3.30)

Такий імпульсний елемент називається екстраполятором нульового порядку або екстраполятором із фіксацією на період. При низьких частотах, коли частота вхідної дії вх  1/Т0, цей елемент за своїми властивостями є близьким до ланки запізнення з часом запізнення 0/2, тобто

   (3.31)

При високих частотах елемент (3.30) є еквівалентним ідеальній інтегруючій ланці й послаблює вхідний сигнал.

Якщо тривалість імпульсу значно менша за період, тобто   1, можна записати:

(3.32)

Тоді передаточна функція формувача імпульсів має вигляд:

   (3.33)

Для прямокутного імпульсу з амплітудою К відповідно до (3.30, 3.33) можна записати:

   (  1). (3.34)

Аналогічно передавальні функції формувача імпульсів можна отримати для інших форм імпульсів на його виході.

Зі збільшенням частоти слідування імпульсів властивості розімкнутої амплітудно-імпульсної системи наближаються до властивостей її приведеної безперервної частини. Я.З. Ципкін зазначив, що умовою еквівалентності імпульсної системи та її приведеної частини є дві нерівності:

,    (3.35)

де сл = 20 – частота слідування імпульсів; бп – частота, яка визначає смугу пропускання безперервної частини; вх – найбільша частота спектра зовнішньої дії на вході імпульсного елемента.

Умови (3.35) тісно пов’язані з відомою у теорії інформації теоремою Котельникова-Шеннона: безперервний сигнал, спектр якого обмежений частотою вх , можна без втрати інформації замінити на послідовність його дискретних значень, частота слідування яких сл  не менша за подвоєну верхню частоту вх.

За умови виконання нерівностей (3.35) імпульсний елемент можна не враховувати і досліджувати систему як безперервну. Якщо ці умови не виконуються, то необхідно враховувати специфічні особливості імпульсної системи і застосовувати спеціальні засоби математичного опису.


3.3 Передаточні функції імпульсної системи

Під час дослідження імпульсних систем зовнішня дія переноситься на вхід імпульсного елемента за правилами перетворення структурних схем, отже структурна схема зводиться до вигляду, зображеному на рис. 3.4, б, де Wф(p) і Wб(p) – передаточні функції формувача імпульсів і безперервної частини системи. Тоді передаточна функція приведеної безперервної частини (ПБЧ): Wп(p) = Wф(p)Wб(p).

Структурна схема такої розімкнутої імпульсної системи зображена на рис.3.7, де – дискретний сигнал, який становить послідовність миттєвих імпульсів.

Щоб визначити дискретну передаточну функцію розімкнутої системи, що складається з послідовно з’єднаних імпульсного елемента і безперервної частини, необхідно знайти передаточну функцію приведеної безперервної частини, а потім її z-зображення:

W(z) = Z{Wп(p)}.    (3.36)

Якщо імпульсний елемент генерує короткі прямокутні імпульси, то відповідно до (3.29) передаточна функція ПБЧ визначається формулою:

Тоді, враховуючи, що q = pT0  і eq = z, і згідно з (3.36) і (3.24) отримуємо:

(3.37)

За умови =1, коли імпульсний елемент є екстраполятором нульового порядку, передаточна функція має вигляд:

   (3.38)

За умови   1 вираз (3.36) спрощується і  відповідно до (3.33) набуває вигляду:

W(z) = Z{T0Wб(p)} = T0Z{Wб(p)}.  (3.39)

Під час визначення дискретної передаточної функції розімкнутої системи слід мати на увазі, що для імпульсних систем з одним імпульсним елементом на вході передаточна функція послідовно з’єднаних ланок, на відміну від безперервної системи, не дорівнює добутку передаточних функцій цих ланок, тобто

Для визначення дискретної передаточної функції W(z) необхідно спочатку знайти  а потім здійснити z-перетворення

  (3.40)

Проте в тому разі, коли кожна з послідовно з’єднаних ланок має на вході свій імпульсний елемент, загальну передаточну функцію можна знайти як добуток дискретних передаточних функцій, визначених для кожної ланки з власним імпульсним елементом.

При паралельному з’єднанні ланок дискретна передаточна функція W(z) може бути визначена як сума дискретних передаточних функцій, що знайдені для кожної ланки окремо:

   (3.41)

Приклад 3.4 Визначити дискретну передаточну функцію W(z) розімкнутої імпульсної системи, якщо передаточна функція безперервної частини має вигляд: Wб(p) = k/[p(T1p+1)(T2p+1)], а імпульсний елемент генерує короткі прямокутні імпульси (  1) з періодом слідування Т0. При розрахунку прийняти Т0 = 1с; Т1 = 1с; Т2 = 0,5с; k = 100с-1; = 0,01.

Згідно з формулою (3.39) запишемо

W(z) = T0Z{Wб(p)} = T0Z{ k/[p(T1p+1)(T2p+1)]}.

Передаточну функцію Wб(p) подамо у вигляді суми простих дробів. Рівняння s(T1p+1)(T2p+1) = 0 має один нульовий корінь і два дійсних: p1 = 0; p2 = -1/T1; p3 = -1/T2, тому

де

З урахуванням числових значень маємо:

За даними таблиці 3.1 і з урахуванням властивості лінійності отримаємо:

де  

Після перетворень остаточно маємо:

Передаточна функція замкнутої системи.

Розглянемо імпульсну систему (рис. 3.4, б). Вважаємо, що  передаточну функцію W(z) розімкнутої системи визначено. Тоді передаточна функція замкнутої системи (для незміщених дискретних функцій) має вигляд:

Wз(z)=Y(z)/G(z) = W(z)/[1+W(z)].  (3.42)

Аналогічно до безперервних систем, передаточна функція замкнутої системи за помилкою визначається так:

Wx(z) = X(z)/G(z) = 1/[1 + W(z)].   (3.43)

Передаточні функції (3.42) і (3.43) можна використовувати для оцінювання стійкості та якості імпульсних систем.

Слід зазначити, що цими формулами можна користуватися лише у тому разі, коли вагова функція дорівнює нулю у момент t=0. Для цього у системах з нескінченно короткими імпульсами у вигляді -функцій необхідно, щоб степінь полінома чисельника передаточної функції безперервної частини Wб(s) був меншим степеня полінома знаменника принаймні на два. Інакше у дискретних передаточних функціях замкнутих систем необхідно використовувати функцію W(z,-0) або z-1W(z,1), що їй дорівнює.

Приклад 3.5 Визначити дискретні передаточні функції замкнутої імпульсної системи (рис. 3.4, б), якщо

Передаточна функція розімкнутої імпульсної системи:

За (3.42) і (3.43) передаточні функції замкнутої системи за керуючою дією і за помилкою відповідно дорівнюють:

Wз(z)=Y(z)/G(z) = kT0/(z + kT0 – 1);

Wx(z) = X(z)/G(z) = (z –1)/(z + kT0 – 1).


3.4. Частотні характеристики імпульсних систем

Частотні характеристики імпульсних систем можна отримати за дискретними передаточними функціями за допомогою підстановки , яка аналогічна підстановці p = j для частотних характеристик безперервних систем: . Під час побудови частотних характеристик часто використовують відносну частоту  і підстановку .

Амплітудно-фазова частотна характеристика імпульсної розімкнутої системи визначається за формулою:

  (3.44)

де  і  - амплітудна частотна і фазова частотна характеристики розімкнутої системи.

За формулами Ейлера для комплексних чисел: . Тому частотні характеристики імпульсних систем на відміну від безперервних є періодичними функціями частоти. Оскільки = 20, то відносна частота дорівнює 2, а значить, частотні функції імпульсних систем та їх характеристики повністю визначаються зміною відносної частоти  в інтервалі  або .

Частотні характеристики імпульсної системи дають інформацію про реакцію на гармонічні дії та застосовуються для дослідження стійкості та якості систем.

Приклад 8.6 Побудувати амплітудну частотну характеристику розімкнутої імпульсної системи (рис. 3.7), що складається з імпульсного елемента і безперервної частини з передавальною функцією Wп(s) = k/(Ts+1). Імпульсний елемент генерує короткі прямокутні імпульси тривалістю Т0, де 1.

Згідно з (3.39) дискретна передавальна функція має вигляд:

  

Згідно з табл. 3.1    де .

Виконуємо підстановку . Помноживши чисельник і знаменник передавальної функції  на комплексно-спряжене число, звільнимося від уявного числа у знаменнику:

Тоді амплітудна частотна функція:

Характеристики для значень k = 400; T = 1c; =0.05, Т0=0,05 с і Т0 = 1,5 с наведені на рис. 3.8.

Рис. 3.8.  Амплітудні частотні характеристики імпульсної системи за умови Т0=0,05с  (а), і Т0 = 1,5с (б)

У першому випадку (рис. 3.8, а) частота квантування перевищує смугу пропускання безперервної частини системи, а в другому (рис.3.8, б) знаходиться у цій смузі.

У граничному випадку, коли частота квантування нескінченно велика, вхідний гармонічний сигнал сприймається системою як безперервний і частотні характеристики імпульсної системи збігаються з частотними характеристиками безперервної частини системи. Якщо частота квантування досить висока, але не нескінченно велика, характеристики імпульсної системи є характеристиками безперервної частини системи, які періодично повторюються з частотою  (рис. 3.8, а). Отже, при досить високих частотах імпульсна система є еквівалентною безперервній системі.

Під час побудови частотних характеристик імпульсних систем відносну частоту  достатньо змінювати у межах від 0 до , а для побудови характеристик безперервних систем частоту змінюють від 0 до . Це створює певні незручності під час дослідження дискретних систем за методами, що розроблені для безперервних систем. Тому часто використовують білінійне w-перетворення дискретних передаточних функцій, відповідно до якого аргумент z замінюють на аргумент w за допомогою підстановки:

   (3.45)

Тоді з урахуванням, що , отримуємо:

  (3.46)

Ділимо чисельник і знаменник цього виразу на :

Згідно з формулою Ейлера для комплексних чисел отримуємо:

(3.47)

Величина  називається відносною псевдочастотою. Вона пов’язана з частотою формулами:

  (3.48)

з яких видно, що зміні частоти  від 0 до відповідає зміна псевдочастоти від 0 до .

Під час побудови частотних характеристик зручніше користуватися абсолютною псевдочастотою:

 (3.49)

При малих частотах  Тому за умови Т0 < 2 у розрахунках псевдочастоту можна замінити дійсною коловою частотою .

Під час побудови частотних характеристик відносно псевдочастоти за дискретною передаточною функцією W(z) спочатку від аргументу z за (3.45) переходять до аргументу w, а потім виконують підстановку  або  і отримують комплексну передаточну функцію:

 (3.50)

за якою будують АФХ або логарифмічні амплітудну і фазову характеристики L() і (). Ці характеристики визначають за формулами, аналогічними до формул для безперервних систем:

 (3.51)

Так само, як і для безперервних систем, L() вимірюється у децибелах, () – у градусах або радіанах, lg() – у декадах.

Логарифмічні частотні характеристики імпульсних систем будувати складніше порівняно з безперервними. Це зумовлено тим, що при послідовному з’єднанні безперервних ланок без імпульсних елементів дискретна передаточна функція не дорівнює добутку дискретних передаточних функцій окремих ланок і вираз W(j) звичайно є сумою дробів. Тому перед побудовою характеристик комплексну передаточну функцію спочатку необхідно подати у вигляді дробу, що містить у чисельнику і знаменнику елементарні співмножники вигляду k, j, Tj+1, T2(j)2+2Tj+1. Після цього можна будувати асимптотичну ЛАХ дискретної системи таким самим способом, як і для безперервних систем. ЛФХ визначається як сума фазових характеристик, що відповідають елементарним співмножникам передаточної функції.

Частотна характеристика розімкнутої системи має скінчене значення при , тому при  ЛАХ прямує до сталої величини, а ЛФХ – до значення () = 0 або () = -1800.

Застосування псевдочастоти і логарифмічних характеристик дає змогу досліджувати імпульсні системи і виконувати синтез корегуючих пристроїв методами, що розроблені для безперервних систем.

Приклад 3.7 Розрахувати і побудувати логарифмічну амплітудну характеристику розімкнутої імпульсної системи, дискретна передавальна функція якої має вигляд:

Виконуємо w-перетворення за допомогою підстановки (3.45) і після спрощень отримуємо:

Виконуємо підстановку

Методика побудови  така сама, як і для побудови асимптотичних ЛАЧХ безперервних систем:

- ліворуч першої частоти спряження  низькочастотна асимптота ЛАЧХ проходить у напрямку точки з координатами () з нахилом –20 дБ/дек (знаменник передаточної функції має співмножник );

  •  частоти спряження:

             

       

- у частотах спряження  нахил ЛАЧХ змінюється на –20 дБ/дек, а в частотах  - на +20 дБ/дек.

ЛАЧХ системи наведена на рис. 3.9.

3.5. Стійкість імпульсних систем

Подібно до безперервних систем лінійна імпульсна система буде стійкою, якщо всі корені характеристичного рівняння замкнутої системи будуть "лівими", тобто знаходитись у лівій півплощині комплексної площини p. Межею стійкості є уявна вісь, рівняння якої має вигляд p=j (рис. 3.10, а). Оскільки під час дослідження імпульсних систем застосовуються z-перетворення, визначимо межу стійкості на площині z:

Це рівняння кола одиничного радіуса, яке і є межею стійкості (рис. 3.10, б). Зона стійкості знаходиться в середині цього кола.

Отже, стійкість імпульсної системи можна досліджувати за коренями характеристичного рівняння замкнутої системи D(z)=0: імпульсна система стійка, якщо модулі всіх коренів характеристичного рівняння замкнутої системи менші за одиницю. Якщо модуль хоча б одного кореня перевищує одиницю, то система нестійка; при |z|=1 система знаходиться на межі стійкості.

Для дослідження стійкості імпульсних систем використовують критерії стійкості, які дозволяють оцінити стійкість за коефіцієнтами характеристичного рівняння або за частотними характеристиками.

Алгебраїчні критерії стійкості. Ці критерії (критерій Гурвіца, Рауса, Льєнара-Шипара) було розроблено для дослідження стійкості безперервних систем за коефіцієнтами характеристичного рівняння, яке подано у вигляді поліному. Безпосередньо застосувати їх для дослідження імпульсних систем неможливо, оскільки характеристичне рівняння імпульсної системи у вигляді:

 (3.52)

не є поліномом, а для характеристичного рівняння у вигляді:

   (3.53)

умовою стійкості є розміщення усіх коренів усередині кола одиничного радіуса у площині коренів z, а не в лівій півплощині.

Тому перед застосуванням алгебраїчних критеріїв стійкості виконують білінійне w-перетворення (3.45), внаслідок чого отримують рівняння у вигляді поліному:

   (3.54)

Зоною стійкості для його коренів є ліва півплощина коренів w (рис. 3.10,в). і умова стійкості для цього рівняння збігається з умовою стійкості для безперервних систем.

Наприклад, для використання критерію Гурвіца необхідно визначити передаточну функцію замкнутої системи Wз(z)=Q(z)/D(z) і записати характеристичне рівняння D(z)=0. Потім виконати підстановку (3.45) і навести отриманий вираз D(w)=0 до загального знаменника. Чисельник цього виразу, записаний у вигляді поліному

   (3.55)

є новим характеристичним рівнянням, за коефіцієнтами якого досліджують стійкість системи.

Згідно з критерієм Гурвіца для стійкості імпульсної системи необхідно і достатньо, щоб при  > 0 визначник Гурвіца і всі його діагональні мінори були додатними.

Приклад 3.8 Визначити за критерієм Гурвіца стійкість системи, характеристичне рівняння якої має вигляд: 25z3 – 5z2 – 10z – 1 = 0.

Виконуємо w-перетворення:

Перетворене характеристичне рівняння має вигляд:

Усі коефіцієнти  цього рівняння більше нуля, крім того діагональний мінор другого порядку , тому дана система стійка.

Зазначимо, що імпульсні системи другого і першого порядків на відміну від безперервних систем такого самого порядку, можуть бути нестійкими при додатних коефіцієнтах характеристичного рівняння (3.53). Це пояснюється тим, що фіксатор, який входить до складу імпульсної системи, вносить додаткове відставання за фазою.

Частотні критерії стійкості. Для дослідження стійкості імпульсних систем застосовують також частотні критерії стійкості, подібні до критеріїв Михайлова і Найквіста для безперервних систем.

Аналог критерію Михайлова. Під час дослідження стійкості за критерієм Михайлова використовують характеристичне рівняння замкнутої системи (3.53), в якому виконують підстановку . Тоді рівняння набуває вигляду:

(3.56)

де

 

Змінюючи частоту  від 0 до , за формулою (3.56) на комплексній площині будуємо криву – аналог годографа вектора Михайлова. За виглядом цього годографа робимо висновок про стійкість системи:

Імпульсна система автоматичного управління стійка, якщо годограф вектора при зміні частоти  від 0 до  починається на додатній дійсній півосі та обходить у додатному напрямку (проти ходу стрілки годинника) послідовно 2n квадрантів, ніде не перетворюючись на нуль; n – порядок характеристичного рівняння.

На відміну від безперервних систем годограф не прямує до нескінченності, а закінчується на дійсній осі, крім того, годограф проходить удвічі більше квадрантів. Якщо годограф  проходить через початок координат, то система знаходиться на межі стійкості.

На рис. 3.11 наведені годографи вектора для стійкої (крива 1) і нестійкої (крива 2) систем другого порядку.

 Аналог критерію Найквіста. Подібно до безперервних систем для дослідження стійкості замкнутих імпульсних систем можна використовувати АФХ розімкнутої системи:

1. Якщо система стійка у розімкнутому стані або нейтральна, тобто має нульові полюси si , то для стійкості замкнутої системи необхідно і достатньо, щоб АФХ розімкнутої системи при зміні відносної частоти  від 0 до  не охоплювала точку з координатами (-1;j0) і не проходила через неї;

2. Якщо система нестійка у розімкнутому стані, то для стійкості замкнутої системи необхідно і достатньо, щоб АФХ розімкнутої системи при зміні відносної частоти  від 0 до  охоплювала точку з координатами (-1;j0) k/2 разів, де k – кількість коренів характеристичного рівняння безперервної частини розімкнутої системи, що мають додатну дійсну частину (кількість коренів zi характеристичного рівняння розімкнутої імпульсної системи, модулі яких більші за одиницю).

Тобто формулювання критерію Найквіста для імпульсних систем залишається таким самим, як і для безперервних. Але АФХ імпульсних систем при  = закінчуються на дійсній осі, а не у початку координат.

Зазначимо, що зробити висновок про стійкість розімкнутої імпульсної системи можна на підставі перевірки стійкості її безперервної частини, оскільки полюси передаточних функцій безперервної W(p) та імпульсної W(p) розімкнутих систем співпадають. Тобто стійкість розімкнутого контуру імпульсної системи визначається стійкістю її безперервної частини. Однак імпульсний елемент суттєво впливає на стійкість і якість замкнутої системи: зі збільшенням періоду квантування Т0 імпульсів у більшості систем зменшується граничний коефіцієнт передачі та погіршуються динамічні властивості. Але на деякі структурно-нестійкі безперервні системи і на системи із запізненням, у яких АФХ потрапляє до першого квадранту, імпульсний елемент впливає як стабілізуючий фактор.

Для таких систем пропонується вибирати Т0 із умови:

Т0д,

де д – частота, при якій АФХ безперервної частини розімкнутої системи перетинає додатну уявну піввісь.

Стійкість замкнутої системи можна також визначити за логарифмічними характеристиками – амплітудною L() і фазовою (). Стосовно логарифмічних характеристик критерій Найквіста формулюється так:

1. Якщо система стійка у розімкнутому стані або нейтральна, то для стійкості замкнутої системи необхідно і достатньо, щоб на частоті зрізу , фаза за модулем  була менша за .

2. Якщо система нестійка у розімкнутому стані, то для стійкості замкнутої системи необхідно і достатньо, щоб при  кількість перетинів фазовою характеристикою рівня - знизу вгору була в k/2 разів більшою кількості перетинів у протилежному напрямку; k – кількість коренів характеристичного рівняння безперервної частини розімкнутої системи, що мають додатну дійсну частину (кількість коренів zi характеристичного рівняння розімкнутої імпульсної системи, модулі яких більші за одиницю).

Приклад 3.9 Визначити за логарифмічними характеристиками стійкість імпульсної системи, передаточна функція якої наведена у прикладі 3.7:

Полюси передаточної функції розімкнутої системи: z1=1; z2=0,2; z3=0,5. Тому розімкнута система нейтральна (z1=1) і для дослідження стійкості замкнутої системи застосовуємо перше формулювання критерію Найквіста у логарифмічній формі.

Побудову логарифмічних характеристик за передаточною функцією

виконаємо за допомогою пакета Matlab (рис. 3.12).

Рис. 3.12. Логарифмічні частотні характеристики імпульсної системи

На псевдочастоті зрізу  фаза за модулем менша за і дорівнює 750, тобто система стійка і має запас стійкості за фазою =1050, запас за амплітудою L = 6дБ.

3.6.  Якість імпульсних систем

Якість імпульсних систем керування характеризується такими самими показниками, як і якість безперервних систем: точністю регулювання в усталених режимах, тривалістю і перерегулюванням перехідного процесу.

Усталену помилку можна визначити таким самим способом, як і в безперервних системах, тобто знайти зображення помилки з виразу передаточної функції (3.43) замкнутої системи за помилкою:

X(z) = Wx(z)G(z),

і перейти до її усталеного значення згідно з формулою (3.22) для кінцевого значення решітчастої функції:

  (3.57)

Цю формулу не можна застосовувати, коли межа у правій частині не існує, наприклад, коли усталена помилка є гармонічною функцією.

Як і безперервні системи, імпульсні системи можуть бути статичними чи астатичними. Імпульсна система, у якої усталена помилка при будь-якому зовнішньому сигналі дорівнює нулю, називається астатичною по відношенню до цього сигналу. У протилежному випадку система називається статичною.

Точність імпульсної системи в усталеному режимі можна оцінювати за коефіцієнтами помилок Сk, які визначаються за формулою:

  (3.58)

де

Показники якості перехідних процесів можна визначити шляхом розв’язку різницевого рівняння, що описує динаміку системи. Для розрахунку перехідної функції (реакції системи на одиничну ступінчасту дію за нульових початкових умов) зручно застосовувати z-перетворення. У цьому разі зображення вхідної величини (табл. 3.1) має вигляд:

G(z) = z/(z-1),

а зображення вихідної – вигляд:

Y(z) = G(z)Wз(z) = Wз(z)z/(z-1).   (3.59)

Оригіналом цієї функції є решітчаста функція y[n]. Якість перехідного процесу визначається за графіком безперервної функції y(t), що відповідає цій решітчастій функції.

Приклад 3.10 Побудувати перехідний процес в імпульсній системі автоматичного регулювання, для якої:

при дії керуючого сигналу g(t) = 1(t) і визначити основні показники якості.

Згідно з (3.42) визначимо передаточну функцію замкнутої імпульсної системи:

Wз(z) = W(z)/[1+W(z)] =

Тоді відповідно з (3.59) запишемо:

Перехідний процес у системі у тактові моменти часу і основні показники якості можна визначити різними способами. Згідно з одним із них розкладемо отриманий вираз по степенях zi, виконавши ділення чисельника на знаменник. У результаті отримаємо:

Тоді відповідно до (3.34), (3.35) запишемо:

За допомогою цього виразу побудуємо перехідний процес в імпульсній системі (рис. 3.13). З графіка видно, що час регулювання складає 4Т=0,4 с (після цього моменту відхилення перехідної функції від усталеного значення, що дорівнює одиниці, не перевищує 5%). Максимальне перерегулювання =20,7 % (у момент часу 3Т = 0,3 с).

Якість перехідного процесу можна оцінювати також  за полюсами і нулями передаточної функції. Якщо нулі відсутні, то полюси (корені характеристичного рівняння) повністю визначають перехідний процес у системі. Для стійкої системи модулі всіх коренів мають бути меншими за одиницю. Коло одиничного радіуса на площині z є відображенням уявної осі на площині p (рис. 3.10). Найбільш істотно на перехідний процес впливають корені, що розміщені найближче до уявної осі площини p, а значить, до кола одиничного радіуса площини z. Такі корені називаються домінуючими.

Якщо система має пару домінуючих комплексно-спряжених коренів , а решта коренів знаходиться поблизу початку координат, то час досягнення першого максимуму і перерегулювання визначаються за формулами:

  (3.60)

  (3.61)

де =arctg(T0); M–кількість нулів передаточної функції; N– кількість полюсів; b – додатне число (b<1), при якому вираз у квадратних дужках у формулі (3.60) дорівнює цілому числу; k=cos(b) + [cosec(/|z1|) – ctg]sin(b), - модуль домінуючого кореня.

Якість імпульсних систем можна характеризувати також оцінками, подібними до оцінок якості безперервних систем: ступінню стійкості , коливальністю , а також інтегральними оцінками якості.

Найпростішою з інтегральних оцінок є лінійна інтегральна оцінка:

 (3.62)

де y[] – усталене значення вихідної величини.

Ця оцінка придатна тільки для неколивальних процесів. Ширше застосування знайшла квадратична оцінка:

  (3.63)

Найкращою є та імпульсна система, для якої інтегральні оцінки мінімальні. Значення параметрів системи, що відповідають мінімальним оцінкам, називаються оптимальними за якістю перехідного процесу.

3.7. Корекція імпульсних систем

Загальна мета корекції імпульсних систем полягає у забезпеченні стійкості, заданої точності роботи в усталеному режимі, задовільної якості перехідних процесів.

Корекцію можна здійснювати за рахунок зміни параметрів системи без зміни її структури або за рахунок введення додаткових корегуючих кіл. Причому для корекції імпульсних систем є більш широкі можливості, оскільки коректуючі пристрої можуть бути безперервними або дискретними.

Найпростішим способом корекції є зміна коефіцієнта підсилення К розімкнутої системи, який впливає практично на всі властивості системи. При цьому необхідно пам’ятати, що коефіцієнт К не повинен перевищувати критичного значення, при якому система знаходиться на межі стійкості.

Приклад 3.11 Визначити, при яких значеннях коефіцієнта К імпульсна система стійка у замкнутому стані, якщо передавальна функція розімкнутої системи має вигляд:

Запишемо характеристичне рівняння замкнутої системи:

D(z) = z2 – 1,2z + 0,25 + 0,5Kz = z2 + z(0,5K - 1,2) + 0,25 = 0.

Після w-перетворення отримуємо характеристичне рівняння:

Для стійкості системи другого порядку необхідно і достатньо, щоб усі коефіцієнти цього характеристичного рівняння були додатними. При додатних значеннях коефіцієнта К дана система буде стійкою, якщо виконується умова:

2,45 – 0,5К > 0, тобто К < 4,9.

Отже, імпульсна система стійка при К < 4,9.

Корекція імпульсної системи за рахунок введення корегуючих пристроїв полягає у зміні частотних характеристик системи з метою максимального їх наближення до бажаних.

Як і у безперервних системах, безперервний корегуючий пристрій можна вводити послідовно з ланками незмінюваної частини системи, паралельно деяким з них, а також у вигляді зворотного зв’язку, що охоплює всю систему або частину її ланок.

Визначення параметрів послідовного корегуючого пристрою є досить складною задачею. У найпростішому випадку при досить високій частоті квантування і великій інерційності безперервної частини, коли виконується умова (3.35) теореми Котельникова-Шеннона, імпульсну систему можна замінити безперервною і тоді записати:

  (3.64)

де  - частотні характеристики: бажана, корегуючого пристрою, безперервної частини початкової системи; ki – коефіцієнт передачі імпульсного елемента.

З урахуванням тривалості імпульсів (0) вираз (3.64) матиме вигляд:

 (3.65)

Після заміни імпульсної системи безперервною синтез послідовного корегуючого пристрою можна виконати методами, що розроблені для безперервних систем, зокрема методом логарифмічних частотних характеристик.

3.8. ЦИФРОВІ СИСТЕМИ АВТОМАТИЧНОГО КЕРУВАННЯ

Поняття про цифрові системи автоматичного керування

Цифровою системою (ЦС) автоматичного управління називається система, у замкнутому контурі якої є хоча б один пристрій, що перетворює безперервні сигнали у цифрові коди (двійковий, двійково-десятковий, код Грея та інші) та виконує математичні операції над цими кодами. У контурі цифрової системи цифровий регулятор виконує математичні операції та видає результат у дискретні моменти часу t = T0, 2T0, 3T0, … В інтервалах між цими моментами на виході регулятора зберігається те значення, яке було на початку інтервалу, що розглядається. Тому на виході регулятора існує не безперервна функція x(t), а відповідна ступінчаста функція x(nT0), тобто здійснюється квантування за часом. Крім того, відбувається квантування за рівнем, тому що внаслідок цифрової подачі інформації вихідний сигнал може набувати тільки певних фіксованих рівнів, які відрізняються один від одного на величину q (крок квантування). Величина q відповідає одиниці молодшого розряду цифрового регулятора.

Отже, в цифрових системах відбувається квантування сигналу за часом і рівнем, при якому фіксуються дискретні за рівнем значення, найближчі до значень безперервного сигналу в дискретні моменти часу. Ця операція виконується за допомогою аналого-цифрових перетворювачів (АЦП).

Безперервний сигнал подається у вигляді:

  (3.66)

де  містить ціле число рівнів q; ||<q – помилка квантування, яка залежить від кількості рівнів квантування або роздільної здатності АЦП і визначає помилку округлення безперервного сигналу x(t).

На рис. 3.14 наведена статична характеристика “вхід-вихід” АЦП.

Підвищення точності перетворення досягається шляхом збільшення кількості розрядів у вихідному сигналі: роздільна здатність АЦП дорівнює (1/2)n, де n – кількість двійкових розрядів. Слід зазначити, що аналого-цифрове перетворення не забезпечує взаємно однозначної відповідності між та . Наприклад, аналоговому сигналу x(t), який набуває будь-якого значення в інтервалі 1,5qx2,5q, відповідає єдине значення дискретного сигналу =2q, однак цьому єдиному значенню може відповідати множина аналогових сигналів з указаного інтервалу.

У цифрових системах керування, крім АЦП, завжди є також цифро-аналоговий перетворювач (ЦАП), необхідність якого зумовлена наявністю в основному контурі системи аналогових елементів. ЦАП призначений для перетворення цифрових сигналів на безперервні, а також для узгодження цифрових сигналів з безперервними. Порівняно з АЦП, ЦАП, як правило, простіші за будовою, дешевші та мають більшу швидкодію при тій самій точності.

Спрощені функціональні схеми ЦС подано на рис. 3.15. Безперервний сигнал помилки (t) (рис. 3.15,а) перетворюється АЦП на цифровий код і надходить на вхід цифрової обчислювальної машини (ЦОМ). Вихідний сигнал ЦОМ перетворюється ЦАП на безперервний сигнал, який надходить на вхід безперервної частини (БЧ) системи.

На схемі 3.15,б  вхід системи є цифровим, а вихід – аналоговим. АЦП у даному випадку входить до ланцюга зворотного зв’язку.

Дослідження цифрових систем автоматичного управління

Квантування за часом робить ЦС дискретною, а квантування за рівнем – нелінійною. Однак при малому q (при великій роздільній здатності АЦП) впливом квантування за рівнем на динаміку системи можна знехтувати, тобто покласти q = 0. У цьому разі для дослідження ЦС можна застосовувати математичний апарат дослідження лінійних імпульсних систем з амплітудно-імпульсною модуляцією: дискретне z-перетворення і різницеві рівняння.

За умови врахування квантування сигналу і за часом і за рівнем цифрові системи слід віднести до класу нелінійних імпульсних систем і для їх дослідження застосовувати відповідні методи. Так, для дослідження абсолютної стійкості ЦС використовують критерій, розроблений Я.З.Ципкіним:

Положення рівноваги нелінійної імпульсної системи, приведена безперервна частина якої стійка, і нелінійна характеристика належить до сектору (0, k), буде абсолютно стійким, якщо для усіх частот у діапазоні (0, ) виконується нерівність:

  (3.67)

Геометрична інтерпретація даної нерівності дуже проста: амплітудно-фазова характеристика  приведеної лінійної частини повинна розташовуватися праворуч від вертикальної лінії (–1/k).

Відповідно до рис. 3.14 для статичної характеристики АЦП k=q/(q/2)=2, тобто вона належить до сектора (0, 2). Тому умова абсолютної стійкості положення рівноваги ЦС виконується, якщо годограф  розташований праворуч від вертикальної прямої (-1/2) (рис. 3.16).

У випадку, коли приведена лінійна частина нестійка, достатній критерій абсолютної стійкості (3.67) не виконується. Це пов’язано з тим, що характеристика АЦП має зону нечутливості (-q/2, +q/2), і коли процес потрапляє до цієї зони, система розмикається, а розімкнута система є нестійкою.

Якщо умова абсолютної стійкості не виконується, то у цифровій системі можуть виникати періодичні режими. Термін “автоколивання” у даному випадку не можна застосовувати, оскільки частота періодичних режимів визначається тактом роботи імпульсного елемента і, значить, ЦС не є автономною.

Корекція цифрових систем

Раніше розглядалися основні поняття про корекцію імпульсних систем, для здійснення якої є більш широкі можливості порівняно з безперервними САК, оскільки коректувальні пристрої можуть бути безперервними або дискретними.

Одним з шляхів підвищення якості процесу керування ЦС є застосування цифрових коректуючих пристроїв або цифрових коректуючих фільтрів. Ці фільтри можуть бути диференційними та інтегруючими.

Диференційний фільтр першого порядку реалізує різницеве рівняння:

 (3.68)

Це відповідає наближеному різницевому виразу похідної від вхідної величини. Передаточна функція диференціювального фільтра першого порядку:

  (3.69)

Для практичної реалізації цю функцію перетворюють до вигляду:

  (3.70)

Для більш точної реалізації похідної від вхідної величини передаточну функцію подають у такому вигляді:

  (3.71)

де m – скінчена кількість членів суми, що вибирається з бажаної точності реалізації похідної.

Аналогічно будується диференційний цифровий фільтр будь-якого порядку r з передаточною функцією:

 (3.72)

Такі фільтри дають суттєвий ефект як при послідовному включенні, так і в місцевих зворотних зв’язках. Вони також дозволяють забезпечувати інваріантність за зовнішнім вхідним впливом.

Інтегруючий цифровий фільтр першого порядку імітує інтеграл у вигляді наближеної рівності:

 (3.73)

що відповідає наближеному інтегруванню за методом прямокутників.

Передаточна функція такого фільтра має вигляд:

  (3.74)

Оскільки розв’язок різницевого рівняння (3.73) дає:

 (3.75)

то такий фільтр називають накопичувачем.

Існує також інший вираз передаточної функції інтегруючого фільтра першого порядку, який відповідає інтегруванню за методом трапецій:

  (3.76)

Для цифрового інтегруючого фільтра другого порядку (при інтегруванні за правилом Симпсона) передаточна функція має вигляд:

 (3.77)

Послідовне включення інтегруючого фільтра підвищує порядок астатизму системи, тобто її точність. Однак, як і для безперервних систем, при цьому можливе погіршення стійкості системи. Тому застосовують ізодромну корекцію. Передаточна функція у цьому разі має вигляд:

 (3.78)

де передаточна функція відповідає (3.74) або (3.76), а значення k дорівнює сталій часу компенсуючого диференціювального пристрою першого порядку.

Існують ще цифрові фільтри іншого типу, які забезпечують бажані показники якості процесів керування в ЦС при тих чи інших зовнішніх впливах.

Синтез цифрових коректуючих пристроїв методом ЛАЧХ

Під час розробки цифрових систем керування зручно використовувати метод синтезу, що базується на логарифмічних частотних характеристиках. Передаточна функція розімкнутої ЦС є добутком дискретних передаточних функцій приведеної безперервної частини і цифрового регулятора:  Якщо перейти до логарифмічних характеристик, як функцій абсолютної псевдочастоти , то можна записати:

  (3.79)

де  - амплітудні логарифмічні характеристики розімкнутої системи, приведеної безперервної частини і цифрового регулятора.

Звідси ЛАЧХ цифрового регулятора:

  (3.80)

Як зауважувалось раніше за умови Т0 < 2 псевдочастоту можна замінити дійсною частотою , тому для низьких частот ( < 2/Т0)  побудова ЛАЧХ і ЛФЧХ дискретної системи зводиться по суті до побудови відповідних характеристик початкової (не приведеної) безперервної частини системи з передаточною функцією

Розглянемо побудову логарифмічних характеристик у зоні високих частот (при > 2/Т0). Якщо сталі часу передаточної функції  такі, що всі частоти спряження асимптотичної ЛАЧХ лежать ліворуч від частоти = 2/Т0 і ЛАЧХ при цій частоті має нахил (-20) дБ/дек, то високочастотна частина ЛАЧХ апроксимується інтегруючою ланкою  де - базова частота високочастотної частини ЛАЧХ, яка визначається як частота перетину її першої асимптоти з віссю нуля децибел (горизонтальною віссю) (рис. 3.17).

Нехай, наприклад, низькочастотна частина ЛАЧХ на частоті = = 2/Т0 має нахил –60 дБ/дек (тобто =3). Тоді  і, коли імпульсний елемент є екстраполятором нульового порядку, дискретна передаточна функція має вигляд:

 (3.81)

За даними таблиці 3.1 отримуємо:

Виконуємо w-перетворення:

Переходимо до частотної функції:

(3.82)

 

Високочастотну частину ЛАЧХ, побудовану за виразом (3.82), наведено на рис. 3.17 праворуч від лінії =2/Т0: на частоті =2/Т0 нахил ЛАЧХ змінюється на +20дб/дек, а на частоті  - на +40 дБ/дек, оскільки передавальна функція Wв(j) у чисельнику містить дві ланки з однаковою сталою часу .

Збіг ЛАЧХ для дискретної передаточної функції безперервної частини системи в зоні низьких частот дає можливість виконувати синтез корегуючих пристроїв (цифрових регуляторів) відомими методами синтезу корегуючих пристроїв неперервних систем і використовувати розроблені для них номограми, графіки і таблиці.

Внаслідок синтезу методом ЛАЧХ знаходять ЛАЧХ корегуючого пристрою Lк() і за її виглядом визначають комплексну частотну функцію Wк(j). Після цього виконують підстановку:

,    (3.83)

визначають дискретну передаточну функцію Wк(z), а потім різницеве рівняння корекції, яке реалізується цифровим регулятором.

Запитання для самоперевірки

  1.  Дайте визначення цифрової системи автоматичного керування.
  2.  Що таке АЦП? ЦАП?
  3.  Наведіть спрощену функціональну схему ЦС.
  4.  Які методи застосовують для дослідження цифрових систем?
  5.  Сформулюйте критерій абсолютної стійкості ЦС.
  6.  Чому періодичні режими у ЦС не можна називати автоколиваннями?
  7.  У чому полягає особливість побудови логарифмічних характеристик цифрових систем у низькочастотній і високочастотній зонах?
  8.  Наведіть передавальні функції цифрових фільтрів.
  9.  Поясніть методику синтезу коректувального пристрою в цифрових системах за допомогою ЛАЧХ.


4. Одноконтурні та багатоконтурні системи

Одноконтурна система (рис.4.1) є найбільш простим та самим розповсюдженим типом систем, які забезпечують управління вихідною величиною об’єкта управління, тобто вирішення простих задач стабілізації та слідкування. До складу пристрою управління одноконтурної системи автоматичного управління входить задаючий блок ЗБ та регулятор вихідної величини Р. ЗВ – блок зовнішніх впливів. Задача системи полягає в мінімізації відхилення , чому перешкоджає збурення  та ненульове початкове розузгодження . Задача вирішується за допомогою регулятора виходу.

 

Рис.4.1. Одноконтурна система

Замкнута система називається одноконтурною, якщо при її розмиканні в будь-якій точці замкнутого контуру отримаємо коло без паралельних та зворотніх з’єднань.

Замкнута система називається багатоконтурною, якщо при її розмиканні в будь-якій точці замкнутого контуру отримаємо коло, в якому наявні паралельні або зворотні з’єднання.

Багатоконтурна система не має перехресних зв’язків, якщо будь-які два контури, утворені паралельними або зворотніми з’єднаннями, не мають спільних ділянок, або якщо якісь два контури мають спільну ділянку, то один з них знаходиться всередині другого.

Багатоконтурна система має перехресні зв’язки, якщо вона містить два контури, які мають спільну ділянку, і при цьому жоден з них не розміщується всередині другого.

Одноконтурні системи регулювання використовують зазвичай для регулювання одного параметру технологічного процесу а також для стабілізації певного параметру.

Більшість об’єктів хімічної технології характеризуються значними збуреннями та наявністю запізнення. Використання одноконтурних систем при автоматизації таких об’єктів не дозволяє забезпечити високих показників якості регулювання, тому для підвищення якості регулювання таких об’єктів використовують більш складні системи регулювання. Зокрема до таких систем відносяться й багатоконтурні системи автоматичного регування. До багатоконтурних систем відносяться каскадні системи, системи комбінованого регулювання, каскадно-комбіновані системи, системи співвідношення потоків та ін.

Комбіноване управління

Під комбінованим управлінням розуміють такий метод побудови замкнутих систем автоматичного управління, коли разом з управлінням за відхиленням чи за похибкою, використовують управління за задаючою чи збурюючою дією. Таким чином в системі комбінованого управління здійснюється вплив на об’єкт по двох каналах: розімкнутому та замкнутому. За допомогою розімкнутого каналу забезпечується швидкий вплив на об’єкт ще до відхилення регульованої величини, а за допомогою замкнутого контуру зворотнього зв’язку здійснюється якісне підтримання регульованої величини на заданому рівні шляхом поточного контролю похибки регулювання. Структурна схема комбінованої системи управління представлена на рис. 4.2

Рис. 4.2. Структурна схема комбінованої системи управління:

ОР- об’єкт регулювання; ИП, ИПв  - вимірювальні перетворювачі; АР – автоматичний регулятор; АРв – автоматичний регулятор за збуренням: ИУ – виконавчий механізм

Впровадження коректуючого імпульсу за найсильнішим збуренням уможливлює істотне зниження динамічної помилки регулювання за умови правильного вибору та розрахунку динамічного пристрою, який формує закон зміни цього впливу.

Основою розрахунку подібних систем є принцип інваріантності.

Принцип інваріантності

Реалізація принципу інваріантності є ефективним засобом усунення протиріч між умовами точності в усталених та перехідних режимах шляхом компенсації зовнішніх збурень.

Термін інваріантність означає незалежність однієї фізичної величини від іншої. В системах управління розглядають незалежність вихідних величин від (керованої величини чи сигнала помилки) від вхідних впливів. В системах стабілізації прагнуть отримати незалежність керованої величини від збурюючих впливів, а в слідкуючих – незалежність сигнала помилки від задаючого впливу. В багатомірних системах з декількома контурами управління прагнуть незалежності кожної керованої величини від "чужих" керуючих впливів, які в контурі управління обраною величиною є збуреннями.

Система є інваріантною по відношенню до збурюючої дії, якщо після завершення перехідного процесу, який визначається початковими умовами, керована величина і похибка системи не залежать від цього впливу. Система є інваріантною відносно до задаючого впливу, якщо після завершення перехідного процесу, що визначається початковими умовами, похибка системи не залежить від цього впливу.

Багатомірні системи управління

До багатомірних відносяться системи управління, які мають кілька керованих величин . Це зустрічається в багатьох сучасних складних системах. До них відносяться, наприклад, системи стабілізації напруги та частоти синхронних генераторів, системи управління рухомих об’єктів, багато систем управління технологічними процесами та ін.

Багатомірна система передбачає наявність багатомірного об’єкта управління (рис. 4.3), який характеризується наявністю кількох входів (точок прикладання управляючих та збурюючих дій) та кількох виходів, які визначаються керованими величинами.

Рис. 4.3. Схема багатомірного об’єкта управління

Багатомірний об’єкт описується системою рівнянь, якку зручно представляти в матричній формі.

Введемо -мірну матрицю-стовпець керованих величин

,   (4.1)

-мірну матрицю-стовпець керуючих впливів

, (4.2)

та -мірну матрицю-стовпець збурюючих впливів

.  (4.3)

Тут індексом "Т" позначено операцію транспонування матриці.

Якщо керовані величини мають однакову фізичну розмірність і можуть трактуватися як проекції певного вектора на осі координат, то матриця-стовпець може бути тотожною цьому вектору. Тоді можна говорити про вектор керованих величин.

Якщо керовані величини мають різну фізичну розмірність, то перехід від матриці-стовпця до вектора можливий, якщо ввести в матрицю-стовпець вагові коефіцієнти, які б урівнювали розмірності окремих складових. Однак такий перехід не є єдиним і має безліч варіантів.

Аналогічно при рівності фізичних розмірностей окремих складових матриць-стовпців керуючих впливів та збурень можна ввести вектор управління та вектор збурень. При різних фізичних розмірностях окремих складових матриць-стовпців перехід до вектора можливий, але не буде єдиним.

Лінеаризовані рівняння руху багатомірного об’єкта можуть бути записані у матричному вигляді:

.  (4.4)

Тут введено квадратну матрицю операторних коефіцієнтів розміром

 (4.5)

та прямокутні матриці операторних коефіцієнтів розміром  та

;  (4.6)

.  (4.7)

Якщо у виразах (4.1) – (4.7) перейти до зображень Лапласа при нульових початкових умовах, то матричне рівняння (4.4) можна записати для зображень в наступному вигляді:

. (4.8)

Тут ,  та  - матриці-стовпці зображень керованих величин, керуючих впливів та збурень.

В рівняння (4.8) входять також квадратна матриця  та прямокутні матриці  та  розмірами ,  та  відповідно.

Якщо матриця  не особлива, тобто її визначник не рівний нулю, то, домноживши ліву і праву частини (4.8) зліва на обернену матрицю  отримаємо

. (4.9)

Тут введено матриці передаточних функцій об’єкта для керуючих впливів

  (4.10)

та для збурень

.  (4.11)

В (4.11) символом  позначено матрицю, приєднану для матриці . Формули (4.9) – (4.11) дозволяють отримати зв’язок між керованими величинами та керючими і збурюючими впливами.

На рис. 4.4. зображено умовну структурну схему замкнутої багатомірної системи.

Рис. 4.4. Структурна схема замкнутої багатомірної системи

На схемі всі вказані символи відповідають матрицям:  - задаючих впливів,  - керованих величин,  - похибок для кожної керованої величини,  - керуючих впливів,  - збурень,  - передаточних функцій для управління,  - передаточних функцій для збурень. Крім того введено прямокутну матрицю передаточних функцій керуючого пристрою , яка визначає алгоритми управління. Вона дає зв’язок між зображеннями керуючих впливів та похибок:

. (4.12)

Рівняння багатомірної системи (рис. 4.4) можна отримати наступним чином.

Матриця передаточних функцій розімкнутої за всіма каналами системи

. (4.13)

Характеристична матриця системи являє собою квадратну матрицю розміром :

. (4.14)

Тут  - одинична матриця розміром , тобто квадратна матриця, у якої всі елементи головної діагоналі рівні одиниці, а решта – нулю.

Характеристичне рівняння системи отримуємо, прирівнявши до нуля визначник характеристичної матриці:

.  (4.15)

Зазначимо, що у випадку, коли багатомірна система є сукупністю  незалежних одномірних систем, характеристична матриця буде діагональною і визначник системи тоді рівний добутку окремих визначників кожної з систем, тобто . В цьому випадку загальне характеристичне рівняння розпадається на  незалежних характеристичних рівнянь , .

Матриці передаточних функцій замкнутої системи, за помилкою та за збуреннями, за умови, що матриця  не особлива, що означає незалежність вихідних диференціальних рівнянь, можуть бути визначені з виразів

,  (4.16)

,  (4.17)

.  (4.18)

Тут  - матриця, приєднана для матриці .


7 ОПТИМАЛЬНІ СИСТЕМИ АВТОМАТИЧНОГО КЕРУВАННЯ

Одним з видів автоматичного керування є оптимальне керування, яке застосовують у технічних системах для підвищення ефективності виробничих процесів, і в системах організаційного управління для вдосконалення  діяльності підприємств та організацій. Ідея оптимізації в останні десятиріччя була центральною ідеєю, яка визначала розвиток теорії керування.

Слово “оптимальний” походить від латинського optimus, що значить – найкращий, досконалий. Оптимізація – це отримання найкращого можливого рішення.

Сучасна постановка задач оптимального керування (з точністю до термінології) була виконана у роботі російського вченого Д.Є. Охоцимського “К теории движения ракет” (1946 р.). Теорію оптимальної швидкодії вперше було викладено в роботах О.А. Фельдбаума, який у 1953-1956 роках запровадив поняття оптимальних за швидкодією процесів. Видатна роль у розвитку теорії оптимального керування належить академіку Л.С. Понтрягіну, який 1956 року сформулював принцип максимуму, що являє собою єдиний математичний апарат теорії оптимальних за швидкодією процесів для систем з декількома керуючими органами у разі обмежених за модулем координат керування. Після робіт Понтрягіна та його школи в теорії оптимального керування відбулася та канонізація методів і мови, яка свідчить про появу нової дисципліни “Теорія оптимального керування”.

10.1 Постановка й класифікація задач оптимізації

Під час розробки автоматичних систем насамперед ставиться задача виконання функціонального призначення системи, що визначається метою керування. Більш складною є задача розробки системи з найкращими показниками якості – оптимальної системи. Оцінку досяжності мети у процесі керування об’єктом, яка подана у формалізованому вигляді, називають критерієм оптимальності або цільовою функцією. Розробка оптимальної системи  - це задача синтезу або задача оптимізації.

Розв’язання цієї задачі починають з її постановки, яка містить опис заданих реальних елементів системи математичними співвідношеннями (складення математичної моделі системи), визначення існуючих обмежень для координат системи й аналіз характеристики сигналів зовнішніх впливів, а також складення математичного виразу заданого критерію якості. Далі задачу розв’язують відповідними математичними методами, у результаті чого знаходять функцію керування за умови мінімуму чи максимуму показника якості, що визначає оптимальний режим роботи об’єкта.

Обмеження фазових координат і керувань

Об’єкт керування можна подати у вигляді, що наведений на рис. 10.1. Величини u1(t), …, um(t) зручно вважати координатами деякого вектора u = (u1, u2, …um) у m-мірному просторі керування. Вектор u називають вектором керування або керуванням.

Величини y1(t), …, yn(t) розглядають як координати вектора y = (y1, …, yn) у n-мірному просторі, який називають фазовим простором об’єкта, що розглядають. Вектор y називають фазовим вектором або вектором стану. Він визначає стан об’єкта у даний момент часу. Якщо стан об’єкта характеризується двома фазовими координатами, то кажуть про фазову площину. Розмірність векторів  u і y може бути однаковою або відрізнятися одна від одної (mn). Пару векторних функцій [u(t), y(t)] називають процесом керування або просто процесом.

Під час розробки оптимальних систем автоматичного керування необхідно враховувати різні обмеження, що накладають на координати і показники якості процесу.

Усі обмеження координат і керувань можна розділити на два типи: природні та умовні.

Природні обмеження фазових координат обумовлені принципом роботи об’єкта. Наприклад, частота обертання асинхронного електродвигуна не може бути більшою за синхронну частоту; вихідні сигнали підсилювача обмежені через явище насичення і т.д.

Умовні обмеження координат уводять свідомо. Наприклад, величину струму якоря електродвигуна постійного струму обмежують умовами нормальної комутації на колекторі, нагрівом струмопровідних частин, граничною температурою ізоляції обмоток. Наявність умовних обмежень координат звичайно обумовлює введення обмежень на керування.

Іншими словами, вектори u(t) і y(t) можуть змінюватись лише у деякій зоні, що допускається:

u(t) Gu; y(t) Gy.    (10.1)

Першу умову називають обмеженням на керування, другу – фазовим обмеженням. Gu і Gy – деякі задані множини. Множину  Gu називають областю керування. Її вказують у математичному описі об’єкта. Наприклад, якщо параметри u1 і u2 характеризують на площині векторну величину, модуль якої не перевищує одиниці, а напрямок довільний, то ці параметри підкоряються умові , а область керування Gu являє собою круг одиничного радіусу (рис. 10.2).

У загальному випадку область керування може мати геометрично більш складний характер, оскільки через конструкцію об’єкта між керуючими параметрами ui можуть існувати зв’язки, що виражаються рівняннями вигляду:

         .    (10.2)

Для технічних систем особливо важливим  і характерним є випадок замкнутої множини Gu, тобто випадок, коли точка може знаходитись не тільки всередині цієї множини, а і на її межі.

Важливо зробити ще одне припущення: значення керуючих параметрів можуть змінюватися стрибком, тобто ці параметри є безінерційними. Тому необхідно розглядати не тільки безперервні, а й кусково-безперервні керування.

Функція u(t) при t0 t t1 називається кусково-безперервною, якщо складається зі скінченної кількості безперервних кусків, тобто є безперервною для всіх моментів часу t, за винятком лише скінченної кількості цих моментів, де функція u(t) може мати розрив першого роду (рис. 10.3).

Кусково-безперервні керування дозволяють отримати для достатньо широкого класу прикладів точний математичний розв’язок оптимальної задачі та є достатньо наочними і зручними для технічної реалізації.

Критерії оптимальності

Важним етапом під час розробки оптимальних систем є формулювання мети оптимізації, яка математично виражається як вимога забезпечення мінімуму чи максимуму деякого показника якості (критерію оптимальності).

Як критерій оптимальності, можуть бути прийняті різні технічні та техніко-економічні показники й оцінки.

Наприклад, критерій може відображати техніко-економічну вигоду (продуктивність, коефіцієнт корисної дії тощо), при цьому оптимальне керування повинне забезпечувати максимум критерію оптимальності; він може виражати також утрати (витрату енергії, палива, коштів і т.д.), у цьому випадку оптимальне керування забезпечує мінімум критерію.

Цільову функцію необхідно подати у формі, яка допускає використання будь-якого відомого методу синтезу оптимальних систем. Під час розробки найпростіших локальних систем керування звичайно розглядають задачу оптимізації за критеріями, що характеризують якість функціонування системи (точність, швидкодію), а інші критерії не враховують.

У теорії автоматичного керування широко розповсюджені функціонали, що характеризують якість системи.

Змінна величина I[x(t)] називається функціоналом, що залежить від функції x(t), якщо кожній функції x(t) відповідає число I.

У загальному випадку функціонал залежить від фазових координат yi(t), координат керування uj(t), збурюючих впливів zk(t) і може бути поданий у вигляді:

y, u, z]dt,     (10.3)

де [t0, t1] – інтервал часу, що розглядають; F – визначена функція, яка відображає показник якості; y, u, z – вектори фазових змінних, керувань і збурень відповідно.

Досягнення максимального чи мінімального (екстремального) значення цього функціоналу вказує на оптимальну роботу чи стан системи.

Розглянемо деякі типи критеріїв оптимальності найпростіших об’єктів і систем керування складними процесами.

Час перехідного процесу:

   (10.4)

Отримана при цьому система є оптимальною за швидкодією, якщо вона забезпечує мінімум інтегралу (10.4) з урахуванням обмежень координат.

Інтегральні оцінки якості перехідного процесу:

    (10.5)

   (10.6)

   (10.7)

де (t) = y(t)–y(t) – відхилення вихідної змінної y(t) від заданого значення y(t);

- середнє значення квадрату помилки системи;

- середнє значення квадрату вихідної координати.

За умови забезпечення мінімуму інтегралу (10.5) система є оптимальною за точністю у динамічних режимах при ступінчастому задавальному впливі.

За умови забезпечення мінімуму функціоналів (10.6) і (10.7) система є оптимальною за точністю у статичному розумінні.

Для визначення коливальності перехідного процесу, тобто характеру його протікання, застосовують узагальнений інтегральний квадратичний критерій:

     (10.8)

де rі – вагові коефіцієнти.

Перший доданок у виразі (10.8) забороняє тривале існування відхилення вихідної координати у, а подальші доданки – тривале існування великих значень похідних. Тому мінімуму інтегралу (10.8) відповідають достатньо швидкоплинні й плавні перехідні процеси.

Зазначимо, що інтегральні критерії (10.5) – (10.8) не враховують того, що у системі можуть мати місце обмеження потужності сигналу керування. Крім того, система сама може мати обмежені енергетичні ресурси. Ці обмеження враховують функціонали вигляду:

       (10.9)

Перший доданок у виразі (10.9) має той самий смисл, що й у виразі (10.8). Другий доданок, з одного боку, означає досягнення оптимальності гасіння збуреного руху за умови обмеження витрат енергії на керування, а з іншого – забезпечує пошук оптимального керування серед множини лінійних функцій, що допускаються.

Витрати енергії на керування:

    (10.10)

де u(t) та i(t) – напруга і струм навантаження; r=1/R – коефіцієнт пропорційності; R – опір електричного ланцюга.

Даний критерій також використовують при керуванні від джерел енергії, що є обмеженими за потужністю.

У механічних системах для оцінювання енергії керування іноді беруть функціонал вигляду:

        (10.11)

де u(t) – координата керування;  - похідна вихідної змінної об’єкта.

Витрати палива:

   .     (10.12)

За умови мінімуму цього інтегралу отримуємо систему, оптимальну за витратами палива.

У випадках, коли необхідно забезпечити найкращу роботу системи за найгірших можливих умов, застосовують мінімаксний критерій оптимальності.

Формування критерію оптимальності, що визначає мету оптимізації, - це інженерна та інженерно-економічна задача, яку розв’язують на підставі глибокого та всебічного вивчення об’єкта, яким керують.

Якщо необхідно врахувати різні показники якості, задача вибору критерію оптимальності ускладнюється, оскільки вимоги до системи звичайно є суперечними. У зв’язку з цим як основний беруть критерій якості функціонування.

Класифікація задач оптимізації

Для того, щоб повністю завдати рух об’єкта, необхідно знати його фазовий стан у початковий момент часу t0 і вибрати керування u(t).

Цей вибір здійснюють за таких умов:

- задані крайові умови, тобто початковий y(t0) і кінцевий y(tк) стан об’єкта;

- оптимальність керування оцінюється за максимумом чи мінімумом функціоналу (10.3);

-   на керування і змінні стану накладають обмеження (10.1);

Конкретизація всіх цих умов породжує різні типи задач оптимізації, які можна розділити на три групи за способом завдання:

- функціоналу І;

- обмежень;

- крайових умов.

Різні види функціоналу І були розглянуті вище.

За способом завдання обмежень задачі розділяють на:

  •  задачі з обмеженням на керування;
  •  задачі з обмеженням на фазові змінні;
  •  задачі зі спільним обмеженням на керування і на фазові змінні.

За способом завдання крайових умов задачі можна розділити на:

- задачі з фіксованими кінцями: задані значення y(t0) і y(tк), а також моменти часу t0 і tк;

- задачі з вільними кінцями: якщо y(t0) чи y(tк) не задані, то маємо задачу з вільним лівим чи правим кінцем відповідно;

  •  задачі з рухомими кінцями: у цьому випадку значення t0 і tк зафіксовані, а вектори стану y(t0) і y(tк) задані деякими множинами .

Крім зазначених ознак класифікації задач оптимізації, ці задачі можна розділяти за видом змінних і видом залежностей між ними.

За видом дії над змінними залежності можуть бути алгебраїчними і диференціальними. Задачі, що містять диференціальні залежності у функції часу, називають задачами динамічної оптимізації чи оптимального керування. Саме цим задачам приділяється основна увага у даній главі.

10.2 Класичні методи варіаційного числення

Методи варіаційного числення можна умовно розділити на класичні й сучасні. До класичних належать методи, що ґрунтуються на рівняннях Ейлера, Лагранжа, Якобі, Вейєрштрасса.  Їх доцільно застосовувати до задач, у яких області змін u(t) і y(t) не містять обмежень. Це має місце, коли розглядають малі відхилення u(t) і y(t) від усталених станів. Сучасні методи ґрунтуються на принципі максимуму Понтрягіна і методі динамічного програмування Беллмана. Їх перевагами є можливість урахування обмежень на керування та змінні стану, а також придатність до застосування ЕОМ.

Варіаційна задача з закріпленими граничними точками. Рівняння Ейлера

Під час вивчення перехідних процесів систем керування характер динаміки можна оцінювати величиною визначеного інтегралу. Наприклад, для одномірних об’єктів:

  (10.13)

де y = y(t),  - траєкторії координати виходу та її першої похідної за часом.

Технічна задача оптимізації динаміки об’єкта приводиться до математичної задачі знаходження екстремуму функціоналу (10.13). При цьому шукана функція повинна задовольняти крайовим умовам: y(t0) = y0; y(tк) = yk, де y0, yk – задані числа.

Така задача називається варіаційною задачею із закріпленими граничними точками (із закріпленими кінцями) (рис. 10.4).

Умова екстремуму інтегралу (10.13) при фіксованих граничних  значеннях і відсутності обмежень на координати записується у вигляді рівняння Ейлера:

  (10.14)

Криві, на яких реалізується екстремум функціоналу (екстремалі), є інтегральними кривими цього рівняння. Для з’ясування, чи відповідає знайдена екстремаль мінімуму функціоналу, необхідно перевірити виконання додаткових умов. Оскільки це є достатньо складною процедурою, на практиці іноді обмежуються чисельною перевіркою значення функціоналу біля знайденої екстремалі.

Приклад 10.1 Знайти криву y(t), що проходить у фіксовані моменти часу t0 і tk через задані точки у0 і уk, на якій досягає екстремуму функціонал:

     (10.15)

де k – задане число (k>0).

У даному випадку тому

Рівняння Ейлера для екстремалей функціоналу (10.15) має вигляд:

або    (10.16)

Розв’язок цього рівняння запишемо у вигляді:

.    (10.17)

Для визначення С1 і С2 використовуємо граничні умови:

Тоді отримуємо:

 (10.18)

У задачах оптимізації динаміки об’єктів у загальному випадку функціонал (10.13) може містити похідні вищих порядків. Необхідну умову наявності екстремуму такого функціоналу визначає рівняння Ейлера-Пуассона (за фіксованих граничних умов і відсутності обмежень на координати):

(10.19)

Слід зазначити, що рівняння (10.14) і (10.19) застосовуються для знаходження екстремумів відповідних функціоналів тільки тоді, коли координати y(t) є безперервними гладкими функціями і не мають обмежень типу нерівностей.

Ці рівняння виражають першу необхідну умову екстремуму. Однак, залишається неясним, є отримані екстремалі максимумом чи мінімумом функціоналу. Відповідь на це запитання дає теорема Лежандра, яка виражає другу необхідну умову екстремуму:

Для того, щоб функціонал (10.13) у задачі із закріпленими кінцями досягав на кривій мінімуму (максимуму), необхідно, щоб уздовж цієї кривої виконувалась умова:

 (10.20)

Так, для прикладу (10.1) маємо:

значить, на кривій (10.17) функціонал (10.15) досягає мінімуму.

Варіаційні задачі на умовний екстремум. Рівняння Ейлера-Лагранжа

Задачі синтезу алгоритмів оптимального керування об’єктами у динаміці при вибраному функціоналі критерію якості мають додаткові (умовні) обмеження у вигляді рівнянь математичної моделі динаміки об’єкта. Екстремум функціоналу, що визначається за додаткових умов (функціональних обмеженнях), називають умовним екстремумом. Задачі на умовний екстремум при визначенні оптимальних керувань об’єктом у динаміці зумовлені тим, що траєкторія виходу y(t) є наслідком зміни координати керування і залежить від виду диференціального рівняння об’єкта.

Таким чином, задача оптимізації об’єкта керування у динаміці, яку розв’язують класичним варіаційним численням, має таке формулювання:

  •  математична модель об’єкта задана у формі рівняння:

    (10.21)

  •  задані граничні умови: y(t0) = y0; y(tк) = yk;
  •  необхідно визначити оптимальне керування u(t), що забезпечує мінімум функціоналу:

   (10.22)

Ця задача називається задачею Лагранжа. Перші задачі на умовний екстремум були поставлені й розв’язані засновниками класичного варіаційного числення Бернуллі, Ейлером і Лагранжем.

Розв’язувати задачу на умовний екстремум можна методом множників Лагранжа. Для цього введемо до розгляду новий функціонал:

(10.23)

де - множник Лагранжа;

- функція Лагранжа;

- функція зв’язку.

За допомогою множників Лагранжа задача про умовний екстремум функціоналу (10.22) приводиться до задачі на безумовний екстремум функціоналу (10.23). Рівняння Ейлера при цьому складають для функції Лагранжа:

    (10.24)

Ці рівняння називають рівняннями Ейлера-Лагранжа. Вони характеризують умову стаціонарності функціоналу (10.23). У результаті розв’язування цих рівнянь з урахуванням математичної моделі об’єкта і граничних умов отримаємо оптимальне керування u(t) об’єктом у динаміці.

Приклад 10.2 Визначити оптимальне керування об’єктом, що заданий рівнянням:

,      (10.25)

у процесі переходу об’єкта з фіксованого початкового стану у фіксований кінцевий стан: y(t0) = y0; y(tк) = yk = 0 , за умови мінімуму функціоналу

     (10.26)

Запишемо рівняння об’єкта (об’єкт описується аперіодичною ланкою першого порядку) у вигляді:

де а = -1/Т; b = k/T.

Складаємо функцію Лагранжа:

   (10.27)

Тобто допоміжний функціонал має вигляд:

   (10.28)

З урахуванням того, що

записуємо рівняння Ейлера-Лагранжа:

     (10.29)

З другого рівняння маємо: u=b/2, тоді можна записати систему двох рівнянь:

 або    (10.30)

З другого рівняння , тоді отримуємо рівняння другого порядку:

або

     (10.31)

Розв’язок цього рівняння має вигляд:

де

Умовам стійкості та вимогам y(tк) = 0 задовольняє тільки від’ємний корінь, тому маємо:

    (10.32)

З урахуванням граничних умов С1=y(o)=y0.

Далі знаходимо: ;

Тоді: де

Шукане оптимальне керування: або з урахуванням (10.32):

   (10.33)

де

   (10.34)

Рівняння (10.33) визначає структуру оптимального регулятора для заданого об’єкта керування і вибраного функціоналу (10.26). Мінімум цього функціоналу гарантує мінімальні відхилення y(t) і u(t) у період перехідного процесу. Вираз (10.34) визначає оптимальне значення коефіцієнта k0.

Слід нагадати, що при використанні класичного варіаційного числення шукані функції оптимальних процесів є безперервними і на координати виходу та керувань не накладають обмеження.

Під час розв’язання задач оптимального керування ці умови далеко не завжди дотримуються.

По-перше, керуючі впливи, що входять до функціоналів, можуть бути кусково-безперервними (рис. 10.3). За деяких умов координати об’єкта також мають розрив. Значить, порушуються умови безперервності, що робить розв’язок задачі дуже складним або неможливим.

По-друге, у практичних системах на координати і керування завжди накладаються обмеження. Це відповідає тому, що координати і керування можуть змінюватися у деяких замкнутих зонах, а також знаходитись на межах цих зон. Остання обставина може стати причиною серйозних ускладнень. Проілюструємо це за допомогою рис. 10.5.

У першому випадку рівняння допомагає знайти оптимальне значення u=u, при якому Q=Qmin, а у другому маємо мінімум і при невиконанні цієї умови.

Таким чином, порушення умов, на яких ґрунтується класичне варіаційне числення, не дозволяє розв’язувати  цими методами широке коло задач теорії автоматичного керування.

Ці труднощі можна подолати за допомогою нових методів розв’язування задач теорії оптимальних систем – методу динамічного програмування і принципу максимуму.

10.3 Метод динамічного програмування Беллмана

У техніці існує клас об’єктів і процесів, керування якими здійснюється на підставі обмеженої кількості рішень, що приймають послідовно у деякі фіксовані моменти часу. Для розв’язування задач оптимізації таких об’єктів американський вчений Р.Беллман запропонував метод, що отримав назву динамічного програмування. Цей термін означає прийняття рішень у часі.

За допомогою динамічного програмування можна розв’язувати задачі, що є дискретними за своєю природою. Це має велике значення для найрізноманітніших галузей техніки та економіки, пов’язаних з дискретними процесами виробництва.

У основі методу лежить принцип оптимальності. Відповідно до цього принципу оптимальне керування визначається кінцевою метою керування і станом системи у даний момент часу незалежно від того, яким чином система дійшла до цього стану, тобто від “передісторії” системи. Це означає, що для будь-якої оптимальної траєкторії кожна ділянка, яка зв’язує будь-яку проміжну точку цієї траєкторії з кінцевою, також є оптимальною траєкторією. Іншими словами, друга ділянка оптимальної траєкторії є оптимальною траєкторією.

Пояснимо метод динамічного програмування на простому прикладі керування об’єктом, рух якого описується рівнянням (10.21):

причому на керуючий вплив накладені обмеження u(t) Gu, а також задані початкові умови: y(t0) = y0.

Необхідно мінімізувати функціонал:

  (10.35)

де  - деякий функціонал, що залежить від значення вихідної координати у кінці інтервалу часу Т, тобто значення критерію при останньому кроці на ділянці dt (без урахування попередніх).

Для розв’язування задачі Беллман застосував прийом, що полягає у посуванні від кінця процесу (t =T) до його початку (t=0).

У результаті було отримане рівняння динамічного програмування у безперервній формі, яке у найпростішому випадку для системи першого порядку з однією керуючою дією має вигляд:

 (10.36)

де y0, u0 – початкові значення вихідної координати і керування,

S – мінімальне значення функціоналу (10.35), яке залежить від початкових умов.

Для отримання мінімуму рівняння (10.36) необхідно продиференціювати за керуванням u. Тоді умову мінімуму (10.36) можна замінити системою:

   (10.37)

де y, u – поточні значення вихідної координати і керування.

З другого рівняння системи (10.37) визначають dS(y)/dy, а потім з першого рівняння знаходять шукану залежність u=f(y).

У випадку, коли система має n вихідних координат і m керувань, рівняння (10.37) матимуть вигляд:

 (10.38)

Наведена система рівнянь є найпоширенішою формою запису рівнянь Беллмана. При цьому функція має бути безперервною й диференціюваною за yі, а dS/dyі відіграє ту саму роль, що і множник у задачі на умовний екстремум. Функція аналогічна рівнянню зв’язку (10.21).

Приклад 10.3 Розв’язати задачу (приклад 10.2) методом динамічного програмування.

Маємо рівняння об’єкта:

Функціонал:

Тоді система (10.37) має вигляд:

   (10.39)

Звідси знаходимо: dS/dy = - 2u/b;

або

Отримали квадратне рівняння відносно u, корені якого є шуканими керуваннями:

Другий корінь відкидаємо як такий, що не відповідає умовам стійкості, й остаточно запишемо:

що співпадає з розв’язком (10.33), (10.34).

З рівнянь (10.39) можна виключити u, і тоді визначити функцію S.

Приклад 10.4  Розв’язати задачу з обмеженням:

де x=f(u) – нелінійна функція з обмеженням (рис. 10.6).

Функціонал, що мінімізується, має вигляд:

              

У даному випадку:

Тоді рівняння Беллмана матимуть вигляд:

 (10.40)

З другого рівняння отримуємо:

Тоді: ;

Отримали рівняння, аналогічне попередньому прикладу, розв’язок якого має вигляд:

Розв’язок рівняння  дає константу f(u)=const. З урахуванням обмежень маємо |f(u)| = C.

10.4 Принцип максимуму Понтрягіна

1956 року в роботах академіка Л.С. Понтрягіна та його учнів було обґрунтовано принцип максимуму як необхідна і достатня ознака оптимального процесу для лінійних систем і необхідна ознака для нелінійних систем.

Між принципом максимуму і принципом оптимальності Беллмана існує прямий зв’язок.

Розглянемо спочатку матеріальну точку масою m=1, яка вільно і без тертя рухається по горизонтальній прямій і має двигун, що розвиває силу Fд. Тоді рівняння руху точки мають вигляд:

dS/dt = V; dV/dt = a; a = Fд,    (10.41)

де S, V, a – переміщення, швидкість і прискорення точки відповідно.

Позначимо:

y1 = S;  y2 = V;  u = Fд,

і тоді запишемо рівняння (10.41) у вигляді:

 (10.42)

Знайдемо оптимальне керування точкою, при якому вона перейде з початкового положення Sп до кінцевого положення Sк за мінімальний час, тобто I = T = min (функціонал 10.4).

На керування накладають обмеження:

    (10.43)

Інтегруючи рівняння (10.41) отримаємо:

  (10.44)

де Sп, Vп – початкові умови.

Для виконання умови T=min, необхідно, аби середня швидкість руху на відрізку [Sп, Sк] була як можна більшою, тобто

Побудуємо діаграми зміни a, V, S з урахуванням (10.43) і (10.44) за умови, що Vп = 0, Sп = 0 (рис. 10.7).

Для точного влучення у точку Sк необхідно правильно вибрати точку початку гальмування. Визначимо для цього шлях гальмування Sг із умов:

де  - час гальмування, переміщення і швидкість точки у початку гальмування.

Оскільки  то

   (10.45)

Це є рівняння параболи.

Якщо записати замість  відповідно S, V – поточні координати початку гальмування, то рівняння (10.45) можна записати у вигляді:

(10.46)

Знак “мінус” ставиться при V > 0, знак “плюс” – при V < 0.

Побудуємо залежність S=f(V) на фазовій площині з урахуванням обмежень  (рис. 10.8).

Початок координат відповідає кінцевій точці Sк (зупинка руху).

Якщо точка знаходиться на ділянці фазової траєкторії 1-0-1, то для того, щоб точка влучила у задане положення, необхідно почати гальмування з максимальним сповільненням.

Якщо точка знаходиться на ділянці 2-1 або 2-1, то гальмування слід починати тільки після досягнення точок 1 (1). До цього моменту швидкість повинна залишатися максимальною і постійною.

Якщо гальмування починати, наприклад, у точці 3 (3), то тіло “проскочить” задане положення, влучивши у точку 4 (4). Тоді тіло слід розігнати на ділянці 4-5 (4-5) а потім гальмувати по лінії 5-0 (5-0).

Якщо у початковий момент часу тіло знаходиться у точці 6 (6), то його слід спочатку розігнати до точки 7 (7), а потім гальмувати по лінії 7-0 (7-0).

Таким чином, для досягнення максимальної швидкодії необхідно працювати на межі можливостей (за реальних умов це не завжди так, якщо запас енергії обмежений).

Отже, фазовий портрет можна розділити на дві зони:

  •  зона А, в якій швидкість V зростає, тобто а > 0;
  •  зона В, в якій швидкість V знижується, тобто а < 0.

Межа, що розділяє ці зони, називається лінією перемикання. За відомими рівнянням цієї лінії та станом системи X (швидкість V і положення відносно Sк), можна завжди визначити керуючий вплив:

.

Рівняння (10.45) можна записати у вигляді:

, при |V| < Vmax, або

при |V| < Vmax,    (10.47)

де         (10.48)

Для зон А і В, відповідно, виконуються умови:

Тоді сигнал керування повинен мати вигляд:

  (10.49)

Умова (10.49) виражає алгоритм керування, що реалізує оптимальні за швидкодією процеси у системі.

Аналіз фазового портрета показує, що для переміщення з будь-якої точки Sп до заданої точки Sк керування змінюється максимум один раз або має одне перемикання (два інтервали).  У точках перемикання u(t) має розрив першого роду. Такі керування належать до класу припустимих (рис. 10.3).

Тепер перейдемо до розгляду принципу максимуму. Скористаємось рівнянням (10.36).

Позначимо: , тоді вектор  запишемо:

Оскільки max(-y) = -min(y) (рис. 10.9), то можна записати:

або

    (10.50)

Отже, умову мінімуму інтегралу (10.35) запишемо у вигляді:

  (10.51)

де - скалярний добуток двох векторів.

Отриманий вираз (10.51) є математичним записом принципу максимуму Понтрягіна.

Зазначимо, що під час застосування методу динамічного програмування у загальному випадку необхідно попередньо знайти функцію S, що пов’язано з розв’язком диференціальних рівнянь у частинних похідних. Використання принципу максимуму потребує знання вектора , що розглядають на оптимальній траєкторії. А цей вектор можна знайти простіше, розв’язавши так звані спряжені рівняння:

   (10.52)

Часто рівняння (10.51) і (10.52) записують у більш компактній формі, позначивши скалярний добуток векторів через H. Тоді отримуємо:

    (10.53)

     (10.54)

де  (з урахуванням того, що ).

Узявши частинну похідну H за і, отримаємо рівняння руху об’єкта:

     (10.55)

Із виразу (10.53) можна зробити такі висновки:

- якщо процес є оптимальним, то у будь-який момент часу t оптимальне керування u(t) – це таке керування, що максимізує величину Н;

- у будь-якій точці оптимальної траєкторії максимальне значення величини Н одне й те саме: воно дорівнює нулю.

Функцію Н називають функцією Гамільтона. Вона має визначений фізичний смисл. Зокрема для консервативних механічних систем функція Н є повною енергією системи, яка повинна залишатися постійною й максимальною у процесі керування. Функції і є імпульсами і задають напрямок руху.

Для неконсервативних систем, наприклад електричних, функція Н – потужність, а і – також імпульси.

Звідси випливає фізичний смисл оптимального керування: необхідно надавати об’єкту таку кількість енергії, яка забезпечувала б його рух, при якому  функціонал, вибраний як критерій оптимальності, досягав би екстремального значення за обмежень, що накладені на фазові координати та керування. Ця енергія надається за допомогою керування u, тому Н є функцією також і від u.

Таким чином, принцип максимуму в загальному випадку можна сформулювати так:

Для отримання оптимальної системи, у смислі мінімуму функціоналу І, необхідне існування таких ненульових безперервних функцій 0(t), …, n(t), які є розв’язком системи  що при будь-якому t з інтервалу 0 t T, величина Н як функція змінних u1, … , ur у заданій зоні їх припустимих значень, досягає максимуму відповідно до умови:

Принцип максимуму є найдоцільнішим з усіх методів знаходження оптимальних керувань при розв’язуванні задач про швидкодію.

Розв’язування задачі виконують у такій послідовності:

  1.  Складають функцію Гамільтона Н, що дорівнює скалярному добутку векторів , тобто  причому .

2. Беруть частинні похідні Н за керуванням ui, які визначають екстремум функції Н. У разі лінійної залежності Н від ui частинна похідна  є функцією однієї або декількох складових вектора . При цьому для досягнення додатного максимуму Н необхідно, аби ui = +umax при і(t) > 0 і ui = -umax при і(t) < 0, тобто

ui = umax sign і(t).    (10.56)

Таким чином, у даному випадку керуючий вплив стрибком набуває значення  +umax або -umax. Момент зміни знаку називається моментом перемикання.

У разі нелінійної залежності Н від ui частинну похідну  дорівнюють нулю і з отриманого рівняння визначають ui, при якому максимізується Н.

3. Для знаходження допоміжної функції і(t), яка визначає керування, складають і розв’язують систему спряжених рівнянь (10.54)

4. У разі замкнутої системи визначають залежність керування від вихідних координат системи, що визначають оптимальну траєкторію:  При цьому моменти перемикання визначаються автоматично при відхиленні фактичної траєкторії від оптимальної.

У разі розімкнутої системи визначають кількість змін знаку і(t), тобто визначають, скільки разів і(t) переходить через нуль або інакше, скільки коренів має функція і(t). Моменти перемикання можна визначити за методом стикування розв’язків диференціальних рівнянь зі знакозмінною правою частиною.

Приклад 10.5 Система задана рівняннями (10.41),(10.42):

Необхідно розв’язати задачу про максимальну швидкодію, тобто знайти оптимальне керування u, при якому перехід системи з початкового стану в кінцевий (рівноважний) стан відбувався б за мінімальний час. При цьому на керування накладається обмеження: |u|  umax.

Запишемо функцію Гамільтона:

Оскільки Н лінійна відносно u, то для визначення максимуму Н необхідно знайти 2. Запишемо систему спряжених рівнянь:

Звідси випливає:

1 = С1;

де С12 – сталі інтегрування.

Для досягнення максимуму Н необхідно, щоб 2 і u були одного знаку, тобто:

u = umaxsign2.     (10.57)

Оскільки функція  має один корінь t1=C2/C1, то керування u має одну зміну знаку (два інтервали керування), що співпадає з раніше отриманим результатом (рис. 10.8). Після закінчення керування  (рис.10.10).

Принцип максимуму дає тільки якісну сторону зміни керуючої дії, тобто визначає кількість інтервалів керування, і не дає кількісної оцінки закону керування, оскільки сталі С1 і С2 не можна визначити через невідомі початкові умови для функції (t). Це є його суттєвим недоліком.

Для конструювання оптимального регулятора цього недостатньо. Необхідно обов’язково знати моменти перемикання керуючої дії.

У даному прикладі у разі замкнутої системи це можна зробити, якщо знайти рівняння лінії перемикання (10.47):

або   

При цьому  

У разі розімкнутої системи моменти перемикання знаходять методом стикування розв’язків диференціальних рівнянь. У прикладі (10.5) маємо два інтервали часу (два інтервали керування). Тому необхідно знайти моменти часу:

t1 – момент зміни знаку керування;

T = t2 – закінчення керування.

Нехай у початковий момент часу (t = t0 = 0) тіло знаходиться у точці В (рис. 10.10), тобто S(t0) = -S0 = -y10;

Кінцеве значення координат: S(t2) = y1(t2)=0;

При цьому з рис. 10.10 видно, що перший інтервал керування є додатним (u = +umax), а другий – від’ємним (u = -umax).

Розв’язуємо диференціальне рівняння:  тобто рівняння зі знакозмінною правою частиною. Характеристичне рівняння: s2 = 0, тобто маємо два нульових кратних кореня s1=s2=0. Тоді розв’язок має вигляд:

   (10.58)

де С1 і С2 – сталі інтегрування.

Після диференціювання отримуємо:

    (10.59)

Запишемо рівняння (10.58) і (10.59) для різних моментів часу:

  •  для t = t0 = 0 (початок першого інтервалу):

  (10.60)

Звідси С10 = 0, С20 = -y10;

  •  для t = t1 (кінець першого, початок другого інтервалу); оскільки функції безперервні, то можна виконати стикування розв’язків на межі першого і другого інтервалів:

 (10.61)

Звідси отримуємо:

  •  для t = t2 = T (кінець другого інтервалу):

  (10.62)

Звідси

Дорівнюємо вирази для С11 , а також для С21. Тоді отримуємо відповідно:

або t2 = T = 2t1;

Після підстановки першого рівняння до другого отримаємо:

Звідси знаходимо:

  •  момент перемикання керування:
  •  момент закінчення руху:

У даному прикладі розглядали систему другого порядку і було отримане рівняння лінії перемикання. Розв’язуючи задачу для систем більш високих порядків, отримують рівняння поверхні перемикання у багатомірному фазовому просторі. При цьому кількість перемикань визначається відповідно до теореми про n-інтервалів, яку 1953 року довів у своїх роботах О.А.Фельдбаум:

Якщо характеристичне рівняння системи n-го порядку має тільки дійсні недодатні корені (від’ємні та нульові), процес керування матиме не більше    (n-1) перемикань. Якщо є комплексні корені (включаючи чисто уявні), то перемикань може бути більше залежно від початкових умов.

Можна зробити висновок, що оптимальна за швидкодією система має релейний перемикаючий елемент, що керується за допомогою спеціального обчислювального пристрою. При цьому необхідно безперервно вимірювати всі n фазових координат, тобто регульовану величину і (n-1) її похідних і подавати інформацію на вхід обчислювального пристрою.

Оскільки ідеальні диференціювальні ланки фізично не реалізуються, то для систем високого порядку можна здійснити лише близькі до оптимальних системи. Крім того, для систем високого порядку знаходження поверхонь перемикання є досить складною задачею, яка розв’язана лише для окремих випадків.

Приклад 10.6  Визначити закон змінювання струму якоря двигуна постійного струму з незалежним збудженням, що забезпечує відпрацювання кутового переміщення 0 протягом мінімального часу Т при обмеженні струму якоря |i| іmax і статичному моменті Мс=0.

Рівняння, що описують динаміку двигуна, мають вигляд:

де - кутова швидкість двигуна; с – струмова стала двигуна; J – момент інерції електропривода.

Позначимо: = y1, = y2, i = u. Тоді рівняння двигуна матимуть вигляд:

   (10.63)

за початкових умов y1(0) = 0, y2(0) = 0 і при кінцевих значеннях змінних y1(Т) = 0, y2(Т) = 0.

Складаємо функцію Гамільтона:

Функція Н лінійна відносно u.Запишемо систему спряжених рівнянь:

   (10.64)

Звідси отримуємо: 2 = С2;

де С1 і С2 – сталі інтегрування.

Для досягнення максимуму Н необхідно, щоб 1 і u були одного знаку, тобто

u = umaxsign1 = іmaxsign1= іmaxsign(C1 - C2t).

Функція  має один корінь t1=C1/C2, тому керування u має одну зміну знаку:

   (10.65)

Визначимо момент перемикання t1. Для цього використаємо перше рівняння системи (10.63). На першій ділянці при t < t1 керування u = imax, тому dy1/dt = cimax/J.

За початкових умов y1(0) = 0 отримуємо розв’язок цього рівняння:

При t = t1 швидкість у кінці першої ділянки обчислюється за формулою:

    (10.66)

На другій ділянці при t t1 керування u = - іmax, тому dy1/dt = -cimax/J.

Розв’язок цього рівняння знаходимо за формулою:

Сталу інтегрування С3 визначимо з умови, що функція y1(t) при t = t1 безперервна і на другій ділянці слушна формула (10.66). Тоді отримуємо:

При t = T маємо y1(T) = 0, тобто  звідки t1= T/2.

Час Т визначимо з умови, що за цей час кутове переміщення дорівнює 0. Тоді з другого рівняння системи (10.63) маємо:

або

звідки знаходимо:

З урахуванням позначень струму якоря і кутової швидкості запишемо закони їх  змінювання під час відпрацювання двигуном заданого переміщення:

  

Закон змінювання напруги на якорі можна визначити з рівняння: uя = іR + c.

Цей закон має вигляд:

Геометрична інтерпретація оптимального керування

Вище було зазначено, що функції і є імпульсами і задають напрямок руху системи. Розглянемо розімкнуту систему керування об’єктом, що являє собою послідовне з’єднання двох аперіодичних ланок першого порядку (рис. 10.11). Запишемо рівняння ланок у нормальній формі Коші:

 (10.67)

Функція Гамільтона матиме вигляд:

(10.68)

Спряжені рівняння мають вигляд:

  (10.69)

Звідси знаходимо:

  (10.70)

Для об’єкта, що розглядають, керування визначається вектором , складова якого 1 один раз змінює знак, а складова 2 – знаку не змінює. Розглянемо оптимальне керування на фазовій площині (у1; у2) (рис. 10.12). Виходячи з початкових умов, припустимо, що перший інтервал є додатним, отже, і функції 1 і 2 також додатні, оскільки вони завдають напрямок розгону. Побудуємо на фазовій площині ділянку фазової траєкторії 1, що відповідає розгону. Вектор фазової швидкості буде направлений по дотичній до траєкторії зі складовими (10.67)  Для досягнення максимуму функції Н необхідно, щоб знаки  співпадали, тобто вектори  - паралельні. У деякий момент часу функція 1 змінює свій знак на від’ємний (10.70). Тому необхідно, щоб змінився знак і складової вектора фазової швидкості . Це можна зробити тільки за рахунок зміни знаку керуючої дії з +u на –u. При цьому рух буде відбуватися по траєкторії 2 (гальмування). Таким чином, і після зміни знаку вектори  залишаються паралельними. Це й слугує ознакою оптимальності фазової траєкторії.

10.5 Аналітичне конструювання оптимальних регуляторів

Аналітичним конструюванням регуляторів  (АКР) називається методика синтезу оптимального регулятора для заданого об’єкта при заданих обмеженнях і критерію оптимальності, що задається у квадратичній інтегральній формі вигляду (10.8):

.

Ця методика вперше була запропонована у роботах О.М.Льотова і Р.Калмана. Кожний з підходів має свої особливості, однак обидва рішення приводять до аналогічних результатів.

Суть задачі АКР полягає у визначенні варіаційними методами керуючої дії, яка мінімізує функціонал, що характеризує відхилення траєкторії справжнього руху системи від бажаної. У процесі аналітичного конструювання регуляторів відшукують закон керування у його аналітичній формі як деяку функцію фазових координат початкової системи. Таким чином, спочатку для заданого об’єкта керування при існуючих обмеженнях відшукують оптимальну траєкторію руху системи, а потім шляхом АКР визначають диференціальне рівняння (алгоритм керування) регулятора, що гарантує мінімальне відхилення траєкторії руху об’єкта керування від знайденої оптимальної траєкторії.

Узагалі рівняннями, що описують поведінку керуючого пристрою, можуть бути рівняння Ейлера, але вони не завжди виявляються такими, що реалізуються. Крім того, ці рівняння мають неприємну властивість: якщо час процесу керування у безперервній системі є скінченним, то рівняння Ейлера, що розглядають разом з рівняннями об’єкта, відповідають нестійкій системі регулювання. Так, у разі лінійного об’єкта і квадратичного функціоналу рівняння Ейлера є лінійними, причому серед коренів характеристичного рівняння обов’язково є як ліві, так і праві корені.

Якщо приєднання регулятора робить системи нестійкою, то це приєднання не може бути тривалим. Якщо відомо, що процес оптимального керування має спорадичний (одиничний, від випадку до випадку) характер, то можна піти на використання нестійкої системи, вмикаючи її лише на той момент, коли виникла потреба здійснити оптимальне керування, і обов’язково вимикаючи її після завершення керування. У тих випадках, коли регулятор має бути весь час підключеним до об’єкта, необхідно вжити заходів щодо забезпечення стійкості системи.

Цю задачу можна розв’язати шляхом відкидання у розв’язку рівняння складових, що відповідають додатним кореням. При цьому час керування стає нескінченно великим, проте функціонал набуває найменше з усіх можливих значення для різних Т.

Розглянемо окремі випадки такого роду систем і знайдемо рівняння екстремалі, що реалізує екстремум функціоналу (10.8) для цих випадків.

Нехай критерієм якості роботи системи слугує функціонал вигляду:

    (10.71)

Для знаходження екстремалі складаємо рівняння Ейлера (10.14). У даному випадку , а значить:

(10.72)

Характеристичне рівняння має вигляд:

  (10.73)

Для знаходження екстремалі необхідно враховувати тільки корені рівняння:  інакше система буде нестійкою. Таким чином, розв’язок рівняння (10.72) для стійкої системи має вигляд:

Сталу С визначають із початкових умов: при t = 0, y = y0, тоді

     (10.74)

Рівняння (10.74) є рівнянням екстремалі. Зазначимо, що екстремаль відповідає розв’язку диференціального рівняння першого порядку:  з характеристичним рівнянням  де Т – постійна часу. Вагову константу r1 можна подати через цю постійну часу Т, якщо дорівняти поліноми:

Звідси r1 = Т2, і тоді рівняння екстремалі матиме вигляд:

     (10.75)

Таким чином, при мінімізації функціоналу вигляду (10.71) структуру або параметри системи слід підбирати так, щоб перехідний процес у системі наближався до аперіодичного (10.75). Оскільки величина Т може бути взята різною, то маємо поле екстремалей (рис. 10.13), з яких вибираємо екстремаль, яка найбільш повно відповідає вимогам до системи.

Наприклад, якщо , то при t = 0:

. Тоді

де - припустиме значення похідної від вихідної координати.

Зазначимо, що при Т=0 отримуємо звичайний квадратичний інтегральний критерій:

     (10.76)

У цьому випадку рівняння екстремалі: у = 0. Фізично це означає, що при ступінчастому змінюванні керуючої дії вихідна координата у повинна змінитися стрибком від значення у0 до у=0. Зрозуміло, що в інерційній системі такий режим не можна реалізувати. Зазначимо також, що прагнення прискорити змінювання вихідної координати призводить до різкого збільшення коефіцієнта підсилення у ланцюгу зворотного зв’язку, що, у свою чергу, сприяє збільшенню коливальності процесу.

З’ясуємо на конкретному прикладі різницю синтезу систем за критеріями (10.71) і (10.76).

Приклад 10.7 Розглянемо слідкуючу систему заданої структури (рис. 10.14), яка описується диференціальним рівнянням другого порядку. Для поліпшення якості перехідного процесу виконавчий механізм охоплений жорстким від’ємним зворотним зв’язком за швидкістю. Необхідно визначити оптимальне значення коефіцієнта зворотного зв’язку kз.з., при якому критерії І1 та І2 набувають мінімального значення.

Передавальна функція розімкнутої системи має вигляд:

а диференціальне рівняння буде:

  (10.77)

Нехай вхідний сигнал змінюється стрибком від u до 0, тоді,

вважаючи у(0)=1;  і позначивши:

отримуємо:

      (10.78)

Визначимо величини І1 та І2 через коефіцієнти диференціального рівняння. Для цього помножимо (10.78) почергово на у і . Тоді отримаємо:

   (10.79)

Врахуємо, що  і обчислимо такі інтеграли:

(інтегрування частинами);

  

Тоді після інтегрування системи (10.79) отримаємо:

Звідси

 або

Для знаходження kз.з. , що відповідає І1= min, запишемо:

Звідси оптимальне значення kз.з.:

Коефіцієнт kз.з., що відповідає І2 = min, буде за умови r1=0, тобто

Візьмемо, наприклад, Т = 0,5 с; k1 = 200; k2 = 0,25 c-1; тоді k0 = 50 c-1; a0 = T/k0 = 0,5/50 = 0,01 c2.

Оцінку І1 знаходимо, задаючи r1. Поставимо вимогу, щоб перехідний процес наближався до експоненти з постійною часу Т = 0,1 с, тоді r1 = Т2 = 0,01 с2, і відповідні коефіцієнти зворотного зв’язку мають значення:

  

Якість перехідного процесу визначається коефіцієнтом демпфірування , який у даному випадку (10.78) дорівнює:

З урахуванням значень kз.з.1 і kз.з.2 отримуємо відповідні значення коефіцієнта демпфірування: 1 = 0,7; 2 = 0,5.

На рис. 10.15 наведені результати моделювання перехідного процесу за допомогою пакета Matlab для обох випадків.

З графіків видно, що перерегулювання у першому випадку (kз.з.1 = 0,03; 1 = 0,7; безперервна лінія) не перевищує 5%, а у другому (kз.з.1 = 0,02; 1 = 0,5; пунктирна лінія) – досягає майже 20%, тобто вибір kз.з. за критерієм І1 (10.71) забезпечує менше перерегулювання, ніж за критерієм І2 (10.76). Подальше збільшення r1 приведе до збільшення kз.з.1 і, відповідно, 1. При цьому зменшиться перерегулювання, але зросте час перехідного процесу.

Таким чином, при заданій структурі об’єкта ми не можемо реалізувати оптимальний перехідний процес, що мінімізує критерії І1 та І2 при будь-яких kз.з.. Це обумовлено інерційністю об’єкта керування, що залишає можливість реалізації процесу, лише близького до оптимального.

Як зазначалося раніше, у реальних системах керуючий сигнал u(t) обмежений за потужністю і величиною. Для врахування цього часто застосовують критерій вигляду (10.9):

 

Мінімізація цього інтеграла мінімізує величини у і u з урахуванням вагового коефіцієнта с.

Приклад 10.8 Об’єкт керування описується лінійним диференціальним рівнянням вигляду:

    (10.80)

Знайти закон керування u, який забезпечує мінімум функціоналу (10.9) під час переходу з початкового стану  в кінцевий стан: .

Маємо варіаційну задачу Лагранжа на умовний екстремум – знаходження мінімуму функціоналу (10.9) за наявності рівняння зв’язку, що отримуємо з рівняння об’єкта:

   (10.81)

Складемо допоміжну функцію:

де - множник Лагранжа.

Оскільки допоміжна функція містить першу і другу похідні, а також маємо дві змінні y і u, то рівняння екстремалі знайдемо як розв’язок системи рівнянь Ейлера-Пуассона (10.19):

(10.82)

З другого рівняння отримуємо: u=k/(2c), тобто для визначення оптимального керування u необхідно знайти .

Додамо до рівнянь (10.82) рівняння зв’язку (10.81) і запишемо систему в зображеннях за Лапласом:

    (10.83)

Виключивши з цієї системи і u , отримаємо:

Характеристичне рівняння має вигляд:

   (10.84)

Таке саме характеристичне рівняння отримаємо і при розв’язку системи (10.83) відносно .

Поліном (10.84) можна розкласти на два із симетричним розташуванням коренів у правій і лівій півплощинах. Оскільки система передбачається стійкою, то враховуємо тільки ліві корені s1 і s2. Тоді розв’язок для і для у буде:

Диференціюємо останнє рівняння:

Тоді можна записати систему:

Із останніх двох рівнянь знаходимо  як функції координат (ці функції є лінійними) і підставивши їх до першого рівняння, отримуємо лінійну залежність координати від координат :

    (10.85)

Тоді оптимальне керування має вигляд:

  (10.86)

Відповідна передавальна функція керуючого пристрою буде:

 (10.87)

Таким чином, квадратичному критерію оптимальності вигляду (10.9) відповідає лінійний оптимальний закон керування (10.86), для здійснення якого необхідно мати зворотні зв’язки за всіма змінними стану системи. При цьому замкнута система залишається лінійною (рис. 10.16). Це можливе тільки за невеликих відхиленнях координат системи від положення рівноваги. Саме тому метод синтезу регулятора за квадратичним критерієм іноді називають оптимальною стабілізацією.

Зазначимо також, що функціонали, відмінні від квадратичних, обумовлюють нелінійні закони керування.

Визначити коефіцієнти b1 і b2 можна так. Оскільки характеристичне рівняння замкнутої системи є рівнянням другого порядку і має корені s1 і s2 , то його можна подати у вигляді:

     (10.88)

Тут s1 і s2 корені характеристичного рівняння об’єкта (10.80) з урахуванням закону оптимального керування u=k/(2c).

З іншого боку, розв’язавши разом рівняння об’єкта (10.80) і регулятора (10.86), отримаємо:

Тоді характеристичне рівняння матиме вигляд:

   (10.89)

Дорівнюємо коефіцієнти при однакових степенях у рівняннях (10.88) і (10.89) і отримуємо:

Звідси знаходимо:

Визначивши з (10.84) корені s1 і s2 , можна знайти числові значення коефіцієнтів b1 і b2.

Аналогічно можна розв’язувати задачу і для об’єктів більш високих порядків, але обчислення стають більш громіздкими.

Методи аналітичного конструювання регуляторів з розповсюдженням  на різні випадки обмежень останнім часом суттєво розширені. Розв’язок загальних задач АКР лінійних об’єктів доведено до рівнянь для визначення коефіцієнтів оптимальних керувань. Більш глибоко проблему аналітичного конструювання регуляторів розглядають у спеціальному курсі “Системи оптимального керування”.

Запитання для самоперевірки

  1.  Яка система керування називається оптимальною?
  2.  На які типи можна розділити обмеження координат і керувань?
  3.  Що таке критерій оптимальності? Назвіть основні типи критеріїв оптимальності.
  4.  Наведіть класифікацію задач оптимізації.
  5.  Які задачі називаються задачами динамічної оптимізації?
  6.  Назвіть класичні методи варіаційного числення.
  7.  Наведіть рівняння Ейлера і рівняння Ейлера-Пуассона. Поясніть їх суть.
  8.   Наведіть теорему Лежандра.
  9.  Наведіть рівняння Ейлера-Лагранжа.
  10.   Чим визначається кількість множників Лагранжа, що входять до функції Лагранжа?
  11.  У чому полягає перевага сучасних методів варіаційного числення порівняно з класичними методами?
  12.   Поясніть суть методу динамічного програмування.
  13.   Який принцип лежить у основі методу динамічного програмування?
  14.   Наведіть систему рівнянь Беллмана для системи першого порядку з однією керуючою дією.
  15.   Сформулюйте принцип максимуму Понтрягіна у загальному випадку.
  16.   Що таке функція Гамільтона?
  17.   Наведіть математичний запис принципу максимуму.
  18.   У чому полягає фізичний зміст оптимального керування?
  19.   У якій послідовності розв’язують задачу про максимальну швидкодію за принципом максимуму Понтрягіна?
  20.   Як визначаються моменти перемикання керувань у разі замкнутої системи? Розімкнутої системи?
  21.   У чому полягає основний недолік принципу максимуму?
  22.   Сформулюйте теорему про n-інтервалів.
  23.  Що таке аналітичне конструювання регуляторів?


11 АДАПТИВНІ СИСТЕМИ АВТОМАТИЧНОГО КЕРУВАННЯ

11.1 Уявлення про адаптивні системи

Під час проектування автоматичних систем розрахунок їх параметрів виконують за припущеннями, що статичні та динамічні характеристики об’єкта керування й усіх елементів системи відомі й не змінюються протягом експлуатації та при змінюванні зовнішніх умов. Однак характеристики об’єкта і деяких елементів системи бувають відомі лише приблизно, змінюються через фізичне старіння і, крім того, залежать від зовнішніх умов. Завдяки запасам стійкості система керування буде задовільно працювати й у тому разі, коли практичні характеристики об’єкта трохи відрізняються від розрахункових. Однак у деяких випадках діапазон змінювання статичних і динамічних характеристик настільки великий, що керування об’єктом за допомогою найпростішої системи з постійними параметрами виявляється або незадовільним, або зовсім неможливим (утрата стійкості). У таких випадках можна застосувати систему керування зі змінними властивостями.

Процес змінювання властивостей системи, що дозволяє їй досягнути найкращого або, у крайньому разі, задовільного функціонування за умов, що змінюються, називається адаптацією. Системи, що здійснюють процес адаптації, називаються адаптивними. Отже, адаптивна САК – це система, яка здатна у процесі виконання основної задачі керування за рахунок змінювання параметрів і структури регулятора поповнювати нестачу інформації про об’єкт керування і діючи на нього зовнішні збурення і тим самим поліпшувати якість свого функціонування.

Пристрій, що реалізує алгоритм адаптації, називається адаптером.

Особливість структури адаптивних системи полягає у тому, що вони мають додатковий контур – контур адаптації (рис. 11.1), призначений для перероблення інформації про умови роботи, що змінюються, і подальшого впливу на регулятор основного контуру керування. Адаптер у загальному випадку дістає інформацію про вхідну дію х, збурення f, вихідну величину у і діє на керуючий пристрій основного контуру. Отже, для контуру адаптації об’єктом керування є вся основна САК.

Слід зазначити, що адаптивні системи давно існують у природі. Властивість адаптації чітко виявляється, наприклад, у тому, що живі організми здатні утримувати свої координати (наприклад, температуру) в припустимих фізіологічних межах при значних змінах умов, у яких існує організм.

Характерною ознакою адаптивних систем є відсутність повної апріорної (такої, що відома наперед) інформації про об’єкт керування, зовнішні збурення і граничні умови, тобто адаптивній системі притаманна невизначеність. Функціонування системи спрямоване на розкриття цієї невизначеності, тобто знаходження такого стану, при якому задовольняється певний критерій.

Розкриття невизначеності адаптивних систем забезпечується завдяки:

  •  надмірності (складності) системи, яка виявляється у багатоступеневості, багатоконтурності й т.д.;
  •  логічності її дії, подібно до логічного мислення людини;
  •  прогнозуванню стану системи і аналізу інформації, що накопичується, з метою самонавчання.

Оптимальне функціонування системи може розраховуватись на підставі аналізу інформації про її стан. Такі системи називаються аналітичними. Якщо оптимальний режим роботи визначається у результаті пошуку умов екстремуму критерію ефективності, то системи називаються пошуковими. У цьому випадку система ніби ставить серії експериментів і отримує з них дані, необхідні для поліпшення своєї якості.

Змінювання стану системи можна здійснювати за рахунок зміни керуючих впливів, параметрів настроювання і структури системи. Ці зміни називаються контрольованими.

Залежно від обсягу цих змін адаптивні системи розділяються на:

- екстремальні, в яких можна здійснювати змінювання лише керуючих впливів;

- самоналагоджувані, в яких, крім того, змінюються параметри системи;

- самоорганізовні, в яких, крім керуючих впливів і параметрів, змінюється ще й структура системи;

- навчанні, в яких до того ж, може змінюватись алгоритм роботи, а у разі самонавчання – і критерій ефективності.

За способом здійснювання контрольованих змін адаптивні системи розділяються на:

- пасивні, в яких зміни здійснюються за наперед розробленою програмою, наприклад, оброблення початкової інформації (висота, швидкість, атмосферні умови та ін.) у системі керування автопілотом;

- активні, в яких контрольовані зміни наперед не визначені, а диктуються ситуацією, що склалася.

Зазначимо також, що адаптивні системи можуть працювати за замкнутим і розімкнутим циклами: у першому випадку виконується аналіз контрольованих змін, у другому – ні.

Природно, що найдосконалішими є аналітичні активні замкнуті навчанні системи.

11.2 Екстремальні системи керування

Історично першими адаптивними системами були системи екстремального керування (СЕК). Початок теорії екстремальних систем було покладено російськими вченими В.В. Козакевичем і Ю.С. Хлебцевичем 1948 року.

Системою екстремального керування називається система, в якій автоматично відшукується та підтримується режим роботи, що характеризується максимально (мінімально) можливим значенням показника якості. Цей показник називається також показником екстремуму або цільовою функцією. У загальному випадку в процесі екстремального керування визначається екстремум статичної характеристики нелінійного нестаціонарного інерційного об’єкта, на який діють збурення, що змінюють положення екстремуму в просторі керуючих дій.

Нехай статична характеристика об’єкта має екстремум:

   (11.1)

де І – показник екстремуму; uі – керуючі параметри.

Тоді система екстремального керування має виводити й утримувати робочу точку в глобальному екстремумі.

Нехай об’єкт має статичну характеристику  з явно вираженим екстремумом, координати якого змінюються (дрейфують) з часом. Якщо значення u=u, при якому досягається екстремум, фіксоване, тобто має місце тільки вертикальний дрейф статичної характеристики (рис. 11.2, а), або це значення змінюється за наперед заданим законом, то достатньо застосувати або систему стабілізації, або систему програмного керування.

Якщо, крім вертикального, спостерігається також горизонтальний дрейф статичної характеристики (рис. 11.2, б), що викликаний зміною зовнішніх і внутрішніх збурень за наперед невідомим законом, то згадані системи не зможуть забезпечити підтримання екстремального значення І. Саме у цьому випадку і є необхідним застосування СЕК, які організують такі зміни керуючих впливів, при яких забезпечується рух системи до екстремуму критерію та утримання її у точці екстремуму.

Прикладом об’єкта з екстремальною характеристикою може слугувати топкова установка. Статична характеристика  за каналом “витрата повітря на горіння u – температура топкових газів І” має екстремум: максимальне значення І при даній витраті палива певної якості досягається при певному значенні u=u. При u < u, має місце неповне згорання палива, при u > u, надлишок повітря знижує температуру топкових газів. При зміні або витрати, або якості палива значення u, при якому І=max, змінюється. Задача СЕК у даному випадку полягає у змінюванні подачі повітря до значень, що забезпечують найкращі умови згорання палива.

Об’єкти екстремального керування можна класифікувати за такими ознаками: кількість керуючих параметрів, кількість екстремумів характеристики об’єкта, обсяг апріорної інформації про об’єкт, інерційність об’єкта.

Якщо в об’єкті всього один керуючий параметр (m=1), то об’єкт називається однопараметричним, якщо m>1, то об’єкт – багатопараметричний.

У найпростішому випадку об’єкт екстремального керування є однопараметричним, одноекстремальним, а його статична характеристика – безперервною і безперервно диференційованою функцією. Інерційність об’єкта часто не враховують, оскільки головним у системах екстремального керування є відслідковування дрейфу екстремуму статичної характеристики об’єкта. Тому екстремальні системи часто називають статичними самоналагоджувальними системами.

Екстремальні системи можна класифікувати за такими ознаками:

- за способом формування пошукового сигналу: з безпосереднім вимірюванням похідної; із запам’ятовуванням екстремуму; крокового типу; із зовнішнім пошуковим сигналом та ін;

- за видом сигналів: безперервні й дискретні; детерміновані й стохастичні;

- за кількістю керуючих впливів: одно-, дво- і багатоканальні.

Найбільше розповсюдження отримали одноканальні СЕК. Причиною цього є відносна простота реалізації та різке поліпшення динамічних показників якості роботи системи. Розглянемо принципи дії деяких систем.

Системи екстремального керування з безпосереднім вимірюванням похідної

У цих системах необхідно вимірювати похідні dI/du або dI/dt, або у крайньому разі, знак похідної  dI/du.

Як приклад, розглянемо дизель-генератор, що працює паралельно з енергосистемою. Необхідно забезпечити таке керування цим агрегатом, щоб його коефіцієнт корисної дії був увесь час максимальним. У результаті випадкової зміни параметрів установки залежність від витрати палива q, що подається до дизеля, =f(q) нестабільна. Екстремальне значення буде за умови d/dq = 0. Тому для забезпечення екстремального керування дизель-генератором необхідно обчислити , визначити його похідну по q і так здійснювати керування, щоб ця похідна весь час дорівнювала нулю.

Функціональна схема СЕК для даного випадку наведена на рис. 11.3.

Інформація про вхідну потужність Рвх, яка пропорційна до витрат палива q, і про потужність генератора Рг  дає змогу безперервно вимірювати к.к.д установки: = Рг / Рвх. Диференціювання величин і q за часом з подальшим діленням похідних визначить величину d/dq, пропорційну до керуючої дії, яка надходить на виконавчий механізм. Останній відповідно до знаку і величини похідної d/dq змінює витрату палива. Оскільки швидкість змінювання q пропорційна величині d/dq, то такі СЕК іноді називають системами з пропорційним керуванням.

Зазначимо, що при вимірюванні похідної d/dt замість d/dq функціонування системи не зміниться, якщо об’єкт є безінерційним.

Системи екстремального керування із запам’ятовуванням екстремуму

Принцип дії цих систем ґрунтується на безперервному порівнянні поточного значення критерію ефективності з його екстремальним значенням, що зберігається у запам’ятовувальному пристрої. Функціональну схему системи, в якій реалізується метод запам’ятовування екстремуму, наведено на рис. 11.4. Вихідна величина І об’єкта керування (ОК) подається на вхід запам’ятовувального пристрою (ЗП), який фіксує лише додатні прирощення І. Для формування керуючої дії використовують різницю І–Ізп , що визначається елементом порівняння (ЕП). Статичну характеристику об’єкта й часові діаграми, що відповідають пошукам максимуму, наведено на рис. 11.5.

Припустимо, що у момент часу t1  стан об’єкта характеризується параметрами I1, u1 (рис. 11.5, а), що відповідають точці М1 (рис. 11.5, б), і екстремальний регулятор увімкнено так, що значення керуючої дії збільшується, тобто система віддаляється від точки екстремуму. Оскільки значення І зменшується, сигнал на виході запам’ятовувального пристрою не змінюється, тому абсолютна величина різниці сигналів І-Ізп на вході релейного елемента РЕ збільшується (рис. 11.5, в). У момент часу t2 ця різниця набуває значення |c|, релейний елемент перемикається, виконавчий механізм реверсується, керуюча дія u починає зменшуватися, тобто після точки М2 система починає рух у бік максимуму. При цьому значення І1, запам’ятоване в ЗП у момент часу t1, скидається і ЗП запам’ятовує значення І2.

Після досягнення максимуму (точка М3) керуюча дія u продовжує зменшуватися, внаслідок чого І також зменшується, а Ізп не змінюється. Тому абсолютна величина різниці І-Ізп збільшується і в момент t4 релейний елемент спрацьовує, виконавчий механізм реверсується і знову починається рух системи у бік максимуму. Цей процес триває безперервно, і в системі встановлюються автоколивання поблизу екстремуму регульованої величини. Амплітуда автоколивань визначається зоною нечутливості релейного елемента.

Системи екстремального керування крокового типу

Принцип дії систем цього типу оснований на тому, що через певні інтервали часу, що називаються кроками, вимірюються значення екстремального показника. Потім здійснюється їх порівняння на початку і наприкінці кожного кроку. Якщо протягом розглядуваного періоду екстремальний показник зменшується, то у системі здійснюється реверс керуючої дії. У протилежному випадку реверс не відбувається. Функціональна схема крокової системи наведена на рис. 11.6.  У даній схемі величина, пропорційна критерію І, подається на вхід блоку усереднення (БУ), який видає середнє за крок значення Ісер.і. У кінці кожного кроку це значення   подається на пристрій порівняння (ПП) і блок пам’яті (БП). З виходу ПП знімається різниця І = Ісер.і - Ісер.і-1. При І>0 напрямок обертання виконавчого механізму (ВМ) не змінюється. При І<0 перемикаючий пристрій (ПерП) подає команду на реверс ВМ. Для керування виконавчим механізмом застосовується елемент з релейною характеристикою. Крок квантування за часом визначається тактовим генератором (ГТ). За умови достатньо великого кроку змінювання керуючої дії u вимірювання критерію ефективності можна здійснювати дискретно – на початку і наприкінці даного кроку, тоді Іn=In–In-1. При цьому забезпечується достатня завадостійкість системи за відсутності блоку усереднення.

Величина кроку квантування за часом обмежується тим, що при великому кроку у системі можуть з’явитися помилки через наявність дрейфу екстремальної характеристики. З іншого боку, при занадто малому кроці  на правільність роботи системи можуть впливати високочастотні перешкоди.

У кроковій системі пошук екстремуму здійснюється дослідженням впливу керуючої дії u на критерій ефективності І. Разом з тим, визначення положення системи відносно екстремальної точки можна здійснити і за допомогою спеціального пошукового сигналу.

Системи екстремального керування із зовнішнім генератором пошукових сигналів

Функціональна схема системи для даного випадку наведена на рис. 11.7.

Подамо на вхід системи за допомогою генератора пошукових сигналів (ГПС) синусоїдальний сигнал un з невеликою амплітудою unmax і постійною частотою 0. Якщо система знаходиться на лівій частині екстремальної характеристики (рис. 11.8), то фази коливань,

що викликані пошуковим сигналом, на вході й виході об’єкта (1 і 1) співпадають, а якщо на правій – то ці коливання (3 і 3) знаходяться у протифазі. В екстремальній точці маємо на виході об’єкта сигнал (2) подвійної частоти.

Якщо на виході об’єкта поставити фільтр, що перепускає тільки частоту пошукового сигналу un, то, порівнюючи за допомогою фазового детектора (ФД) фазу вихідної гармоніки з вхідною, можна дізнатися, на якій частині характеристики працює система і, відповідно, в якому напрямку необхідно змінювати керуючу дію u, щоб досягти екстремальної точки. Реверс виконавчого механізму (ВМ) здійснюється при зміні фази вихідних коливань за допомогою перемикаючого пристрою (ПерП). Якщо як перемикаючий пристрій використовувати трипозиційне реле, то наявність зони нечутливості дозволяє при достатньо малих відхиленнях системи від точки екстремуму не вмикати виконавчий механізм. Ця обставина використовується при застосуванні низькочастотного пошукового сигналу, для якого практично неможливо побудувати ефективні фільтри.

Зазначимо, що амплітуда коливань вихідного пошукового сигналу пропорційна величині похідної , що дозволяє побудувати екстремальні системи з пропорційним керуванням.

Під час розглядання принципу дії даної системи не враховували інерційність об’єкта керування, яка обумовлює зсув фаз між вхідним і вихідним пошуковим сигналом (якщо цей зсув складатиме 180, система втратить стійкість). Зменшити вплив цього явища можна або за рахунок доповнення системи фазозсувальним пристроєм, або за рахунок зменшення частоти пошукового сигналу. Зазначимо також, що для ефективної фільтрації частота пошукового сигналу має бути значно вищою за частоту вхідних сигналів.

Системи з пошуковим сигналом мають велику завадостійкість порівняно із системами, що вимірюють похідну, оскільки не потребують диференціальних ланок, які збільшують вплив перешкод. Крім того, такі системи можуть застосовуватись при різкому дрейфі екстремальної характеристики, оскільки при цьому в них, на відміну від систем крокового типу, не з’являються помилкові сигнали.

Диференціальні системи екстремального керування

Дані системи працюють за розімкнутим циклом, і тому іноді їх називають безпошуковими. Керуюча дія у таких системах формується за допомогою аналізу різниці двох величин. Це й обумовило їх назву.

Функціональна схема диференціальної СЕК наведена на рис. 11.9, а). Керуюча дія u і збурення f прикладені не тільки до об’єкта керування, але й до двох його моделей М. Крім того, на ці моделі діють однакові й постійні за модулем, але різні за знаком додаткові керуючі дії u, у результаті чого статичні екстремальні характеристики моделей I1(u) і I2(u) зміщуються у різні боки відносно характеристики об’єкта I(u) (рис. 11.9, б).

Нехай на вхід обох моделей і об’єкта подається керування u1. Тоді вихідна величина першої моделі дорівнює І1, другої – І2, а різниця І=І2 1>0. Можна показати, що у разі параболічної залежності І(u) різниця І буде пропорційною відстані до екстремальної точки u. У точці екстремуму u ця різниця дорівнює нулю, а надалі при переході на праву частину характеристики вона змінює свій знак. Таким чином, формуючи змінювання керуючої дії u пропорційно різниці І (або відповідно до його знаку), можна забезпечити роботу системи в екстремальній точці. Оскільки на модель діють ті самі збурення, що і на об’єкт, дрейф характеристики об’єкта не змінює відносного розташування вихідних характеристик моделей і характеристики об’єкта, і не порушує працездатності системи.

Суттєвим обмежуючим моментом застосування диференціальних СЕК є необхідність апріорного знання моделі об’єкта, яка невідома для широкого класу об’єктів.

У разі, якщо функція I(u) має мінімум, то шляхом віднімання її від постійної величини А отримаємо криву, яка має максимум. Завдяки цьому екстремальний регулятор, призначений для пошуку максимуму функції I1(u), можна використовувати і для пошуку мінімуму функції I(u) = А - I1(u).

Розглянуті методи пошуку екстремуму стосуються одноканальних систем. Якщо показник екстремуму є функцією кількох керуючих параметрів І(u1, u2, …, um) (багатоканальні системи), то необхідною умовою досягнення екстремуму є рівність нулю частинних похідних показника якості зі всіх керуючих параметрів:

  (11.2)

Методи пошуку екстремуму для таких систем поділяються на два види:

- детерміновані: метод градієнта, метод найшвидшого спуску, метод Гаусса-Зейделя;

- випадкові: метод випадкових сліпих пошуків, статистичного градієнта та статистичного найшвидшого спуску.

Метод градієнта 

Градієнтом скалярної функції І(u1, u2, …, um) називається вектор з координатами  тобто

 (11.3)

де k1, k2, …, km – одиничні вектори, напрямки яких збігаються з напрямками осей u1, u2, …, um.

Цей вектор спрямований у бік найбільшого зростання функції І. У точці екстремуму grad I = 0.

Метод градієнта реалізується на основі дискретного або безперервного принципу роботи контуру адаптації.

При безперервному принципі роботи метод градієнта полягає у тому, що швидкості змінювання параметрів ui беруть пропорційними відповідним компонентам миттєвого значення градієнта, тобто

   (11.4)

де сі – коефіцієнт пропорційності; сі > 0 для випадку екстремуму-мінімуму; сі