21698

Применение нейросетей для управления печью

Лекция

Информатика, кибернетика и программирование

В таких случаях целью управления является возможно более быстрое и плавное достижение требуемой температуры с последующим удерживанием её значения в заданных пределах. Система управления печью разработана японской фирмой Omron Inc. Структурная схема системы управления печью В состав системы управления входит модуль датчиков плата параллельного интерфейса вводавывода компьютер NEC PC9801F и исполнительное устройство.

Русский

2013-08-03

145 KB

8 чел.

етоды искусственного интеллекта

Лекция № 15

МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

ЛЕКЦИЯ № 15

Применение нейросетей для управления печью

Во многих промышленных процессах важным фактором является температура. Слишком низкая или слишком высокая температура приводит к снижению качества конечного продукта. В таких случаях целью управления является, возможно, более быстрое и плавное достижение требуемой температуры с последующим удерживанием её значения в заданных пределах. Для изучения возможности достижения этой цели г-ном Омату и командой его единомышленников проводились эксперименты с управлением печью.

Система управления печью разработана японской фирмой Omron Inc. Система представляет собой трёхканальный медный цилиндр. Печь является миниатюрной моделью устройств, применяемых в промышленности для формовки пластмассовых изделий. В такой печи требуется контролировать температуры от 100 °C до 300 °C в трёх каналах.

Рисунок. Структурная схема системы управления печью

В состав системы управления входит модуль датчиков, плата параллельного интерфейса ввода-вывода, компьютер NEC PC-9801F и исполнительное устройство. Мощность нагревателей — 280 Вт для меньшего цилиндра („канал 1“) и 1,2 кВт для двух других цилиндров („канал 2“ и „канал 3“). И хотя каждым каналом можно управлять независимо, теплопередача между ними существенно затрудняет управление.

Модуль датчиков включает термоэлемент для измерения температуры на выходе цилиндров. Температуры от 0 до 120 °C могут измеряться и преобразовываться в цифровую форму с помощью 12-разрядного АЦП с разрешающей способностью 0,2 °C. Плата интерфейса ввода-вывода используется для передачи цифровых сигналов между компьютером и внешними устройствами; эта плата вставляется в расширенное гнездо ввода-вывода компьютера. Для включения и выключения нагревателей по управляющим сигналам используются твёрдотельные тиристоры Omron G3N-220В. Эти сигналы модулированы по ширине импульса, т.е. используется широтно-импульсная модуляция — ШИМ. Когда управляющий сигнал имеет номинальную величину (100 %), нагреватель включается в каждом интервале дискретизации на 6 секунд непрерывной работы. Основная управляющая программа написана в Си, а подпрограммы управления нагревателями — на Ассемблере.

Схема автономного обучения

Для формирования инверсной и прямой модели каждого из каналов печи на основе архитектуры обобщённого обучения было выбрано несколько нейросетевых моделей, каждая из которых имела своё число элементов входных векторов и скрытых нейронов. Так как обучение нейронных сетей осуществлялось автономно, требовался выбор обучающих образцов вход-выход.

Во многих предшествующих разработках для построения нейросетевых инверсных и прямых моделей объекта управления использовались случайные входные сигналы. В этом случае сходимость достигалась только после проведения нескольких тысяч циклов оперативного обучения. Процесс, который исследовал г-н Омату с коллегами, является по своей природе медленным, устойчивым и разомкнутым. Поэтому использовалась подача плавно нарастающих входных сигналов в диапазоне между предельно допустимыми величинами для данных исполнительных устройств. Характеристики вход-выход для каждого канала печи приведены на рисунке.

И этот рисунок предельно похож на тот, что мы рисовали, когда изучали водяную ванну.

{рис. 5.5.3, с. 232}

Обучение нейросетевых моделей происходит по следующей схеме. Для каждого канала выбираются обучающие образцы вход-выход через равные интервалы по всей характеристике объекта управления. Модели нейроконтроллеров каждого из каналов печи обучаются инверсной динамике с использованием:

— выходных сигналов в качестве входных образцов

— и входных сигналов соответствующих каналов в качестве целевых образцов.

Оптимальное количество обучающих образцов, скрытых нейронов и элементов входных векторов для моделей контроллера и нейроэмулятора выбираются экспериментальным путём. К сожалению, надёжных алгоритмов определения этих параметров ещё не существует. Чтобы избежать необходимости обучать большое число нейросетевых моделей, для каждого из каналов первоначально было выбрано четыре модели, имеющие 5, 10, 15 и 20 скрытых нейронов. Затем выполнялось обучение нейросетевых моделей с использованием нескольких компьютеров. После этого сети корректировались в соответствии с лучшим количеством скрытых нейронов. Количество обучающих образцов также выбиралось методом проб и ошибок. В таких случаях сначала обычно устанавливается большая величина скорости обучения  (около 0,01). Если же возникают осцилляции, то скорость снижается до одной десятой от предыдущей величины. Мгновенные величины  и  выбираются равными 0,8 и –0,15 соответственно. Для каждой из моделей обучение прекращается, если сходимость не уменьшается более чем на 0,0001 % за 1000 итераций.

Так как нейронные сети имеют высокую степень нелинейности, сложно определить аналитически, какая модель действительно обучена инверсной и прямой динамике объекта. Имеется простой и надёжный метод оперативного испытания каждой из моделей. Для нейросетевых моделей контроллера испытания проводятся путём настройки этой модели на непосредственное управление процессом. Модели нейроэмулятора испытываются путём применения плавно нарастающего сигнала к каждому из процессов и к соответствующим эмуляторам. Затем производится сравнение выходных процессов.

Было обнаружено, что процесс обучения нейронных сетей зависит от количества скрытых нейронов, элементов входного вектора и обучающих образцов. Лучшим для каждого из каналов оказался нейроконтроллер, содержащий 10 скрытых нейронов и 3 элемента входного вектора:

— текущая выходная величина процесса

— и две задержанных величины  и .

Лучшим нейроэмулятором оказался вариант, содержащий 12 скрытых нейронов и также три элемента входного вектора. Установлено, что схема выбора десяти обучающих образцов, представленная на нашем рисунке, является подходящей для достижения хорошей сходимости при обучении нейросетевых моделей.

Анализ экспериментальных данных

Итак, для проверки надёжности и адаптивных способностей различных систем управления, построенных на основе нейросетей Омату провёл несколько экспериментов. Для сравнения нейросетевых систем управления с иными, для той же печи были построены две другие системы управления: самонастраивающаяся многомерная система управления и система на основе обычных ПИД-регуляторов. Принцип работы самонастраивающейся многомерной системы управления основан на алгоритме Кларка и Гаутропа. А принцип работы ПИД-регулятора — на ускоренном дискретном ПИД-алгоритме.

Для реализации самонастраивающейся схемы управления требуется построение априорной математической модели объекта управления. Оценки параметров модели печи рассчитываются оперативно. Для ускорения сходимости оценок параметров в начале оценивания используется последовательность, представляющая собой псевдослучайный двоичный сигнал с максимальным периодом. Настройка ПИД-регулятора сначала выполняется грубо, по методу Такахаши, а затем для улучшения характеристик выполняется точная настройка.

Эксперименты проводились с целью определения способности этих алгоритмов управления к отслеживанию уставки. Каждый из экспериментов проводился для 480 моментов дискретного времени, с интервалом дискретизации 10 секунд.

На следующих рисунках показаны характеристики исследуемых схем управления, связанные с изменениями уставки. К характеристикам здесь относятся выходные координаты и соответствующие им входные управляющие сигналы для всех трёх каналов печи.

{рис. 5.5.4-с, с. 239}

{рис. 5.5.4-б, с. 238}

{рис. 5.5.4-а, с. 237}

Можно видеть, что при использовании ПИД-регулятора заданная уставка достигалась медленнее, чем для других алгоритмов управления, и что при этом допускались выбросы температуры. Видно также, что нейроконтроллеры показали достаточно хорошие характеристики даже без оперативного обучения. Это означает, что нейроконтроллеры каждого канала печи были обучены адекватной инверсной модели соответствующего канала. При оперативном обучении, когда на каждом отсчёте выполнялась точная настройка, нейроконтроллер демонстрировал ещё лучшие характеристики. Самонастраивающийся контроллер выполнял отслеживание уставки не хуже, чем нейроконтроллер, однако выбор задаваемых пользователем полиномиальных коэффициентов для этого контроллера занимал достаточно много времени. Поэтому нейроконтроллер, после того, как он обучен, значительно проще в реализации, так как для него не требуется настройка или выбор задаваемых пользователем параметров.

Вторая серия экспериментов была выполнена с целью исследования работы контроллеров в условиях неизвестных возмущений на нагрузке. Чтобы обеспечить идентичные условия для всех трёх контроллеров, на выход каждого канала в интервале времени  вносились искусственные возмущения величиной в +5 °C, а в диапазоне  — величиной в –5 °C.

Характеристики всех трёх систем управления в этих условиях показаны на следующих картинках.

{рис. 5.5.5-с, с. 241}

{рис. 5.5.5-б, с. 240}

{рис. 5.5.5-а, с. 240}

Можно заметить, что нейроконтроллер и самонастраивающийся контроллер показали одинаково хорошие характеристики, обеспечивая быстрое устранение последствий положительных возмущений. Хорошие характеристики нейроконтроллера обеспечивались его способностью к обобщению, а также возможностям быстрой адаптации к изменениям входных координат. Самонастраивающийся контроллер также успешно работал в этих условиях, так как был оснащён системой прогнозирования на d число шагов. В то же время ПИД-регулятор показал худшие характеристики. При отрицательных возмущениях характеристики нейроконтроллера и самонастраивающегося контроллера ухудшались, так как допустимыми были только положительные управляющие входные воздействия. Однако можно увидеть, что восстановление для этих контроллеров выполнялось значительно быстрее, чем для ПИД-регуляторов.

Динамика поведения и параметры многих систем управления нередко имеют тенденцию к непредсказуемому изменению в ходе работы. С целью изучения устойчивости работы рассматриваемых систем управления, были проведены эксперименты, в которых для каждого канала печи после каждого 120-го отсчёта дискретного времени выполнялось умножение величины  на 0,03. Таким образом имитировалось изменение параметров процесса. Можно убедиться, что такие изменения динамики достаточно существенны. И хотя трудно себе представить реальный объект, параметры которого изменялись бы столь резко; для экспериментального сравнения контроллеров по их устойчивости и способностям к адаптации такое преувеличение допустимо.

Характеристики контроллеров в новых условиях работы приведены на следующих рисунках.

{рис. 5.5.6-с, с. 243}

{рис. 5.5.6-б, с. 242}

{рис. 5.5.6-а, с. 242}

Видно, что работа ПИД-регулятора при изменении параметров системы резко ухудшилась. Несмотря на интегрирующее действие, на всех каналах наблюдалось смещение, возникавшее из-за насыщения в канале управления.

Самонастраивающиеся многомерные контроллеры адаптировались к изменениям параметров объекта управления значительно лучше, чем обычные ПИД-регуляторы, и именно за счёт своей способности к самонастройке. Нейросетевые контроллеры также показали в этих условиях высокую устойчивость, благодаря развитым возможностям обобщения, связанным с оперативным адаптивным обучением.

Результаты всех этих экспериментов свидетельствуют, что процессы на выходе нейроконтроллера были очень гладкими, даже в условиях существенных возмущений на нагрузке. В то же время на выходах самонастраивающегося контроллера и ПИД-регулятора наблюдались нежелательные флуктации, что в реальных условиях может привести к сокращению срока службы исполнительного устройства.

Управляющие сигналы самонастраивающегося контроллера являются сильно осциллирующими. Это особенно относится к первому каналу, так как он больше всех зашумлён и имеет меньшую временную задержку. Колебания сигналов связаны с тем, что самонастраивающееся управление направлено на минимизацию дисперсии выходной величины объекта управления. Если объект управления сильно зашумлён, то дисперсия возрастает, что приводит к колебаниям управляющих сигналов.

В отличие от самонастраивающегося контроллера, нейроконтроллер обучается псевдоинверсной динамике объекта управления. Возможности нелинейного отображения, обеспечиваемые нейронами скрытых слоёв сети, позволяют сгладить выходные величины нейроконтроллера и тем самым продлить срок службы исполнительной системы.

Мы рассмотрели четыре примера применения нейронных сетей в системах управления. В качестве первого примера рассмотрели применение нейронных сетей для управления температурой водяной ванны. Схему нейронного управления мы сравнили с тремя другими традиционными схемами: управлением на основе нечёткой логики, обобщённым прогнозирующим управлением и ПИД-регулированием. Схема нейронного управления продемонстрировала высокую устойчивость и другие заметные преимущества над остальными схемами.

Г-н Омату и его товарищи подтвердили результаты сравнения четырёх систем управления, полученные в первом примере, при исследовании системы управления печью со многими входами и выходами.

В системе управления перевёрнутым маятником нейронная сеть используется для улучшения характеристик линейного оптимального контроллера. Очевидно, что линейный оптимальный контроллер не может эффективно работать в условиях проявления нелинейных характеристик, таких как трение и скольжение. В системе управления перевёрнутым маятником нейроконтроллер использовался в качестве компенсатора таких нелинейностей.

И ещё в одном примере нейронная сеть использовалась для настройки параметров ПИД-регулятора. Такой контроллер был назван ПИД-нейроконтроллером с самонастройкой.

PAGE  5

Томский политехнический университет,

Дмитрий Афонин, июнь 2006 г.


 

А также другие работы, которые могут Вас заинтересовать

23209. Основні рівні буття 38.5 KB
  Основні рівні буття. Буття належить до числа тих системотворчих понять які покладені в основи філософії багатьма мислителями як минулого так і сучасного. Перший аспект проблеми буття: а Що існує Світ. Суть проблеми полягає в існуванні суперечливої єдності неминучого вічного і минулого змінного буття окремих речей ста нів людських та інших істот.
23210. Особливості розвитку та функціонування системи філософських категорії 47.5 KB
  Філософські категорії це найзагальнішігранично широкі поняття що виражають універсальні характеристики та відношення матеріального й духовного світу в які і через які здійснюється філософське мислення і які служать вихідними принципами пізнання і духовнопрактичного перетворення світу. У процесі пізнання категорії виконують вимоги логіки. Категорії матерія форма причина і ціль які ним були теж сформульовані чомусь не увійшли до цієї системи.
23213. Специфіка філософської думки в період Середньовіччя 48.5 KB
  До них належать: Афанасій Олександрійський Василь Великий Григорій Нісський Григорій Назіанзін Амвросій Медіоланський Августин Блаженний Іоанн Дамаскін та ін.Одним із найбільш яскравих представників патрістики був єпископ із ГіппонаПівнічна Африка Августин якого католицькі богослови нарекли ще й ім'ям Блаженний. Августин вважав що філософія поза богослов'ям ніщо. Воюючи з язичеством як він називав античну філософію Августин намагався розгорнути християнську теологічну систему на основі неоплатонізму.
23214. Особливості філософії епохи Відродження 33 KB
  Особливості філософії епохи Відродження Філософія Відродження охоплює період відXIV до початкуXVII ст. Відродженняперехідна епоха і цим значною мірою пояснюється чимало її специфічних рис і насамперед та завдяки якій майже синонімічною назвою для епохи стає словогуманізм. Для епохи Відродження характерним було швидке зростання кількості людей розумової праці. Звичайно мислителі Відродження були далекі від думки ігнорувати Святе письмо віру в Бога але якщо у схоластів центром уваги був Бог то у гуманістів епохи Відродження Бог і...
23215. Філософія Нового Часу: загальна характеристика 46 KB
  Проте свою методологію він будує на принципах раціоналістичної дедукції а експеримент визнає лише як передумову пізнання що має підпорядковуватись раціональноматематичному мисленню. У першому йдеться про вихідний пункт наукового пізнання визначення принципів або начал. Третє правило вимагає дотримуватись певного порядку мислення який полягає в тому щоб починати з найпростіших і доступних для пізнання предметів і поступово сходити до складніших і важчих. Декарт вважає що людина від народження має певні вроджені ідеї які й становлять...
23216. Класична німецька філософія 36.5 KB
  Попершевсіх представників німецької класичної філософії об'єднує розуміння ролі філософії в історії людства і в розвитку світової культури. Подруге представники німецької класичної думки надали філософії вигляду широко розробленої та диференційованої спеціальної системи дисциплін ідей понять та категорій. Враховуючи ці основні риси німецької класичної філософії можна виділити також і основні проблеми дослідження яких перебуває в центрі уваги цього періоду розвитку світової філософії: проблема науковості філософії онтології...
23217. Своєрідність філософії українського духу 30.5 KB
  Філософія Укр.1 українська філософія створює оригінальне вчення про духовність. 3українська філософія створює оригінальну ідею сродної праці. Українська філософія класична тим що сама має оригінальний екзистенціональний вимір і включає в себе філософію віри надії любові які заключаються в свободі.