21698

Применение нейросетей для управления печью

Лекция

Информатика, кибернетика и программирование

В таких случаях целью управления является возможно более быстрое и плавное достижение требуемой температуры с последующим удерживанием её значения в заданных пределах. Система управления печью разработана японской фирмой Omron Inc. Структурная схема системы управления печью В состав системы управления входит модуль датчиков плата параллельного интерфейса вводавывода компьютер NEC PC9801F и исполнительное устройство.

Русский

2013-08-03

145 KB

7 чел.

етоды искусственного интеллекта

Лекция № 15

МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

ЛЕКЦИЯ № 15

Применение нейросетей для управления печью

Во многих промышленных процессах важным фактором является температура. Слишком низкая или слишком высокая температура приводит к снижению качества конечного продукта. В таких случаях целью управления является, возможно, более быстрое и плавное достижение требуемой температуры с последующим удерживанием её значения в заданных пределах. Для изучения возможности достижения этой цели г-ном Омату и командой его единомышленников проводились эксперименты с управлением печью.

Система управления печью разработана японской фирмой Omron Inc. Система представляет собой трёхканальный медный цилиндр. Печь является миниатюрной моделью устройств, применяемых в промышленности для формовки пластмассовых изделий. В такой печи требуется контролировать температуры от 100 °C до 300 °C в трёх каналах.

Рисунок. Структурная схема системы управления печью

В состав системы управления входит модуль датчиков, плата параллельного интерфейса ввода-вывода, компьютер NEC PC-9801F и исполнительное устройство. Мощность нагревателей — 280 Вт для меньшего цилиндра („канал 1“) и 1,2 кВт для двух других цилиндров („канал 2“ и „канал 3“). И хотя каждым каналом можно управлять независимо, теплопередача между ними существенно затрудняет управление.

Модуль датчиков включает термоэлемент для измерения температуры на выходе цилиндров. Температуры от 0 до 120 °C могут измеряться и преобразовываться в цифровую форму с помощью 12-разрядного АЦП с разрешающей способностью 0,2 °C. Плата интерфейса ввода-вывода используется для передачи цифровых сигналов между компьютером и внешними устройствами; эта плата вставляется в расширенное гнездо ввода-вывода компьютера. Для включения и выключения нагревателей по управляющим сигналам используются твёрдотельные тиристоры Omron G3N-220В. Эти сигналы модулированы по ширине импульса, т.е. используется широтно-импульсная модуляция — ШИМ. Когда управляющий сигнал имеет номинальную величину (100 %), нагреватель включается в каждом интервале дискретизации на 6 секунд непрерывной работы. Основная управляющая программа написана в Си, а подпрограммы управления нагревателями — на Ассемблере.

Схема автономного обучения

Для формирования инверсной и прямой модели каждого из каналов печи на основе архитектуры обобщённого обучения было выбрано несколько нейросетевых моделей, каждая из которых имела своё число элементов входных векторов и скрытых нейронов. Так как обучение нейронных сетей осуществлялось автономно, требовался выбор обучающих образцов вход-выход.

Во многих предшествующих разработках для построения нейросетевых инверсных и прямых моделей объекта управления использовались случайные входные сигналы. В этом случае сходимость достигалась только после проведения нескольких тысяч циклов оперативного обучения. Процесс, который исследовал г-н Омату с коллегами, является по своей природе медленным, устойчивым и разомкнутым. Поэтому использовалась подача плавно нарастающих входных сигналов в диапазоне между предельно допустимыми величинами для данных исполнительных устройств. Характеристики вход-выход для каждого канала печи приведены на рисунке.

И этот рисунок предельно похож на тот, что мы рисовали, когда изучали водяную ванну.

{рис. 5.5.3, с. 232}

Обучение нейросетевых моделей происходит по следующей схеме. Для каждого канала выбираются обучающие образцы вход-выход через равные интервалы по всей характеристике объекта управления. Модели нейроконтроллеров каждого из каналов печи обучаются инверсной динамике с использованием:

— выходных сигналов в качестве входных образцов

— и входных сигналов соответствующих каналов в качестве целевых образцов.

Оптимальное количество обучающих образцов, скрытых нейронов и элементов входных векторов для моделей контроллера и нейроэмулятора выбираются экспериментальным путём. К сожалению, надёжных алгоритмов определения этих параметров ещё не существует. Чтобы избежать необходимости обучать большое число нейросетевых моделей, для каждого из каналов первоначально было выбрано четыре модели, имеющие 5, 10, 15 и 20 скрытых нейронов. Затем выполнялось обучение нейросетевых моделей с использованием нескольких компьютеров. После этого сети корректировались в соответствии с лучшим количеством скрытых нейронов. Количество обучающих образцов также выбиралось методом проб и ошибок. В таких случаях сначала обычно устанавливается большая величина скорости обучения  (около 0,01). Если же возникают осцилляции, то скорость снижается до одной десятой от предыдущей величины. Мгновенные величины  и  выбираются равными 0,8 и –0,15 соответственно. Для каждой из моделей обучение прекращается, если сходимость не уменьшается более чем на 0,0001 % за 1000 итераций.

Так как нейронные сети имеют высокую степень нелинейности, сложно определить аналитически, какая модель действительно обучена инверсной и прямой динамике объекта. Имеется простой и надёжный метод оперативного испытания каждой из моделей. Для нейросетевых моделей контроллера испытания проводятся путём настройки этой модели на непосредственное управление процессом. Модели нейроэмулятора испытываются путём применения плавно нарастающего сигнала к каждому из процессов и к соответствующим эмуляторам. Затем производится сравнение выходных процессов.

Было обнаружено, что процесс обучения нейронных сетей зависит от количества скрытых нейронов, элементов входного вектора и обучающих образцов. Лучшим для каждого из каналов оказался нейроконтроллер, содержащий 10 скрытых нейронов и 3 элемента входного вектора:

— текущая выходная величина процесса

— и две задержанных величины  и .

Лучшим нейроэмулятором оказался вариант, содержащий 12 скрытых нейронов и также три элемента входного вектора. Установлено, что схема выбора десяти обучающих образцов, представленная на нашем рисунке, является подходящей для достижения хорошей сходимости при обучении нейросетевых моделей.

Анализ экспериментальных данных

Итак, для проверки надёжности и адаптивных способностей различных систем управления, построенных на основе нейросетей Омату провёл несколько экспериментов. Для сравнения нейросетевых систем управления с иными, для той же печи были построены две другие системы управления: самонастраивающаяся многомерная система управления и система на основе обычных ПИД-регуляторов. Принцип работы самонастраивающейся многомерной системы управления основан на алгоритме Кларка и Гаутропа. А принцип работы ПИД-регулятора — на ускоренном дискретном ПИД-алгоритме.

Для реализации самонастраивающейся схемы управления требуется построение априорной математической модели объекта управления. Оценки параметров модели печи рассчитываются оперативно. Для ускорения сходимости оценок параметров в начале оценивания используется последовательность, представляющая собой псевдослучайный двоичный сигнал с максимальным периодом. Настройка ПИД-регулятора сначала выполняется грубо, по методу Такахаши, а затем для улучшения характеристик выполняется точная настройка.

Эксперименты проводились с целью определения способности этих алгоритмов управления к отслеживанию уставки. Каждый из экспериментов проводился для 480 моментов дискретного времени, с интервалом дискретизации 10 секунд.

На следующих рисунках показаны характеристики исследуемых схем управления, связанные с изменениями уставки. К характеристикам здесь относятся выходные координаты и соответствующие им входные управляющие сигналы для всех трёх каналов печи.

{рис. 5.5.4-с, с. 239}

{рис. 5.5.4-б, с. 238}

{рис. 5.5.4-а, с. 237}

Можно видеть, что при использовании ПИД-регулятора заданная уставка достигалась медленнее, чем для других алгоритмов управления, и что при этом допускались выбросы температуры. Видно также, что нейроконтроллеры показали достаточно хорошие характеристики даже без оперативного обучения. Это означает, что нейроконтроллеры каждого канала печи были обучены адекватной инверсной модели соответствующего канала. При оперативном обучении, когда на каждом отсчёте выполнялась точная настройка, нейроконтроллер демонстрировал ещё лучшие характеристики. Самонастраивающийся контроллер выполнял отслеживание уставки не хуже, чем нейроконтроллер, однако выбор задаваемых пользователем полиномиальных коэффициентов для этого контроллера занимал достаточно много времени. Поэтому нейроконтроллер, после того, как он обучен, значительно проще в реализации, так как для него не требуется настройка или выбор задаваемых пользователем параметров.

Вторая серия экспериментов была выполнена с целью исследования работы контроллеров в условиях неизвестных возмущений на нагрузке. Чтобы обеспечить идентичные условия для всех трёх контроллеров, на выход каждого канала в интервале времени  вносились искусственные возмущения величиной в +5 °C, а в диапазоне  — величиной в –5 °C.

Характеристики всех трёх систем управления в этих условиях показаны на следующих картинках.

{рис. 5.5.5-с, с. 241}

{рис. 5.5.5-б, с. 240}

{рис. 5.5.5-а, с. 240}

Можно заметить, что нейроконтроллер и самонастраивающийся контроллер показали одинаково хорошие характеристики, обеспечивая быстрое устранение последствий положительных возмущений. Хорошие характеристики нейроконтроллера обеспечивались его способностью к обобщению, а также возможностям быстрой адаптации к изменениям входных координат. Самонастраивающийся контроллер также успешно работал в этих условиях, так как был оснащён системой прогнозирования на d число шагов. В то же время ПИД-регулятор показал худшие характеристики. При отрицательных возмущениях характеристики нейроконтроллера и самонастраивающегося контроллера ухудшались, так как допустимыми были только положительные управляющие входные воздействия. Однако можно увидеть, что восстановление для этих контроллеров выполнялось значительно быстрее, чем для ПИД-регуляторов.

Динамика поведения и параметры многих систем управления нередко имеют тенденцию к непредсказуемому изменению в ходе работы. С целью изучения устойчивости работы рассматриваемых систем управления, были проведены эксперименты, в которых для каждого канала печи после каждого 120-го отсчёта дискретного времени выполнялось умножение величины  на 0,03. Таким образом имитировалось изменение параметров процесса. Можно убедиться, что такие изменения динамики достаточно существенны. И хотя трудно себе представить реальный объект, параметры которого изменялись бы столь резко; для экспериментального сравнения контроллеров по их устойчивости и способностям к адаптации такое преувеличение допустимо.

Характеристики контроллеров в новых условиях работы приведены на следующих рисунках.

{рис. 5.5.6-с, с. 243}

{рис. 5.5.6-б, с. 242}

{рис. 5.5.6-а, с. 242}

Видно, что работа ПИД-регулятора при изменении параметров системы резко ухудшилась. Несмотря на интегрирующее действие, на всех каналах наблюдалось смещение, возникавшее из-за насыщения в канале управления.

Самонастраивающиеся многомерные контроллеры адаптировались к изменениям параметров объекта управления значительно лучше, чем обычные ПИД-регуляторы, и именно за счёт своей способности к самонастройке. Нейросетевые контроллеры также показали в этих условиях высокую устойчивость, благодаря развитым возможностям обобщения, связанным с оперативным адаптивным обучением.

Результаты всех этих экспериментов свидетельствуют, что процессы на выходе нейроконтроллера были очень гладкими, даже в условиях существенных возмущений на нагрузке. В то же время на выходах самонастраивающегося контроллера и ПИД-регулятора наблюдались нежелательные флуктации, что в реальных условиях может привести к сокращению срока службы исполнительного устройства.

Управляющие сигналы самонастраивающегося контроллера являются сильно осциллирующими. Это особенно относится к первому каналу, так как он больше всех зашумлён и имеет меньшую временную задержку. Колебания сигналов связаны с тем, что самонастраивающееся управление направлено на минимизацию дисперсии выходной величины объекта управления. Если объект управления сильно зашумлён, то дисперсия возрастает, что приводит к колебаниям управляющих сигналов.

В отличие от самонастраивающегося контроллера, нейроконтроллер обучается псевдоинверсной динамике объекта управления. Возможности нелинейного отображения, обеспечиваемые нейронами скрытых слоёв сети, позволяют сгладить выходные величины нейроконтроллера и тем самым продлить срок службы исполнительной системы.

Мы рассмотрели четыре примера применения нейронных сетей в системах управления. В качестве первого примера рассмотрели применение нейронных сетей для управления температурой водяной ванны. Схему нейронного управления мы сравнили с тремя другими традиционными схемами: управлением на основе нечёткой логики, обобщённым прогнозирующим управлением и ПИД-регулированием. Схема нейронного управления продемонстрировала высокую устойчивость и другие заметные преимущества над остальными схемами.

Г-н Омату и его товарищи подтвердили результаты сравнения четырёх систем управления, полученные в первом примере, при исследовании системы управления печью со многими входами и выходами.

В системе управления перевёрнутым маятником нейронная сеть используется для улучшения характеристик линейного оптимального контроллера. Очевидно, что линейный оптимальный контроллер не может эффективно работать в условиях проявления нелинейных характеристик, таких как трение и скольжение. В системе управления перевёрнутым маятником нейроконтроллер использовался в качестве компенсатора таких нелинейностей.

И ещё в одном примере нейронная сеть использовалась для настройки параметров ПИД-регулятора. Такой контроллер был назван ПИД-нейроконтроллером с самонастройкой.

PAGE  5

Томский политехнический университет,

Дмитрий Афонин, июнь 2006 г.


 

А также другие работы, которые могут Вас заинтересовать

12858. Психологическая игра Звездные планеты 35.5 KB
  Психологическая игра Звездные планеты Цель игры: поставить перед детьми проблему по созданию новых планет. Психологическая цель: обучить детей совместной практической деятельности. Задачи: Развивать навыки сотрудничества и умение соревноваться со сверстниками п...
12859. СЦЕНАРИЙ ДЛЯ СВОБОДНОГО ПЛАВАНИЯ 89 KB
  СЦЕНАРИЙ ДЛЯ СВОБОДНОГО ПЛАВАНИЯ Существуют истории финал которых заранее не известен. Есть только многочисленные дороги распутья перекрестки и изредка камни с кратким описанием последствий: направо пойдешь... налево пойдешь... Остается только догадываться что ждет...
12860. НАЧИНАЕМ РАЗГОВОР Игра для учащихся пятых классов 37.5 KB
  НАЧИНАЕМ РАЗГОВОР Игра для учащихся пятых классов В одном из номеров Школьного психолога за этот год читатели имели возможность познакомиться с моделью психологопедагогического сопровождения школьников на этапе перехода из начальной школы в среднюю см. ст
12861. ПЕРВЫЙ КЛАССНЫЙ ЧАС В 5 КЛАССЕ 31.5 KB
  ПЕРВЫЙ КЛАССНЫЙ ЧАС В 5 КЛАССЕ Возраст 10 11 12 лет. Дети этого возраста обучаются у нас в пролицейском отделении. Поступают после начальной школы и переходят от нас во €œвзрослый€ лицей через 3 года. Поступают из всех школ района умные замечательные с огромным желанием...
12862. Большая игра «По дороге из желтого кирпича» 52.5 KB
  Большая игра По дороге из желтого кирпича Гончарова Жанна Викторовна педагогпсихолог Как показывает практика большинство детей переходящих в пятый класс особенно в случаях поступления в другое учебное заведение испытывает двойственные чувства. С одной стор...
12863. Программа адаптации выпускников начальной школы к среднему звену 32 KB
  Программа адаптации выпускников начальной школы к среднему звену Каминская Ольга Николаевна педагогпсихолог Из года в год возникает проблема адаптации учащихся при переходе из начального в среднее звено школы. Несмотря на то что ученики уже привыкли к школе...
12864. Путешествие в страну Детства 54.5 KB
  Занятие для учащихся 5х классов Путешествие в страну Детства Цель: развитие эмоциональноволевой сферы детей. Задачи: развитие способности понимать эмоциональное состояние другого человека; развитие умения справляться с чувством страха; развитие ко
12865. Репортаж от одноклассника. Психологическая игра-проект 307.5 KB
  Психологическая играпроект Репортаж от одноклассника Психологическая служба любого образовательного учреждения ставит перед собой задачу выстраивания взаимодействия на решение комплексных задач школы которые реализуются всеми специалистами. Это взаимодействи...
12866. Тренинговые занятия. Я И МЫ 277.5 KB
  Я И МЫ Тренинговые занятия по формированию социальных навыков для учащихся 5го класса Начало учебы в 5м классе особый этап в школьной жизни ребенка. Перед каждым учеником стоит задача адаптации к непривычным условиям обучения: к множеству учебных предметов к новы