21692

Нейронный контроллер

Лекция

Информатика, кибернетика и программирование

Сегодня мы посмотрим что внутри у нейроконтроллера а также займёмся повышением эффективности оперативного управления. Нейронный контроллер Предположим что объект управления описываемый уравнением является обратимым. Если выход близок к выходу при соответствующих входах то многослойная нейросеть может рассматриваться как контроллер в прямой цепи управления.

Русский

2013-08-03

225 KB

9 чел.

етоды искусственного интеллекта

Лекция № 9

МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

ЛЕКЦИЯ № 9

На прошлой лекции мы рассмотрели общие схемы нейросетевого управления, которые предлагает г-н Омату, поставили задачу и посмотрели, что там внутри у нейроэмулятора.

Сегодня мы посмотрим, что внутри у нейроконтроллера, а также займёмся повышением эффективности оперативного управления.

Нейронный контроллер

Предположим, что объект управления, описываемый уравнением,  является обратимым. То есть существует функция , такая, что

.

Рассмотрим многослойную нейронную сеть с -мерным вектором входов , одним входом  и соотношением между входом и выходом, кратко описываемым следующим образом:

,

где

— отображение вход/выход многослойной нейросети.

Если выход  близок к выходу  при соответствующих входах, то многослойная нейросеть может рассматриваться как контроллер в прямой цепи управления. В момент времени  значение входа объекта управления можно получить с помощью выражения , подставив в него:

.

Обратите внимание, что здесь вместо неизвестной величины  использовано значение опорного сигнала . Если ошибка выхода  поддерживается на достаточно низком уровне после окончания процесса обучения, можно использовать значения опорного сигнала вместо у:

.

Отсюда видно, что нейроконтроллер не имеет обратных связей, как в последовательной схеме нейронного управления.

Эффективное оперативное управление

Медленная сходимость обучения — основной недостаток многослойных нейросетей, серьёзно ограничивающий практическое применение нейронного управления. Существует несколько подходов для ускорения сходимости в нейронном управлении. Перечислим некоторые из них.

  1.  Разработка эффективных алгоритмов обратного распространения.
  2.  Встраивание знаний о структуре объекта управления в структуру многослойных нейросетей.
  3.  Применение гибридных сетей, в которых искусственные нейросети связываются со структурами управления, полученными на основе других, отличных от нейронных, технологий.
  4.  Предварительное обучение и эффективные процедуры инициализации.

Далее мы рассмотрим новые алгоритмы оперативного обучения, направленные на сокращение времени обучения нейроконтроллеров. Эти алгоритмы основаны на разделении понятий частоты дискретизации и частоты выполнения обучающих итераций (частоты обучения). В системах управления с дискретным временем период дискретизации Т обычно выбирается по следующему эмпирическому правилу: величина  должна значительно превышать максимальную частоту, имеющуюся в системе с непрерывным временем. Обычно повышение частоты дискретизации улучшает характеристики системы, однако это улучшение быстро прекращается (график изменения характеристик достигает плато). В обычных адаптивных системах управления адаптивные элементы, как правило, корректируются один раз за каждый период дискретизации; таким образом, частоту дискретизации и частоту обучения можно не различать. Если пренебречь ограничениями на время обработки, то может показаться, что фактическое время обучения можно сократить, повысив частоту дискретизации.

Однако во многих практических случаях превышение некоторого предела частоты дискретизации недопустимо или нежелательно. Например, в обычных промышленных химических установках, как правило, интерес представляют процессы, связанные с большими величинами временных констант. При этом не имеет смысла использовать высокие частоты дискретизации: это может привести к избыточности информации. Использование очень высоких частот дискретизации может привести к полной перестройке системы управления и усложнить её. Может потребоваться учитывать частные процессы и переходные явления, которые при меньших частотах дискретизации можно было бы игнорировать.

Другой пример систем, в которых нельзя использовать произвольно высокую частоту дискретизации — распределённые системы управления, в которых интервалы передачи информации на устройство управления и приёма информации с него не зависят от самого устройства управления.

Хотя период дискретизации Т задаёт базовый темп работы системы управления, в системах с итерационным обучением частота обучающих операций может рассматриваться как ещё одна основа для отсчёта времени. На практике период дискретизации Т обычно значительно превышает время , затрачиваемое на одну обучающую итерацию, то есть на корректировку всех весов сети. По мере появления многослойных сетей с более высоким быстродействием (за счёт улучшения их программной или аппаратной реализации) отношение  повышается.

Таким образом, если имеется соответствующая информация о входе и выходе объекта управления, и интерес представляет только время, то за период дискретизации может выполняться несколько обучающих итераций. Обычный (и самый простой) подход состоит в выполнении одной корректировки за период дискретизации, и он связан с непроизводительными затратами времени обработки. Проблема состоит в том, каким образом выбрать и использовать обучающие данные, и как использовать имеющееся время для рационального обучения нейросетей, т.е. для обучения, которое должно повысить эффективность управления.

Г-н Омату предлагает три метода обучения, в которых за каждый период дискретизации выполняется несколько обучающих итераций.

1. Обучение эмулятора

Предположим, что в момент времени  в памяти хранится текущее значение выхода ,  значений того же процесса в предшествующие моменты времени и  значений входного процесса  в предшествующие моменты времени. В этом случае в качестве образцов для обучения эмулятора в момент времени  могут использоваться  пар , . Для случая  требуется минимизировать следующую функцию ошибки:

,

где

— невозрастающая положительная последовательность, предназначенная для определённого „забывания“ образцов, полученных ранее.

Пример. Пусть только что получена величина  (т.е. величина  ещё не известна), , , . Предположим также, что величины , , …  и , …  имеются в памяти. В этом случае выходные векторы эмулятора можно представить в виде:

Эти выходные векторы и величины  образуют обучающие образцы для обучения в момент времени . Эту процедуру можно представить в виде рисунка.

{рисунок 4.4.1-а, с. 127}

Здесь через  обозначено состояние эмулятора во время -го интервала дискретизации, после -й обучающей итерации, . Аналогично  обозначает отображение вход/выход, выполняемое эмулятором в состоянии . Очевидно, что .

2. Обучение контроллера: подход на основе ошибки инверсно-прямого управления

Вспомним инверсно-прямую конфигурацию управления (рис. 4.3.10, с. 112). Предположим то же самое: что в момент времени t+1 в памяти хранится текущее значение выхода ,  предыдущих значений выходного и  значений входного процессов. В этом случае в качестве образцов для обучения нейроконтроллера в момент времени t+1 могут использоваться n пар

, i=0…n-1,

при этом

.

При , и функция ошибки

.

И соответствующий -член для -го образца записывается следующим образом:

.

Следует отметить, что функция ошибки  не включает в себя непосредственно координату ошибки объекта управления. В связи с этим обучение объекта управления непосредственно не повышает эффективность управления. Однако такой способ обучения позволяет достичь хорошего обобщения в пространстве параметров управления. На практике обучение нейроконтроллеров, основанное только на инверсно-прямом подходе, даёт плохие результаты: выход нейроконтроллера устанавливается на некоторой постоянной величине, в результате чего ошибка обучения оказывается нулевой, однако характеристики управления оказываются явно плохими. Этот недостаток присущ всем методам обучения, основанным на минимизации ошибки инверсного управления. Его можно устранить, используя сочетание таких методов управления с другими, непосредственно минимизирующими ошибку системы регулирования.

И вот пример, который это иллюстрирует.

Пусть р=3, q=2 и только что получена величина у(9). Предположим также, что в памяти имеются аналогичные величины, что и в предыдущем примере: , , …  и , … .

Обозначим через  текущее отображение, выполняемое нейроконтроллером. Равенство  означает, что обучения ещё нет. Входной сигнал для объекта управления  можно вычислить из соотношения , где .

Для обучения в соответствии с подходом на основе ошибки инверсно-прямого управления можно использовать следующие векторы:

Эти векторы и входные величины ,  и  образуют три обучающих образца (входной вектор и желаемый выход) для обучения нейроконтроллера в момент времени . Однако такой метод обучения непосредственно не минимизирует ошибку управления, поэтому на практике необходимо его сочетание с другими методами.

На рисунке этот подход будет выглядеть так:

{рис. 4.4.1-б, с. 127}

На рисунке показано сочетание множественного обучения на основе инверсно-прямого управления и простого обучения на основе обучающей конфигурации. В результате выполняется 4 обучающих итерации за один период дискретизации. Вектор хс(8) задаётся составляющими . Через  обозначено состояние нейроконтроллера во время -го интервала дискретизации, после -й обучающей итерации. В результате достигается точное обучение нейроэмулятора за счёт усложнения процесса обучения.

PAGE  4

Томский политехнический университет,

Дмитрий Афонин, апрель 2006 г.


 

А также другие работы, которые могут Вас заинтересовать

33889. Культурно-просветительная работа, общее и специальное образование. Во второй половине 40-х – начале 50-х гг 38 KB
  Задачи образования восстановить всеобщее 7летнее образование с 1949 обучить тех кто не обучился в войну школы рабочей молодежи школы комсомольской молодежи. Проблема уровня образования. Пример Красноярского края в восстановлении образования. Чрезмерная идеологизация образования.
33890. Наука в послевоенный период 41.5 KB
  были открыты Институт точной механики и вычислительной техники Институт радиотехники и электроники Институт прикладной геофизики Институт физической химии Институт атомной энергии Институт ядерных проблем и др. Был создан Институт языкознания АН СССР во главе которого встал академик В. были открыты Институт точной механики и вычислительной техники Институт радиотехники и электроники Институт прикладной геофизики Институт физической химии Институт атомной энергии Институт ядерных проблем и др. Был создан Институт языкознания АН СССР...
33891. Развитие искусства во второй половине 40-х – начале 50-х гг 52 KB
  Тема войны Непринцев Отдых после боя Неменский сестры наши Костецкий Возвращение Лактионов Письмо с фронта. Тема восстановления Яблонская Хлеб Весна. Выдающиеся произведения: тема войны Некрасов В окопах Сталинграда Фадеев Молодая гвардия Казакевич звезда Полевой Повесть о настоящем человеке Твардовский Дом у дороги. Овечкин Районные будни тема деревни.
33892. Внешняя политика СССР в послевоенный период: отношения с Западными странами. Холодная война 54 KB
  Внешняя политика СССР в послевоенный период: отношения с Западными странами. Внешнеполитическая доктрина СССР против поддержки социалистических стран принцип мирного сосуществования. тезис о враждебности капиталистического окружения СССР. Сначала у СССР была мирная внешнеполитическая доктрина затем ужесточилось так же и у США.
33893. СССР и страны Центральной и Восточной Европы в послевоенный период. Роль СССР в формировании мировой системы социализма 35 KB
  СССР и страны Центральной и Восточной Европы в послевоенный период. Роль СССР в формировании мировой системы социализма. В 19451946 существовали коалиционные правительства в Западной Европе потом постепенно произошел переход к коммунистическим режимам: Румыния отречение Михая Болгария конституция 1947 и усиление позиций коммунистов Польша отставка коалиционного правительства Венгрия победа коммунистов на выборах Чехословакия сопротивление события 1948 надежда сохранить отношения и с СССР и с Западом. В сентябре...
33894. Поиск путей обновления общественно-политической жизни в СССР в 1953-1955 гг 37 KB
  Маленков председатель Совмина глава министерства Берия МВД МГБ зам председателя совмина Каганович первый заместитель председателя Совета Министров СССР с 1952 года член Президиума ЦК КПСС Молотов МИД Булганин министр обороны Ворошилов председатель президиума верховного совета. После этого большую власть получил Маленков заявление о группе В нужно поднимать деревню. На ней учредили пост 1 секретаря на который избрали Хрущева доклад Хрущева о с х Январь 1955 пленум ЦК КПСС слушалось дело Маленкова которого обвинили в...
33895. ХХ съезд КПСС и его историческое значение. Борьба с оппозицией в послевоенный период 27.5 KB
  Первоначально преодоление культа личности сводилось к перестройке пропаганды 1953 но Маленков заявил что дело не только в этом ведь этот вопрос связан с вопросом коллективного руководства.1956 доклад Хрущева О культе личности и его последствиях. Идея попытки преодолеть культ личности принадлежит Маленкову а не Хрущеву. Все идеи доклада были повторены в постановлении ЦК: в стране сложился культ личности Сталина вопрос о причинах свелся к личным качествам Сталина опубликованы последние работы Ленина культ личности не...
33896. Индустриальное развитие страны в 50-х гг 53.5 KB
  Индустриальное развитие страны в 50х гг. широкое развитие получает НТП. Индустриальное развитие шло по пятилеткам 19511955 пятая 19561960 шестая. Достижения в транспорте воздушный реактивные самолеты в пассажирских перевозках водный суда на подводных крыльях морской атомный ледокол сухопутный переход на электровозы и электрички автомобильный примитивное развитие трубопроводный трубопровод Дружба.
33897. Сельское хозяйство СССР в 50-х гг 27.5 KB
  Еще на XIX съезде заявили что продовольственная проблема решена но это было ложью. Вопрос о насыщении с х техникой и снабжении кадрами для этой техники проблема кадров инженернотехнического профиля. В январе 1955 на пленуме Хрущев поставил задачу подъема животноводства проблема кормов. Проблема раскрестьянивания одна из главных в нашей историографии.