21691

Расширение последовательной схемы нейронного управления

Лекция

Информатика, кибернетика и программирование

Простая процедура обучения для эмулятора выглядит так: {рис. 109} Целью обучения является минимизация ошибки предсказания . 109} Для ускорения сходимости процесса обучения можно использовать другую модель эмулятора: {рис.

Русский

2013-08-03

106 KB

4 чел.

етоды искусственного интеллекта

Лекция № 7

МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

ЛЕКЦИЯ № 8

На прошлой лекции мы привели алгоритм обучения нейросети. Единственная его сложность состоит в вычислении производной  на втором шаге. С этой сложностью мы как раз и столкнулись на практическом занятии.

Альтернативный подход, позволяющий избавиться от аппроксимации, состоит в том, чтобы выполнить имитационное моделирование объекта управления, используя другую нейронную сеть, реализующую отображение вход/выход для объекта управления. В этом случае данная нейронная сеть используется в качестве идентификатора системы, или эмулятора. Таким образом, используя эмулятор, можно вычислить , как если бы этот эмулятор представлял собой действительный объект управления.

Итак, ,

где  — отображение вход/выход для эмулятора.

Простая процедура обучения для эмулятора выглядит так:

{рис. 4.3.5, с. 109}

Целью обучения является минимизация ошибки предсказания .

Рассмотрим эту схему подробно:

{рис. 4.3.6, с. 109}

Для ускорения сходимости процесса обучения можно использовать другую модель эмулятора:

{рис. 4.3.7, с. 110}

Здесь в качестве условной модели используется простая математическая модель или физически точная модель, даже если сама система является достаточно сложной и нелинейной. Если между действительным выходным сигналом и входным сигналом модели имеется несоответствие, то нейронная сеть выполняет самонастройку с целью минимизации ошибки.

Таким образом, эмулятор рассматривается здесь как сумма условной модели и нейросети, но настраиваться и изменяться может только нейросеть.

Этот метод моделирования является подходящим для практических задач управления, так как условная модель может не обеспечивать достаточной точности предсказания действительного выходного сигнала.

Общие схемы

Г-н Омату, основываясь на собственном опыте, очень рекомендует использовать статистическую модель, модель авторегрессии, модель авторегрессии скользящего среднего, линейных векторных уравнений и т.п., так как они позволяют выявить долгосрочные тенденции. В свою очередь нейронная сеть позволяет реализовать нелинейные соотношения. Таким образом, общая конфигурация такая:

{рис. 4.3.8, с. 111}

NN1 — это нейросетевой эмулятор, а NN2 — это нейроконтроллер, реализующий инверсно-динамическое отображение.

NN1 реализован по схеме 4.3.6 или 4.3.7, а NN2 — по схеме 4.3.4.

Другая схема реализации инверсной динамики:

{рис. 4.3.9, с. 112}

Здесь нейронная сеть NN1 используется для обучения инверсному отображению, а математическая модель NN2 копируется с модели NN1 после того, как заканчивается её обучение, обучение NN1.

Нейроконтроллеры на основе многослойных нейросетей широко применяются для решения нестандартных задач обучения и адаптивного управления. Однако их практическое применение серьёзно ограничено из-за необходимого для них длительного срока обучения. Мы рассмотрим задачу эффективного оперативного обучения многослойных нейроконтроллеров с целью сокращения времени обучения.

Расширение последовательной схемы нейронного управления

Практическое применение нейроконтроллеров ограничено из-за необходимого для них длительного срока обучения.

Искусственные нейросети представляют собой математические модели, разработанные для практического использования принципов, на основе которых, как предполагается, действуют биологические системы. Можно ожидать, что использование таких принципов позволит в некоторой степени имитировать возможности биологических систем по обработке информации.

Нейросети могут обучаться решению задач управления в оперативном или автономном режиме в зависимости от того, выполняет нейросеть полезную работу в процессе обучения или нет. Хотя автономное обучение обычно осуществляется достаточно быстро, обобщение результатов автономного обучения на конкретные условия управления представляет значительные сложности. В связи с этим практически для всех реальных задач управления необходимо оперативное обучение. В идеальном случае обучение должно быть только оперативным, а сеть должна быстро обучаться, начиная с некоторого начального набора весов.

Постановка задачи

Рассмотрим дискретный процесс с одним входом и одним выходом:

,

где

— выход;

— вход;

— дискретное целочисленное время;

и  — неотрицательные целые числа, оценки чисел  и ;

— некоторая функция.

Задача состоит в обучении управлению объектом, который описывается вот этим уравнением. Управление должно осуществляться таким образом, чтобы выходной сигнал соответствовал некоторому опорному сигналу ; при этом во времени должна минимизироваться некоторая норма ошибки . Единственные априорные количественные данные об объекте управления — величины  и , представляющие собой соответственно оценки величин  и  — предполагаются известными. Иными словами, предполагается известной приближённая оценка порядка дифференциального уравнения, описывающего объект управления.


Нейронный эмулятор

При заданных оценках величин  и  многослойная нейронная сеть с  входами и одним выходом может использоваться для эмуляции зависимости . Обозначив отображение, выполняемое эмулятором объекта управления как , а его выход — как , получим выражение:

,

где  — -мерный вектор.

Для случая, когда

,

целью обучения эмулятора является минимизация нормы ошибки эмуляции .

PAGE  3

Томский политехнический университет,

Дмитрий Афонин, апрель 2006 г.


 

А также другие работы, которые могут Вас заинтересовать

25944. Большепролетные покрытия - пространственные конструкции 561 KB
  Большепролетные покрытия пространственные конструкции. Все конструктивные системы покрытия можно рассматривать с двух позиций которые имеют особое влияние на архитектурный облик всего сооружения. В отличие от плоскостных пространственные покрытия работают одновременно в двух или нескольких направлениях К ним относятся: перекрестные системы оболочки складки висячие покрытия пневматические конструкции и др. Пространственные покрытия выполняют из плоскостных элементов монолитно связанных между собой и работающих как цельная конструкция...
25945. Большепролетные покрытия – висячие конструкции 67.5 KB
  Большепролетные покрытия – висячие конструкции. Висячие конструкции представляют собой один из наиболее экономичных видов покрытий благодаря тому что материал несущих конструкций работает исключительно на растяжение и несущая способность конструкций используется полностью. б ужесточенными считают такие висячие системы жесткость которых препятствует возникновению недопустимых кинематических и упругих деформаций Сюда относятся в основном висячие предварительно напряженные оболочки.
25947. Большое распространение в зарубежной и отечественной практике получили также висячие тонколистовые системы - мембранные покрытия 76.5 KB
  В некоторых случаях вместо сплошной мембраны покрытие образуется из отдельных не соединяемых друг с другом тонких стальных лент. Сплошное мембранное покрытие успешно применено для универсального стадиона на проспекте Мира в Москве размеры в плане которого достигают 183x224 м рис.
25949. Сводчатые покрытия проектируются, как правило, из сборных железобетонных элементов для прямоугольных в плане однопролетных или многопролетных зданий 35.5 KB
  По продольным краям вдоль образующей своды могут опираться на колонны стены или непосредственно на фундаменты.1 Своды с затяжками Рисунок 7.2 Своды без затяжек 7. Своды призматического полигонального очертания состоят из прямолинейных участков вписанных в дугу указанных выше кривых.
25950. Городские транспортные сооружения 34 KB
  Путепроводы и эстакады можно отнести ко второй группе сооружений. Эстакады применяют в следующих случаях: на пересечениях двух и более транспортных магистралей для увеличения пропускной способности улиц для пропуска скоростных автомагистралей над городской застройкой независимо от сложившейся сети улиц на подходах к большим мостам вместо высоких насыпей на подходах к местам скопления большого числа автомобилей вокзалам аэродромам гостиницам стадионам для уширения набережных и организации движения вдоль рек на косогорах болотах и...
25951. Стоянка для автомобилей (далее автостоянка) - здание, сооружение или специальная открытая площадка, предназначенные только для хранения (стоянки) автомобилей 32.5 KB
  Механизированная автостоянка автостоянка в которой транспортировка автомобилей в места ячейки хранения осуществляется специальными механизированными устройствами без участия водителей.5 Автостоянки закрытого типа для автомобилей с двигателями работающими на сжатом природном газе и сжиженном нефтяном газе встраивать в здания иного назначения и пристраивать к ним а также располагать ниже уровня земли не допускается.7 Хранение автомобилей для перевозки горючесмазочных материалов следует как правило предусматривать на открытых...