21691

Расширение последовательной схемы нейронного управления

Лекция

Информатика, кибернетика и программирование

Простая процедура обучения для эмулятора выглядит так: {рис. 109} Целью обучения является минимизация ошибки предсказания . 109} Для ускорения сходимости процесса обучения можно использовать другую модель эмулятора: {рис.

Русский

2013-08-03

106 KB

4 чел.

етоды искусственного интеллекта

Лекция № 7

МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

ЛЕКЦИЯ № 8

На прошлой лекции мы привели алгоритм обучения нейросети. Единственная его сложность состоит в вычислении производной  на втором шаге. С этой сложностью мы как раз и столкнулись на практическом занятии.

Альтернативный подход, позволяющий избавиться от аппроксимации, состоит в том, чтобы выполнить имитационное моделирование объекта управления, используя другую нейронную сеть, реализующую отображение вход/выход для объекта управления. В этом случае данная нейронная сеть используется в качестве идентификатора системы, или эмулятора. Таким образом, используя эмулятор, можно вычислить , как если бы этот эмулятор представлял собой действительный объект управления.

Итак, ,

где  — отображение вход/выход для эмулятора.

Простая процедура обучения для эмулятора выглядит так:

{рис. 4.3.5, с. 109}

Целью обучения является минимизация ошибки предсказания .

Рассмотрим эту схему подробно:

{рис. 4.3.6, с. 109}

Для ускорения сходимости процесса обучения можно использовать другую модель эмулятора:

{рис. 4.3.7, с. 110}

Здесь в качестве условной модели используется простая математическая модель или физически точная модель, даже если сама система является достаточно сложной и нелинейной. Если между действительным выходным сигналом и входным сигналом модели имеется несоответствие, то нейронная сеть выполняет самонастройку с целью минимизации ошибки.

Таким образом, эмулятор рассматривается здесь как сумма условной модели и нейросети, но настраиваться и изменяться может только нейросеть.

Этот метод моделирования является подходящим для практических задач управления, так как условная модель может не обеспечивать достаточной точности предсказания действительного выходного сигнала.

Общие схемы

Г-н Омату, основываясь на собственном опыте, очень рекомендует использовать статистическую модель, модель авторегрессии, модель авторегрессии скользящего среднего, линейных векторных уравнений и т.п., так как они позволяют выявить долгосрочные тенденции. В свою очередь нейронная сеть позволяет реализовать нелинейные соотношения. Таким образом, общая конфигурация такая:

{рис. 4.3.8, с. 111}

NN1 — это нейросетевой эмулятор, а NN2 — это нейроконтроллер, реализующий инверсно-динамическое отображение.

NN1 реализован по схеме 4.3.6 или 4.3.7, а NN2 — по схеме 4.3.4.

Другая схема реализации инверсной динамики:

{рис. 4.3.9, с. 112}

Здесь нейронная сеть NN1 используется для обучения инверсному отображению, а математическая модель NN2 копируется с модели NN1 после того, как заканчивается её обучение, обучение NN1.

Нейроконтроллеры на основе многослойных нейросетей широко применяются для решения нестандартных задач обучения и адаптивного управления. Однако их практическое применение серьёзно ограничено из-за необходимого для них длительного срока обучения. Мы рассмотрим задачу эффективного оперативного обучения многослойных нейроконтроллеров с целью сокращения времени обучения.

Расширение последовательной схемы нейронного управления

Практическое применение нейроконтроллеров ограничено из-за необходимого для них длительного срока обучения.

Искусственные нейросети представляют собой математические модели, разработанные для практического использования принципов, на основе которых, как предполагается, действуют биологические системы. Можно ожидать, что использование таких принципов позволит в некоторой степени имитировать возможности биологических систем по обработке информации.

Нейросети могут обучаться решению задач управления в оперативном или автономном режиме в зависимости от того, выполняет нейросеть полезную работу в процессе обучения или нет. Хотя автономное обучение обычно осуществляется достаточно быстро, обобщение результатов автономного обучения на конкретные условия управления представляет значительные сложности. В связи с этим практически для всех реальных задач управления необходимо оперативное обучение. В идеальном случае обучение должно быть только оперативным, а сеть должна быстро обучаться, начиная с некоторого начального набора весов.

Постановка задачи

Рассмотрим дискретный процесс с одним входом и одним выходом:

,

где

— выход;

— вход;

— дискретное целочисленное время;

и  — неотрицательные целые числа, оценки чисел  и ;

— некоторая функция.

Задача состоит в обучении управлению объектом, который описывается вот этим уравнением. Управление должно осуществляться таким образом, чтобы выходной сигнал соответствовал некоторому опорному сигналу ; при этом во времени должна минимизироваться некоторая норма ошибки . Единственные априорные количественные данные об объекте управления — величины  и , представляющие собой соответственно оценки величин  и  — предполагаются известными. Иными словами, предполагается известной приближённая оценка порядка дифференциального уравнения, описывающего объект управления.


Нейронный эмулятор

При заданных оценках величин  и  многослойная нейронная сеть с  входами и одним выходом может использоваться для эмуляции зависимости . Обозначив отображение, выполняемое эмулятором объекта управления как , а его выход — как , получим выражение:

,

где  — -мерный вектор.

Для случая, когда

,

целью обучения эмулятора является минимизация нормы ошибки эмуляции .

PAGE  3

Томский политехнический университет,

Дмитрий Афонин, апрель 2006 г.


 

А также другие работы, которые могут Вас заинтересовать

69018. Статичні характеристики біполярних транзисторів 290 KB
  Статичні характеристики біполярних транзисторів Вольтамперні характеристики БД Для розрахунку електричних ланцюгів що містять транзистори необхідно знати залежності між струмами і напругами на їх входах та виходах. Вхідна статична характеристика це залежність вхідного струму від...
69019. Робота транзистора в ключовому режимі 131.5 KB
  В апаратурі телекомунікацій часто виникає необхідність використання каскадів, котрі пропускають сигнал або його не пропускають. Такі каскади називають ключовими. Вони будуються на БТ, які працюють у ключовому режимі (режимі перемикання).
69020. Багатопереходні структури. Призначення, будова, класифікація та позначення тиристорів 215.5 KB
  Основу тиристора складає пластинка з монокристалу силіцію з областями p і nтипу які чергуються рис. Анод і катод тиристора мають відводи. Класифікація і позначення тиристорів середньої і малої потужності Крім того відвод у тиристора може бути і від внутрішньої області.
69023. Підсилювальні властивості польового транзистора 394 KB
  Відповідні схеми наведено на рис. а б в Рис. Робота ПТ в режимі підсилення На схемах рис.1 напруга Езм що подається на затвор є напругою зміщення яка необхідна для вибору положення робочої точки на статичних характеристиках рис.
69024. Частотні властивості польових транзисторів 272.5 KB
  Це знижує ефективність управління затвора вхідною напругою Uзв. 1б струм джерела SU1 визначається не повною вхідною напругою Uзв а напругою U1 між затвором і каналом яка відрізняється від напруги Uзв падінням на опорі області каналу rк U1 = = Зі зростанням частоти напруга U1 зменшується тому...
69025. Модулированные сигналы. Сигналы угловой модуляции 225.5 KB
  Термины частотная и фазовая модуляция справедливо ассоциируются с изменением по закону модулирующего колебания частоты или фазы исходного немодулированного колебания: Определим более подробно смысл этих изменений. Что же тогда изменение фазы если представить исходное...
69026. Модулированные сигналы. Сигналы с импульсной модуляцией 152 KB
  Сигналы с импульсной модуляцией. В основу формирования всех видов импульсной модуляции положена теорема В. При импульсной модуляции переносчиком выступает периодическая последовательность видеоимпульсов с периодом следования Т и длительностью.