21691

Расширение последовательной схемы нейронного управления

Лекция

Информатика, кибернетика и программирование

Простая процедура обучения для эмулятора выглядит так: {рис. 109} Целью обучения является минимизация ошибки предсказания . 109} Для ускорения сходимости процесса обучения можно использовать другую модель эмулятора: {рис.

Русский

2013-08-03

106 KB

4 чел.

етоды искусственного интеллекта

Лекция № 7

МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

ЛЕКЦИЯ № 8

На прошлой лекции мы привели алгоритм обучения нейросети. Единственная его сложность состоит в вычислении производной  на втором шаге. С этой сложностью мы как раз и столкнулись на практическом занятии.

Альтернативный подход, позволяющий избавиться от аппроксимации, состоит в том, чтобы выполнить имитационное моделирование объекта управления, используя другую нейронную сеть, реализующую отображение вход/выход для объекта управления. В этом случае данная нейронная сеть используется в качестве идентификатора системы, или эмулятора. Таким образом, используя эмулятор, можно вычислить , как если бы этот эмулятор представлял собой действительный объект управления.

Итак, ,

где  — отображение вход/выход для эмулятора.

Простая процедура обучения для эмулятора выглядит так:

{рис. 4.3.5, с. 109}

Целью обучения является минимизация ошибки предсказания .

Рассмотрим эту схему подробно:

{рис. 4.3.6, с. 109}

Для ускорения сходимости процесса обучения можно использовать другую модель эмулятора:

{рис. 4.3.7, с. 110}

Здесь в качестве условной модели используется простая математическая модель или физически точная модель, даже если сама система является достаточно сложной и нелинейной. Если между действительным выходным сигналом и входным сигналом модели имеется несоответствие, то нейронная сеть выполняет самонастройку с целью минимизации ошибки.

Таким образом, эмулятор рассматривается здесь как сумма условной модели и нейросети, но настраиваться и изменяться может только нейросеть.

Этот метод моделирования является подходящим для практических задач управления, так как условная модель может не обеспечивать достаточной точности предсказания действительного выходного сигнала.

Общие схемы

Г-н Омату, основываясь на собственном опыте, очень рекомендует использовать статистическую модель, модель авторегрессии, модель авторегрессии скользящего среднего, линейных векторных уравнений и т.п., так как они позволяют выявить долгосрочные тенденции. В свою очередь нейронная сеть позволяет реализовать нелинейные соотношения. Таким образом, общая конфигурация такая:

{рис. 4.3.8, с. 111}

NN1 — это нейросетевой эмулятор, а NN2 — это нейроконтроллер, реализующий инверсно-динамическое отображение.

NN1 реализован по схеме 4.3.6 или 4.3.7, а NN2 — по схеме 4.3.4.

Другая схема реализации инверсной динамики:

{рис. 4.3.9, с. 112}

Здесь нейронная сеть NN1 используется для обучения инверсному отображению, а математическая модель NN2 копируется с модели NN1 после того, как заканчивается её обучение, обучение NN1.

Нейроконтроллеры на основе многослойных нейросетей широко применяются для решения нестандартных задач обучения и адаптивного управления. Однако их практическое применение серьёзно ограничено из-за необходимого для них длительного срока обучения. Мы рассмотрим задачу эффективного оперативного обучения многослойных нейроконтроллеров с целью сокращения времени обучения.

Расширение последовательной схемы нейронного управления

Практическое применение нейроконтроллеров ограничено из-за необходимого для них длительного срока обучения.

Искусственные нейросети представляют собой математические модели, разработанные для практического использования принципов, на основе которых, как предполагается, действуют биологические системы. Можно ожидать, что использование таких принципов позволит в некоторой степени имитировать возможности биологических систем по обработке информации.

Нейросети могут обучаться решению задач управления в оперативном или автономном режиме в зависимости от того, выполняет нейросеть полезную работу в процессе обучения или нет. Хотя автономное обучение обычно осуществляется достаточно быстро, обобщение результатов автономного обучения на конкретные условия управления представляет значительные сложности. В связи с этим практически для всех реальных задач управления необходимо оперативное обучение. В идеальном случае обучение должно быть только оперативным, а сеть должна быстро обучаться, начиная с некоторого начального набора весов.

Постановка задачи

Рассмотрим дискретный процесс с одним входом и одним выходом:

,

где

— выход;

— вход;

— дискретное целочисленное время;

и  — неотрицательные целые числа, оценки чисел  и ;

— некоторая функция.

Задача состоит в обучении управлению объектом, который описывается вот этим уравнением. Управление должно осуществляться таким образом, чтобы выходной сигнал соответствовал некоторому опорному сигналу ; при этом во времени должна минимизироваться некоторая норма ошибки . Единственные априорные количественные данные об объекте управления — величины  и , представляющие собой соответственно оценки величин  и  — предполагаются известными. Иными словами, предполагается известной приближённая оценка порядка дифференциального уравнения, описывающего объект управления.


Нейронный эмулятор

При заданных оценках величин  и  многослойная нейронная сеть с  входами и одним выходом может использоваться для эмуляции зависимости . Обозначив отображение, выполняемое эмулятором объекта управления как , а его выход — как , получим выражение:

,

где  — -мерный вектор.

Для случая, когда

,

целью обучения эмулятора является минимизация нормы ошибки эмуляции .

PAGE  3

Томский политехнический университет,

Дмитрий Афонин, апрель 2006 г.


 

А также другие работы, которые могут Вас заинтересовать

27700. Посягательство на жизнь лица, осуществляющего правосудие или предварительное расследование (ст. 295 УК), отличие этого преступления от убийства (ст. 105 УК) 25 KB
  295 УК отличие этого преступления от убийства ст. б 105 преступления против жизни; 295преступления против правосудия. Преступление считается оконченным с момента совершения действий направленных на лишение жизни; 105два главных критерия: деяние в форме действия или бездействия причинная связь между деянием и наступившими последствиями а также время место способ орудие материальный состав преступления считается оконченным с момента наступления общественно опасных последствий смерти; Субъективная сторона: 295характеризуется...
27702. Прикладная криптография. Протоколы, алгоритмы и исходные тексты на языке С 2.78 MB
  В криптографической науке есть особенность, отсутствующая в обычных академических дисциплинах: необходимость взаимодействия криптографии и криптоанализа. Причиной этого является отсутствие требований к передаче реальной информации, следовательно, нетрудно предложить систему, которая кажется непогрешимой.
27703. Умышленное причинение лёгкого вреда здоровью (ст. 115 УК). Признаки легкого вреда здоровью. Отличие этого преступления от нанесения побоев (ст. 116 УК) и истязания (ст. 117УК) 31 KB
  Отличие этого преступления от нанесения побоев ст. 116состоит из следующих элементов: нанесение побоев или причинение иных действий повлекших физ. Для квалификации необходимо установить причинную связь между фактом нанесения побоев и причинением физ. Побои нанесение побоев или совершение иных насильственных действий причинивших физ.
27705. Умышленное причинение тяжкого и средней тяжести вреда здоровью (ст. ст. 111, 112 УК). Признаки тяжкого и средней тяжести вреда здоровью. Отличие преступления, предусмотренного ч.4 ст. 111 УК, от убийства 37 KB
  Признаки тяжкого и средней тяжести вреда здоровью. Кроме того причинение тяжкого вреда здоровью приносит длительные физические страдания инвалидность и прочие негативные для потерпевшего последствия. 2 Объективная сторона: выражается в противоправном причинении тяжкого вреда здоровью человека.
27707. Условное осуждение. Основания, условия и порядок его применения. Условия продления испытательного срок и отмены условного осуждения 32 KB
  Условия продления испытательного срок и отмены условного осуждения. Применение условного осуждения возможно только при назначении наказания в виде: исправительных работ; ограничения по военной службе; ограничения свободы; содержания в дисциплинарной воинской части; лишения свободы на срок до восьми лет. Законодатель ограничивает возможность применения условного осуждения не только определенными видами наказания но и максимальным сроком. Закон предусматривает возможность применения условного осуждения при назначении лишения свободы...