44509

Биотехнические системы

Книга

Коммуникация, связь, радиоэлектроника и цифровые приборы

Биотехнические системы – особый класс больших систем, в которых биологические и технические элементы связаны в едином контуре управления, причем роль управляющего звена в них могут играть как технические, так и биологические звенья. Создание таких систем является сложной задачей, использующей целый арсенал отдельных приемов, методов и подходов

Русский

2014-03-25

5.73 MB

37 чел.

Предисловие

ХХI век – век тесного сближения техники и живого организма во множестве сфер жизни: в здравоохранении это лечебно-диагностические приборы и компьютерные системы; в авиации и космонавтике – медико-биологическая аппаратура систем жизнеобеспечения и медицинского контроля, исследовательская аппаратура биоспутников; в человеко-машинных системах – биотехнические устройства терминалов ЭВМ; в робототехнике – бионические устройства роботов.

Биотехнические системы – особый класс больших систем, в которых биологические и технические элементы связаны в едином контуре управления, причем роль управляющего звена в них могут играть как технические, так и биологические звенья. Создание таких систем является сложной задачей, использующей целый арсенал отдельных приемов, методов и подходов, призванных найти применение природным принципам в вершинах современной конструкторской деятельности.

Идею применения знаний о живой природе для решения инженерных задач новой не назовешь: она принадлежит еще Леонардо да Винчи, который пытался построить летательный аппарат с машущими крыльями, как у птиц – орнитоптер. На современном этапе появление кибернетики, рассматривающей общие принципы управления и связи в живых организмах и машинах, стало стимулом для более широкого изучения строения и функций живых систем с целью выяснения их общности с техническими системами, а также использования полученных сведений о биоорганизмах для создания новых приборов, механизмов, материалов и т. п.

Сегодня биотехника – актуальная для множества жизненных сфер и динамично развивающаяся область научного знания, стоящая на стыке биологии, физики, химии, кибернетики и инженерных наук – электроники, навигации, автоматики, систем связи. Курс теории биотехнических систем является профильным для специалистов и бакалавров, обучающихся по направлению «Биомедицинская инженерия», и изучается на старших курсах высших учебных заведений, что подразумевает наличие у студентов необходимых знаний по естественнонаучным и общеинженерным дисциплинам. Однако, учитывая серьезные объемы современных исследований в сфере нано- и биотехнологий, обеспечивающих внушительные темп развития биотехники, авторы учебника ставят перед собой задачу знакомства читателей лишь с основами теории по изучаемой дисциплине и наиболее интересными практическими примерами.

Робототехника в наши дни выглядит уже не фантастической и далекой мечтой, а активно реализуемой на производстве и стремительно внедряемой в быт человека инженерной реальностью. Строительные, авиационные, военные, космические и подводные роботы производятся в промышленных масштабах, обеспечивая стабильную работу многих современных предприятий. Но, несомненно, XXI век запомнится и как век становления бытовых и человекоподобных роботов. В первой главе читателю будет рассказано о бионических системах – промышленных аналогах принципов организации, свойств, функций и структур живой природы, – основу которых составляют системы управления движениями и сенсорные системы.

Развитие многих современных конструкций, с которыми приходится сталкиваться в быту и на производстве человеку, идет по пути эргономики – адаптации механизмов, исходя из физических и психических особенностей организма. Системам типа «человек-машина» с управляющим биологическим звеном посвящена вторая глава учебника.

Скорость передачи импульса в нервной системе организма составляет от 0,5 до 120 м/с, что в тысячи, миллионы раз медленнее скорости передачи информации в современных линиях связи. Как не удивительно, но именно этот «сравнительно медленный» процесс передачи нервных импульсов в теле человека взят за основу новейших математических моделей сетей. Построенным по принципам организации и функционирования биоэлектрических нейронным сетям, уникальным своей нелинейностью – способностью к обучению, посвящена, третья, заключительная глава учебника.

Таким образом, в учебнике, который предлагается изучающим основы специального конструирования, три главы, рассказывающие о разных типах систем с определенным набором биологических и технических звеньев. При этом для унификации подхода к описанию каждая из глав будет построена с учетом двух принципов. Первый предполагает рассмотрение каждой из биотехнических систем на трех уровнях: микроуровне (элементной базе), мезоуровне (отдельных устройств и приборов), макроуровне (системы и комплексы). Это позволит обеспечить ее четкую организацию и максимальное соответствие технических элементов психофизиологическим особенностям сопрягаемых с ними биологических элементов. Согласно второму принципу, для каждой из рассматриваемых систем будет применяться три типа описания: морфологический (анатомический), функциональный (структурный) и генетико-прогностический (описывающий историческое развитие). В результате внимательный читатель будет представлять стройную картину инженерно-биотехнической действительности.

Даже прочтение большого количества литературы вряд ли сможет дать обучающемуся необходимые сведения для самостоятельного создания сложных комплексов. Крайне важна для приобретения конструкторских навыков практика: решение задач, теоретических и изобретательских, изучение созданных ранее аппаратов, рассмотрение ярких идей, в том числе и признанных ошибочными. Скорее всего, прочитав книгу, вы не назовете себя специалистами в области биотехнических систем, но будете знать их теоретические основы и, возможно, «заразитесь» идеей гармоничного, близкого современному человеку будущего.

Коллектив авторов учебника


Часть 1.
СИСТЕМЫ ОРГАНИЗАЦИИ ДВИЖЕНИЯ

Предмет робототехники – это создание и применение роботов и других средств робототехники различного назначения. Возникнув на основе кибернетики и механики, робототехника в свою очередь породила новые направления развития и самих этих наук. Для кибернетики это связано, прежде всего, с интеллектуальным управлением, которое требуется для роботов, а для механики – с многозвенными механизмами типа манипуляторов.

Робот можно определить как универсальный автомат для осуществления механических действий, подобных тем, которые производит человек, выполняющий физическую работу. При создании первых роботов и вплоть до сегодняшнего дня образцом для них служат физические возможности человека. Именно стремление заменить человека на тяжелых работах и породило сначала идею робота, затем первые попытки ее реализации (в средние века) и, наконец, обусловило возникновение и развитие современной робототехники и роботостроения.

На рис. 1.1 показана функциональная схема робота. Она включает исполнительные системы – манипуляционную (один или несколько манипуляторов) и передвижения, если робот подвижный, сенсорную систему, снабжающую робот информацией о внешней среде, и устройство управления. Исполнительные системы в свою очередь состоят из механической системы и системы приводов. Механическая система манипулятора – это обычно кинематическая цепь, состоящая из подвижных звеньев с угловым или поступательным перемещением, которая заканчивается рабочим органом в виде захватного устройства или какого-нибудь инструмента.

Из данного определения следует, что робот – это машина автоматического действия, которая объединяет свойства машин рабочих и информационных, являясь, таким образом, принципиально новым видом машин. В достаточно развитом виде роботы аналогично человеку осуществляют активное силовое и информационное взаимодействие с окружающей средой и благодаря этому могут обладать искусственным интеллектом и совершенствовать его. Правда, пока еще роботы очень далеки по своим интеллектуальным возможностям от человека.

Рис. 1.1. Функциональная схема робота

При решении проблемы создания роботов одним из естественных путей является копирование человека и живой природы вообще. Однако не менее важен и поиск принципиально новых путей, определяемых возможностями современной техники. Пример первого подхода – создание механических рук шарнирного типа и захватных устройств со сгибающимися пальцами. Примеры второго подхода – использование электромагнитного поля для ориентации и взятия предметов и, наконец, колесный ход вместо шагания. Аналогичные примеры можно найти и применительно к сенсорным системам (создание «сверхчувственных» органов наряду с копированием органов чувств животных). От ранее известных видов машин роботы принципиально отличаются своей универсальностью (многофункциональностью) и гибкостью (быстрым переходом на новые операции). Под универсальностью понимается универсальность рабочих органов робота и их движений, хотя сегодня до универсальности руки человека роботам еще далеко (правда, это компенсируется возможностью быстрой смены рабочих органов робота в процессе выполнения операций).

Универсальность роботов предполагает возможность выполнения ими целенаправленных действий, которые требуют определенных интеллектуальных способностей. Это открывает широкие возможности использования роботов в качестве как основного технологического оборудования (на сборке, сварке, окраске и т.п.), так и вспомогательного – для замены рабочих, занятых на обслуживании такого оборудования.

Универсальность роботов дает возможность автоматизировать принципиально любые операции, выполняемые человеком, а быстрота перестройки на выполнение новых операций при освоении новой продукции или иных изменениях в производстве позволяет сохранить за автоматизируемым с помощью роботов производством по крайней мере ту же гибкость, которую на сегодня имеют только производства, обслуживаемые человеком. Роботы потому и появились лишь во второй половине XX столетия, что именно сейчас назрела необходимость в таких универсальных и гибких средствах, без которых невозможно осуществить комплексную автоматизацию современного производства с его большой номенклатурой и частой сменяемостью выпускаемой продукции, включая создание гибких автоматизированных производств.

Термин «робот», как известно, славянского происхождения. Его ввел известный писатель К. Чапек в 1920 г. в своей фантастической пьесе «R.U.R.» («Россумовские универсальные роботы»), где так названы механические рабочие, предназначенные для замены людей на тяжелых физических работах. Название «робот» образовано от чешского слова robota, что означает тяжелый подневольный труд.

Помимо роботов для тех же целей широкое применение получили манипуляторы с ручным управлением (копирующие манипуляторы, телеоператоры и т.п.) и с различными вариантами полуавтоматического и автоматизированного управления, а также однопрограммные (не перепрограммируемые) автоматические манипуляторы (автооператоры и механические руки). Все эти устройства являются предшественниками роботов. Появились они главным образом для манипулирования объектами, непосредственный контакт с которыми для человека вреден или опасен (радиоактивные вещества, раскаленные болванки и т. п.). Однако хотя появление роботов существенно сузило сферу их применения, эти простые средства механизации и автоматизации не потеряли своего значения. Все они сегодня вместе с роботами входят в общее понятие средств робототехники.

Наряду с внедрением в действующие производства роботы открывают широкие перспективы для создания принципиально новых технологических процессов, не связанных с весьма обременительными ограничениями, налагаемыми непосредственным участием в них человека. При этом имеется в виду как действительно очень ограниченные физические возможности человека (по грузоподъемности, быстродействию, точности, повторяемости и т. п.), так и требуемая для него комфортность условий труда (качество атмосферы, отсутствие вредных внешних воздействий и т. п.). Сегодня необходимость непосредственного участия человека в технологическом процессе зачастую является серьезным препятствием для интенсификации производства и создания новых технологий.

Роботы получили наибольшее распространение в промышленности и прежде всего в машиностроении. Предназначенные для этой цели роботы называют промышленными роботами (ПР). Не менее широкие перспективы имеют роботы в горнодобывающей промышленности, металлургии и нефтяной промышленности (обслуживание бурильных установок, монтажные и ремонтные работы), в строительстве (монтажные, отделочные, транспортные работы), в легкой, пищевой, рыбной промышленности.

Наряду с использованием в промышленности роботы применяются и в других областях народного хозяйства и человеческой деятельности: на транспорте (включая создание шагающих транспортных машин), в сельском хозяйстве, здравоохранении (протезирование, хирургия – стерильная, дистанционная, обслуживание больных и инвалидов, транспортировка), в сфере обслуживания, для исследования и освоения океана и космоса и выполнения работ в других экстремальных условиях (стихийные бедствия, аварии, военные действия), в научных исследованиях.

Применение роботов наряду с конкретным технико-экономическим эффектом, связанным с повышением производительности труда, сменности работы оборудования и качества продукции, является важным средством решения социальных проблем, позволяя освобождать людей от тяжелого, опасного и монотонного труда.

С самого начала своего зарождения и до настоящего времени образцом для робототехники являются возможности живых организмов и, прежде всего, конечно, человека, особенно его рук. Создаваемые сегодня роботы очень далеки по своим основным характеристикам (энергетическим, информационным, по управляемости, надежности, компактности и т. д.) от объектов живой природы. Поэтому живая природа для робототехники еще долго будет служить источником идей и образцом для заимствования.

Кроме того, существует серьезная проблема создания технических средств, заменяющих отдельные подвижные части организма человека, т. е. проблема протезирования. Наконец, в ряде применений средства робототехники должны действовать в органическом единстве с человеком. В связи с этими обстоятельствами также требуется знать, как организованы движения в живой природе и как они управляются. В настоящей главе даны сведения по этому вопросу применительно прежде к человеку и его главному манипуляционному средству – руке, излагаемые с позиций современной робототехники.

Человек совершает во внешней среде два вида движений – манипуляции и локомоции. Манипуляция (от французского слова manus – рука) – это движение рук при выполнении какой-либо работы. Локомоция (от латинских слов locus – место и motio – движение) – движение всего тела для осуществления перемещения во внешней среде. Человек выполняет его с помощью ног, но иногда использует и руки (ползанье, лазанье, плаванье).


1.1. Морфологическое описание СОД

На рис. 2.1 показана обобщенная функциональная схема системы управления движениями тела человека, в которую входят пассивная часть системы – скелет, ее активная (движущая) часть – мышцы, чувствительные устройства – рецепторы и информационно-управляющая система – центральная нервная система (ЦНС). Скелет (его часть, которая участвует в движении) представляет собой вместе с мышцами объект управления в виде подвижно соединенных костных звеньев, образующих с позиций механики многозвенные кинематические цепи, подобные манипуляторам роботов.

Основное назначение этих систем управления – поддержание позы, ориентация (на объекты внешней среды), перемещение тела в пространстве – локомоции и, наконец, манипуляции. Рассмотрим составные части схемы на рис. 2.1.

Рис.2.1. Функциональная схема системы управления движениями тела человека.

Нейроны. Это нервные клетки, являющиеся “элементной базой” рассматриваемых систем управления. Существует много типов нейронов, специализирующихся на восприятии внешней информации, ее преобразовании, хранении, передаче и, наконец, воздействии на мышцы и железы. В организме человека миллиарды нейронов, которые соединены в нейронную сеть, охватывающую все тело.

На рис 2.2 изображен нейрон. Он имеет несколько входов и выходов, на которые поступают сигналы от других нейронов через отростки тела нейронов – дендриты, и один разветвленный выход – аксон. Его соединения с дендритами других нейронов осуществляется через утолщения – синапсы.

Сигналы на входе и выходе – электрические импульсы; их интенсивность определяется частотой следования и величиной. Сигналы могут быть возбуждающими и тормозящими. Выходной сигнал является нелинейной функцией суммы входных сигналов, которые алгебраически складываются с различными весовыми коэффициентами. Эти коэффициенты могут быть заданы генетически или устанавливаться в процессе функционирования под действием других нейронов. При превышении суммарным входным сигналом порога нечувствительности нейрона последний возбуждается и генерирует выходной импульс, который распространяется по аксону.

Рис.2.2. Строение нейрона:

1 – дендриты; 2 – синапсы; 3 – аксон; 4 – аксонный холмик;

5- синапс другой клетки; 6 – сома (тело клетки).

В местах соединения аксона с дендритами – синапсах – происходит химический процесс преобразования выходного импульса во входные импульсы для этих нейронов. Кроме таких связей аксон-дендрит, в нейронной структуре существуют еще связи аксон-аксон и дендрит-дендрит. Это существенно увеличивает возможности обработки информации, т.к. количество синапсов на порядок больше числа нейронов.

Длина отдельных аксонов соизмерима с размерами тела человека (например, аксоны, идущие от спинного мозга до пальцев ноги). Один нейрон может иметь тысячи входов от других нейронов и сотни выходов через синапсы. Возбуждение по аксону передаются в виде электрических импульсов длиной примерно 1 мс со скоростью 50-100 м/с. После каждого возбуждения нейрону требуется определенное время для возвращения в исходное состояние. Это так называемый рефрактерный период, в течение которого происходит химическое восстановление соответствующего аксона после проведения им очередного импульса. Аксоны нейронов объединяются в пучки, образуя стволы или нервы.

На рис. 2.3 показана обобщенная схема нейронной системы управления движением, которая выполняет информационно-управляющие функции. Она обрабатывает информацию, получаемую от «органов чувств» (сенсорных систем), формирует и корректирует модель внешней среды, обеспечивая ее соответствие текущей ситуации, вырабатывает адекватные решения (реакции) в виде заданий на определенные действия и контролирует их выполнение.

Рис.2.2. Функциональная схема нейронной системы управления движениями.

Нейронная система состоит из последовательных слоев нейронов, которые реализуют уровни обработки информации. В рецепторах органов чувств осуществляется параллельная первичная обработка входной информации слоями сенсорных нейронов. Между рецепторами и мотонейронами, которые приводят в действие мышцы, находятся слои интернейронов (отсюда их название). Они включают слои нейронов-детекторов и командных нейронов. Между ними находятся еще модулирующие нейроны. Нейроны-детекторы послойно последовательно выявляют отдельные объекты, события, а затем по их сочетанию распознают ситуацию в целом. (Например, при распознавании букв вначале выделяются их отдельные части, а затем по сочетанию последних определяются сами буквы.)

Модулирующие нейроны устанавливают интенсивность реакции на внешнюю ситуацию. Она осуществляется воздействием синапсов этих нейронов на синапсы последующих нейронов-детекторов и задается верхними уровнями нейронной структуры, ответственными за общее функционирование организма и формирование основных стимулов поведения (оборонительные, пищевые и т. д.)

Командные нейроны задают через мотонейроны конкретную двигательную реакцию на ситуацию, определенную нейронами-детекторами. Она реализуется в результате возбуждения, передаваемого от соответствующей комбинации возбужденных нейронов-детекторов определенной совокупности командных нейронов, ответственных за эту реакцию. Совокупность возбужденных мотонейронов обеспечивает целостную поведенческую реакцию, адекватную выявленной ситуации. Командные нейроны образуют моторную кору головного мозга, которая охватывает все множество реакций организма на различные возможные ситуации.

Память, показанная на рис. 2.3, представляет собой нейронные слои, повторяющие слои нейронов-детекторов. Это память оперативная, наряду с ней существует постоянная память, в том числе и генетическая синаптическая. Извлечение информации из памяти – ассоциативное и связано с внешними ситуациями и реакциями на них.

В целом, топологически нейронные слои, начиная со слоев рецепторных нейронов и вплоть до командных нейронов моторной коры, образуют сужающиеся кверху колонки – «информационные единицы», каждая из которых ориентирована на совместное функционирование в конкретной ситуации.

Мышцы. Тело человека приводится в движение с помощью поперечнополосатых мышц. Их основу составляет так называемый анизотропный элемент (диск) в виде круглой пластинки размером в красное кровяное тельце. Под действием управляющего сигнала этот элемент резко сокращается (в течение около 1 мс). После этого для возврата в исходное состояние ему требуется примерно вдвое-втрое большее время. Таким образом, он представляет собой импульсный элемент с существенным мертвым временем.

Для создания длительного непрерывного изменения усилия соединенные в цепочку анизотропные элементы перемежаются изотропными элементами из упругой сухожильной ткани. Эти изотропные элементы играют роль амортизаторов, быстро растягиваясь при импульсном сжатии анизотропных элементов, а затем плавно возвращаясь в исходное состояние. Цепочки анизотропных и изотропных элементов образуют волокна. Из этих волокон, объединенных в пучки по 10-15 волокон, и состоит мышца.

В зависимости от быстродействия и развиваемого усилия различают три группы волокон:

быстро сокращающиеся и развивающие большое усилие, но быстро утомляющиеся волокна;

быстро сокращающиеся, но развивающие меньшее усилие, зато более выносливые волокна;

медленно сокращающиеся и развивающие небольшое усилие, но наиболее выносливые волокна.

В одном пучке могут находиться волокна разных типов. Время сокращения волокон лежит в пределах 10–200 мс, а развиваемое ими усилие – от 1 до 1000 Н.

Управление мышцей осуществляется специальными двигательными нейронами – мотонейронами. Каждому мотонейрону подчинены волокна одного типа, которые распределены по разным пучкам мышцы. Для этого к каждому пучку подходит отдельный аксон этого мотонейрона и его синапсы расположены на входящих в этот пучок волокнах данного типа. Объединенные таким образом по управлению однотипные волокна, принадлежащие одному пучку, называют двигательной единицей. В каждую двигательную единицу может входить от нескольких единиц до тысяч однотипных волокон.

Благодаря двигательным единицам, подчиненным одному мотонейрону в разных пучках мышцы, один мотонейрон может привести в действие всю мышцу, создав усилие, определяемое количеством и типом подчиненных ему волокон. При этом, чем тоньше совершаемые мышцей движения, тем меньшее число волокон приходят на один мотонейрон.

Усилие, развиваемое мышцей в целом, определяется общим количеством введенных в действие волокон, а необходимая плавность движения обеспечивается путем включения в действие в ходе выполнения движения все новых волокон.

Управление мышцей осуществляется сериями импульсов следующих от мотонейронов с частотой 50-200 импульсов в секунду. В зависимости от количественного соотношения входящих в мышцу волокон разных типов получаются соответственно мышцы разного типа от быстродействующих до медленнодействующих, но более выносливых.

Таким образом, в целом, поперечнополосатую мышцу можно представить как сложного состава двигатель, состоящий из большого числа (до нескольких тысяч) параллельно включенных элементарных импульсных двигателей – волокон, «конструктивно» объединенных в пучки, а по управлению – в двигательные единицы разного типа. Требуемое изменение во времени мышечного усилия обеспечивается при этом путем последовательного включения в определенные моменты времени различного числа двигательных единиц разных типов.

Мышца – это двигатель одностороннего (нереверсивного) действия, т.е. по внешнему сигналу она может только сокращаться, создавая усилие в одном направлении. Поэтому мышцы крепятся к костям по балансной схеме, образуя пары противоположно действующих мышц-антагонистов (рис.2.4). Когда одна из этих мышц, сокращаясь, осуществляет относительное перемещение костей в одном направлении, другая мышца растягивается, подготавливаясь к выполнению движения в противоположном направлении.

Рис.2.4. Крепление мышц-антагонистов:

1 – мышца-сгибатель; 2 – мышца-разгибатель.

Рецепторы. Это – чувствительные устройства, подразделяемые на внешние и внутренние в зависимости от источника собираемой ими информации. Основой их служат белковые молекулы. Под действием внешнего раздражителя они генерируют электрический потенциал, который преобразуется в электрические импульсы определенной частоты. Общее количество рецепторов у человека измеряется сотнями миллионов.

Внешние рецепторы – это, прежде всего, пять основных органов чувств (зрение, слух, осязание, обоняние, вкус), вестибулярный аппарат (в височной кости), который определяет положение тела в пространстве и ускорение, а также множество таких рецепторов, как расположенные в коже температурные рецепторы, рецепторы давления, болевые и др. У некоторых живых организмов имеются также рецепторы, чувствительные к магнитному и электрическому полями Земли.

Внутренние рецепторы (интеррецепторы) выдают информацию о состоянии двигательного аппарата. Они делятся на мышечные рецепторы растяжения, сухожильные и механорецепторы суставов и кожи. Мышечные рецепторы размещены в мышце и дают информацию о длине мышцы и скорости ее изменения, сухожильные – об усилии и скорости его изменения, суставные – о величине суставного угла, скорости и ускорении его изменения.

Мышечные рецепторы устроены следующим образом. В мышце помимо основных (силовых) мышечных волокон, называемых экстрафузальными, которые были рассмотрены выше, имеются мелкие (информационные) волокна, называемые интрафузальными. Длина этих волокон изменяется вместе с экстрафузальными волокнами и измеряется с помощью расположенных в них особых рецепторов, называемых мышечными веретенами. Информация от них передается затем в спинной мозг в виде величины отклонения длины мышцы от заданного ее значения («уставки»), полученного управляющими этой мышцей мотонейронами спинного мозга. Для определения этого отклонения наряду с основными мотонейронами, называемыми α-мотонейронами, имеются специальные мотонейроны – γ-мотонейроны, которые управляют интрафузальными волокнами по сигналам, поступающим на них одновременно с сигналами, идущими к α-мотонейронам.

Центральная нервная система. Устройство центральной нервной системы показано на рис.2.5, а ее состав дан на рис.2.6. Если некоторые части мозга имеют достаточно четкие границы, например, мозжечок, то другие постепенно переходят друг в друга.

Рис.2.5. Устройство центральной нервной системы:

1 – новая кора; 2 – гипоталамус; 3 – мозолистое тело; 4 – таламус; 5 – мозжечок;

6 – вестибулярные ядра; 7 – спинной мозг; 8 – продолговатый мозг; 9 – ретикулярная формация; 10 – варолиев мост; 11 – затылочная доля; 12 – теменная доля;

13 – центральная борозда; 14 – лобная доля; 15 – двигательная кора;

16 – соматосенсорная кора; 17 – зрительная кора; 18 – слуховая кора;

19 – обонятельная кора; 20 – мозжечок; 21 – ствол, мозга.

Рис.2.6. Состав центральной нервной системы.

Передний мозг состоит из конечного мозга и промежуточного мозга. В конечный мозг входят большие полушария, включая «новую кору», которая у человека превосходит всю остальную часть мозга и имеет толщину в 60–100 нейронов. Для того чтобы по мере своего развития она разместилась в черепе, в ней образовались складки (борозды). Соединены полушария мозолистым телом и другими нервными путями. В каждом полушарии различают четыре доли: лобную, височную, теменную и затылочную. В коре имеется сенсо-моторная область, которая состоит из связанных сенсорных областей (соматосенсорной, получающей информацию от внутренних рецепторов, зрительной, слуховой и обонятельной) и моторной области.

Входящая в конечный мозг лимбическая система объединяет информацию от отдельных органов чувств и играет важную роль в поведении, направленном на выживание (питание, чувство опасности, агрессивность, размножение). Находится лимбическая система под большими полушариями перед стволом мозга, как и промежуточный мозг, через который реализуются ее сигналы.

Промежуточный мозг включает таламус и гипоталамус. В таламусе осуществляется промежуточная обработка идущей к коре сенсорной информации (кроме обонятельной, которая обрабатывается в гипоталамусе) и части идущей обратно («вниз») моторной информации. Гипоталамус вместе с лимбической системой определяет эмоциональное и мотивационное поведение. (Кроме того, здесь контролируются биохимические процессы – солевой обмен, кровяное давление, дыхание, температура, водный баланс, чувства голода и насыщения, работа эндокринной системы.)

Ствол мозга управляет зрительными, слуховыми и двигательными рефлексами. Через ствол мозга проходят вверх и вниз пути, связанные с рефлекторной и двигательной деятельностью.

Ретикулярная формация ствола мозга, которая, вероятно, была когда-то высшим уровнем нервной регуляции, ответственна за выбор типа поведения (бежать от опасности или нападать и т. п.), регулирует чередование сна и бодрствования, обеспечивает устойчивость позы, т. е. компенсацию влияния силы тяжести.

Мозжечок вместе с варолиевым мостом образует задний мозг. Через них проходят информационные пути вверх и вниз. Кроме того, мозжечок обеспечивает координацию движений, поддерживает тонус и регуляцию мышц.

Продолговатый мозг является продолжением спинного мозга в черепе. Через него из спинного мозга вверх идет информация о положении частей тела и мышечном тонусе, а вниз – двигательные сигналы. (Кроме того, продолговатый мозг участвует в регуляции сердечно-сосудистой системы, дыхания, пищеварения, равновесия.)

Спинной мозг расположен в позвоночнике и разделен на сегменты, которые управляют отдельными частями тела. Для этого в каждом сегменте имеются сенсорные нервные клетки и управляющие мышцами мотонейроны. Сегменты соединены нервными волокнами, которые идут вверх и вниз вдоль спинного мозга.

Прежде чем перейти к рассмотрению взаимодействия частей мозга при управлении движением, рассмотрим, как осуществляется обработка информации от внешних рецепторов на примере зрительной и слуховой информации. На рис.2.7 приведена схема зрительной системы. Импульсы светочувствительных клеток сетчатки глаза (палочек и колбочек) предварительно преобразовываются двумя последующими слоями клеток сетчатки (ганглиозными клетками) и по зрительному нерву, образованному аксонами этих клеток, идут в мозг. Поступает зрительная информация в два адреса: во-первых, по более древнему пути – в средний мозг (тектум), где одна используется для ориентации (поворота головы, туловища и самих глаз); во-вторых, – через таламус, где осуществляется еще одна ее предварительная обработка, в зрительную область коры (в задней части головы). При хорошей освещенности скорость передачи зрительной информации, по-видимому, достигает 109 бит/с, т.е. выше, чем с телевизионного экрана.

Рис. 2.7. Схема зрительной системы:

1 – зрительная кора; 2 – хрусталик; 3 – сетчатка;

4 – зрительный нерв; 5 – верхнее двухолмие (тектум).

В результате предварительной обработки зрительной информации в сетчатке глаза ганглиозными клетками ее объем уменьшается на два порядка. Эта обработка имеет целью выявить те особенности внешней среды, которые наиболее существенны для формирования поведения и, в частности, оперативной реакции организма на различные изменения внешней среды. Так, например, у лягушки имеются четыре типа ганглиозных клеток, ориентированных соответственно на выявление границы света и тени, движущейся такой границы, темных мест и выпуклого края темного предмета («детектор насекомого»). Все эти признаки наиболее важны для лягушки при ловле насекомых и для укрытия от опасности. (Лягушка ловит только движущиеся цели определенных размеров, а от больших движущихся объектов убегает в тень). У других животных в соответствии с особенностью их поведения ганглиозные клетки специализированы на выявление других признаков. Например, у кошки, которая, охотясь, долго следит за своей жертвой, готовясь к прыжку, важную роль играют ганглиозные клетки, ориентированные на усиление контрастности изображения.

Ганглиозные клетки разных типов равномерно распределены по всей сетчатке. Аксоны каждого типа этих клеток идут к отдельному слою клеток в зрительной коре мозга, воспроизводя там уже не копию реальной внешней среды в виде поля распределения по сетчатке света и тени, а непрерывно получаемую от ганглиозных клеток пространственно-временную картину соответствующих признаков. У лягушки, например, в соответствии с количеством типов ганглиозных клеток сетчатки в мозгу имеются четыре слоя клеток, которые расположены так, что их точки, соответствующие одному месту сетчатки, расположены друг под другом. Однако, если у лягушки уже в глазу зрительная информация преобразуется в форму, готовую для выполнения на ее основе конкретных действий, то у более развитых животных полученная от глаз зрительная информация носит более обширный характер и требует последующей обработки. При этом представление о внешнем мире с позиций возможных реакций организма формируется на более высоком уровне на основе сопоставления зрительной информации с другими видами сенсорной информации. Уже у кошки в мозгу имеются специализированные слои клеток, выявляющие контуры объектов (как границы света и тени) и определяющих значения углов в местах изменения направления контурных линий.

Аналогично устроена слуховая система. Она включает два уха (с улиткой с чувствительными волосковыми клетками во внутреннем ухе), слуховой нерв, который идет к слуховой области коры с промежуточным преобразование (в нижнем двухолмии). Одновременно на втором более древнем пути информация от обоих ушей объединяется (в верхней оливе) для определения направления на источник звука.

Итак, мы рассмотрели устройство основных частей системы управления движениями человека, показанной на рис.2.1. С учетом изложенного на рис.2.8 эта система представлена в более подробном виде с выделением отдельных частей центральной нервной системы. На рисунке показаны три основных контура управления:

управление мышцами на основе внутренних обратных связей от внутренних рецепторов (толстые штриховые линии);

экстрапирамидный путь управления (толстые сплошные линии);

пирамидный (новый) путь (тонкая сплошная линия).

В последнем контуре для простоты не показан еще один сенсорный путь к новой коре, идущий через мозжечок и передний мозг.

Рис.2.8. Многоконтурная система управления движениями человека.

1.2. Функциональное описание СОД

1.5. Уровни управления движением

3.1.1. Динамические уровни управления движением

Система управления движениями тела человека является иерархической, и в ней можно выделить следующие пять уровней управления (рис.3.2):

стратегический уровень (принятие решений о выполнении определенных действий на основе мотиваций);

тактический уровень;

три динамических уровня (исполнение движений путем управления с использованием внешней информации, рефлекторного связанного управления несколькими звеньями тела, рефлекторного управления отдельными звеньями).

Начнем рассмотрение этих уровней снизу. Два нижних динамических уровня управления – это управление по жестким (врожденным) программам, т.е. это уровни рефлекторного управления. Осуществляются они через спинной мозг, но в них участвует и центральная нервная система в виде нижних отделов мозжечка (обеспечение тонуса мышц и позы) и переднего мозга (связанное программное управление).

Рефлекторное управление отдельным звеном (суставом). Контур управления одной мышцей (рис. 3.1), реализованный в сегменте спинного мозга, которому подчинен сегмент тела, содержащий эту мышцу, состоит из трех частей: слоя α- и γ-мoтoнeйpoнoв, управляющих мышцей, мотонейронного пула сенсорного слоя, связанного с внутренними рецепторами мышцы и сухожилий, и расположенного между ними слоя, осуществляющего обработку информации и запоминание готовых программ реакций на определенные воздействия. В простейшем случае эти промежуточные слои могут отсутствовать, и тогда мотонейроны замыкаются прямо на рецепторы.

Совокупность двух таких систем управления мышцами-антагонистами обеспечивает управление движением отдельного сустава. При этом устройства управления мышцами перекрестно связаны друг с другом сигналами позиционной обратной связи по длине мышцы: сигналы от этих рецепторов (мышечных веретен) сокращаемой мышцы помимо воздействия по цепи обратной связи на α-мотонейроны своей мышцы и, обеспечивая ее сжатие в соответствии с заданием, одновременно воздействуют с обратным знаком на α-мотонейроны мышцы-антагониста, снижая ее возбуждение, т.е. ослабляя ее сжатие и тем самым уменьшая противодействие сокращающейся мышцы. При подходе к заданному положению сустава, когда необходимо осуществить торможение, мышцы меняются ролями и на мышцу-антагонист подается сигнал на сокращение.

Рис.3.1. Спинномозговой рефлекторный путь управления одним звеном тела:

1 – мышца; 2 – вход; 3 – сегмент спинного мозга; 4 – сенсорный слой;

5 – слой обработки информации и памяти; 6 – мотонейронный пул; 7 – выход.

На рис. 3.2 в общем виде показана функциональная схема системы управления суставом.

Рис.3.2. Функциональная схема системы управления суставом:

К0, К1 ,К2 – устройства сравнения,

ПД0, ПД1 – пропорционально-дифференцирующие звенья,

Д2 – дифференцирующее звено.

Рефлекторное связанное управление несколькими звеньями тела. Это второй динамический уровень управления, который обеспечивает совместное целенаправленное движение звеньев одной или нескольких конечностей, причем без использования сенсорной информации о внешней среде, т.е. тоже в виде рефлекторного управления, как и управление отдельными звеньями.

Связанное управление двумя конечностями осуществляется путем управления со стороны одного сегмента спинного мозга определенными суставами обеих конечностей (внутрисегментарный рефлекс). Помимо сегментов спинного мозга в этом уровне управления участвуют наиболее древние области переднего мозга, в которых на основании информации от внутренних рецепторов, создается общая картина положения всех частей тела и вырабатывается двигательная реакция, которая подается в спинной мозг.

Этот уровень управления, в основном исполнительный, отрабатывает команды вышестоящих уровней. Однако имеются определенные типы движений, для которых этот уровень является самым верхним. Это, прежде всего, различные ритмичные движения, не требующие оперативной информации о внешней среде, а также поддержание позы и обеспечение мышечного тонуса. В последних случаях в управлении участвуют также нижние отделы мозжечка.

Управление с использованием внешней информации. Этот третий уровень управления ответствен за выполнение движений с использованием информации от внешних рецепторов. В нем участвуют все разделы головного мозга вплоть до самых молодых. При этом он реализуется двумя параллельными путями: через второй уровень управления и непосредственным воздействием со стороны коры больших полушарий (ее двигательной зоны) на сегменты спинного мозга.

Первый путь – это древний экстрапирамидный путь управления более сложными движениями, которые постепенно осваивались живыми организмами в процессе эволюции и для реализации которых требовалось привлекать все более сложную сенсорную информацию. На основе последней на этом уровне вырабатываются задания для второго уровня и затем оперативно корректируются в ходе их реализации.

Второй, пирамидный путь, возникший всего несколько миллионов лет тому назад, реализует наиболее совершенные и сложные движения, которые не удается выполнить первым путем на базе ранее освоенных рефлекторных движений.

В целом третий уровень ответствен за ориентацию во внешнем пространстве тела и органов чувств на объекты внешней среды, локомоции и манипуляции, а также на выполнение таких сложных движений, как, например, упражнения на гимнастических снарядах, метание предметов, жонглирование ими, копирующие движения (срисовывание и т.п.).

Примером ориентационных движений являются движения глаз с целью слежения за объектами внешней среды с учетом таких возмущений как перемещение этих объектов, движение тела, изменение положения головы, изменение параметров объектов (яркости, контрастности и т. п.). Эти движения осуществляются глазодвигательной системой, которая содержит три пары мышц-антагонистов.

Локомоции (ходьба, бег и т.п.), являясь периодическими движениями, реализуются на основе управления мышцами от своих «спинальных генераторов», которые синхронизированы друг с другом на том же сегментарном уровне. Необходимая адаптация к внешним условиям осуществляется прежде всего путем корректирования этих программных движений по сигналам от внутренних рецепторов. Вышестоящие уровни управления корректируют затем локомоции уже с учетом тех внешних условий движения, которые определяются внешними рецепторами, включая перемещение и изменение целей.

Манипуляционные движения отличаются наибольшей ролью в них внешних рецепторов и мотиваций. В коре больших полушарий головного мозга имеются места (сенсомоторная кора), за которыми закреплены определенные сегменты тела и которые осуществляют управление их мышцами на основе получаемой внешней и внутренней информации. Площадь этих мест тем больше, чем сложнее задача управления соответствующим сегментом тела.

В целом все динамические уровни управления движением, действуя совместно, реализуют требуемые движения в виде комбинации следующих трех составляющих:

грубые и быстрые рефлекторные (программные) движения без обратной связи по внешней информации (первый и второй уровни);

такие же стереотипные движения, но комбинируемые и корректируемые в функции от внешней информации (экстрапирамидный путь третьего уровня);

наиболее тонкие и точные движения, выполняемые непосредственно в функции от текущей внешней информации (пирамидный путь третьего уровня).

Последний вариант управления требует максимального участия головного мозга и используется только в тех случаях, когда заданное движение не удается свести к рефлекторным. Кроме того, в случае необходимости он резервирует предыдущие варианты, а также участвует в отработке новых программ (формирование новых рефлекторных дуг) наряду с экстрапирамидным путем. Такой процесс обучения можно представить следующим образом. Вначале требуемое новое движение многократно осуществляется путем управления мышцами непосредственно от высших двигательных центров. Одновременно запоминаются и усредняются синтезированные при этом управляющие воздействия на отдельные мышцы. В результате формируется готовая двигательная реакция на задание сверху и, соответственно, верхние уровни освобождаются от управления отдельными мышцами, передавая эту функцию нижним уровням. Эти вновь приобретенные в порядке обучения программы хранятся и реализуются третьим уровнем управления.

Описанное трехуровневое управление движениями наряду с такими очевидными достоинствами, как максимальное быстродействие реакций (отдернуть руку и т. п.), возможность обучения и разгрузка вышестоящих уровней для решения наиболее сложных задач, имеет и определенные недостатки. При таком управлении движения зачастую получаются неоптимальными и не используются все возможности двигательной системы организма.

Управление мышцами непосредственно сверху позволяет не только получать лучшее качество движений, но и осуществлять принципиально новые типы сложных движений, не реализуемых с помощью экстрапирамидного пути, где этому препятствует набор врожденных и приобретенных стереотипных программных движений. Именно поэтому часто при освоении новых типов движений на производстве и в спорте главным препятствием является преодоление ранее сложившихся рефлекторных движений. (Известно, как трудно двумя руками одновременно выполнять различные движения, хотя «технические» возможности рук явно это позволяют).

3.1.2. Тактический уровень управления движением

На этом уровне составляется план достижения той очередной цели, которая определяется для него вышестоящим стратегическим уровнем управления. Отсюда этот план в виде конкретного алгоритма движений с выделением тактических подцелей и последовательности их достижения спускается для реализации на динамические уровни. Со стороны тактического уровня осуществляются непрерывный контроль и в случае необходимости оперативная корректировка заданных алгоритмов при изменении реальной ситуации. Реализуется этот уровень корой больших полушарий головного мозга (ее ассоциативными областями), т. е. в полной мере он свойствен лишь человеку и только у самых высших животных существует в зачаточном состоянии.

Тактические подцели, которые намечаются на этом уровне и под его руководством реализуются, требуют осмысленных движений. К ним относятся прежде всего движения с предметами для воздействия на внешнюю среду с целью ее изменения нужным и заранее спрогнозированным образом. Примерами подобных действий могут быть такие производственные операции с применением орудий труда, как сварка, сборка, а также вязание спицами, работа хирурга, письмо. Такими же осмысленными действиями, но без предметов являются, например, массаж и речь.

Тактический уровень – это высший уровень управления для подобных целенаправленных движений, реализующий их путем разбиения на более простые движения, которые затем уже «бездумно» исполняются нижними исполнительными уровнями. В зависимости от того, какая при этом необходима информация, управляющие воздействия с тактического уровня поступают на различные нижние уровни. Например, движения хирурга, поскольку требуется зрительная информация, реализуются через третий уровень динамического управления, вязание спицами, где необходима только внутренняя информация, – через второй уровень, а письмо – в значительной степени прямо через первый уровень.

Для выбора тактики достижения заданной сверху цели и составления соответствующего плана действий необходимо знать внешнюю обстановку и состояние организма. Этому служат модели внешней среды и самого тела в ней, которые формируются и непрерывно корректируются на основе всей полученной сенсорной информации. При этом для каждой конкретной цели, заданной сверху (со стратегического уровня), эти модели преобразуются, ориентируясь на эту цель путем выделения наиболее существенных для ее достижения особенностей и деталей.

Используемая на этом уровне информация перерабатывается таким образом, что содержит уже не количественные, а обобщенные качественные характеристики объектов, т.е. здесь применяется не метрика предметов и действий с ними (размеры, расстояния, масса и т. д.), а их топология и понятия (буква, стул и т. п.).

Ранее было описано, как происходят отображение и последовательное преобразование зрительной и другой сенсорной информации слоями нейронов в соответствующих сенсорных областях коры с целью выделения наиболее существенных для данной задачи объектов и признаков. Эти многослойные отображения являются моделями среды и тела, основанными на определенном виде сенсорной информации. В слоях ассоциативных областей коры производятся целенаправленные увязанные преобразования этих моделей с переходом от непосредственных чувственных образцов к более абстрактным. В ходе составления тактического плана достижения поставленной конкретной цели его варианты «проигрываются» на модели среды и тела, а после выбора окончательного плана составляется прогнозируемая модель будущего состояния среды и тела. Когда в процессе выполнения плана возникают расхождения с прогнозом, на тактическом уровне осуществляется оперативная корректировка плана.

Как ранее было отмечено, уровень тактического управления ответствен за целенаправленные осмысленные движения. Однако это не означает, что все такие движения осуществляются сознательно по непосредственным командам головного мозга. Наоборот, для этого уровня характерно стремление к максимальной автоматизации движений на основе обучения, в том числе с помощью сознательно выполняемых упражнений и тренировок. При составлении планов выполнения очередной задачи прежде всего используется весь имеющийся в памяти врожденный и приобретенный опыт решения аналогичных задач в сходных ситуациях в виде готовых алгоритмов действий.

3.1.3. Стратегический уровень управления движением

Это высший уровень во всей иерархической системе управления движением. Здесь определяются цели и осуществляется контроль за их реализацией, включая оперативную корректировку этих действий и самих целей в зависимости от эффективности процесса их достижения. После завершения действий здесь же оцениваются достигнутые результаты. Этот уровень и сам непосредственно участвует в реализации наиболее сложных и новых движений. Примерами их являются речь, письмо.

Выбор целей поведения определяется потребностями, их сравнительной важностью, и возможностями их удовлетворения. Потребности проявляются в виде чувств – биологических и социальных, врожденных и приобретенных, инициированных извне или возникших в самом организме (голод, опасность, продолжение рода, любопытство, свободолюбие, справедливость и т.д.). Предельно сильным проявлением чувства являются эмоции (гнев, ужас, восторг и т.п.).

Существующие в данный момент потребности поступают в виде чувств в ассоциативные области коры больших полушарий головного мозга из лимбической системы в качестве мотиваций последующих действий. Там из них выбирается важнейшая, т. е. принимается решение о ближайшей цели поведения, которая затем реализуется через подчиненные уровни управления движением.

Процедуру выбора доминирующей мотивации можно представить следующим образом. Сигналы об отдельных потребностях вызывают из памяти в ассоциативные области коры соответствующие алгоритмы действий, направленные на их удовлетворение. Последние представляют собой возбужденные зоны нейронных слоев, которые отображают соответствующие управляющие воздействия на нижележащие уровни управления. Из всех этих порой противоречивых вариантов управления, возбужденные зоны которых при этом взаимно тормозят друг друга, пробивает дорогу вниз к реализации тот вариант, которому соответствует наиболее мощная, т.е.доминирующая над другими, возбужденная зона. Таким образом, выбор доминирующей мотивации осуществляется как бы голосованием нейронов ассоциативной области коры. Например, при внезапном обнаружении какой-либо серьезной опасности вызванное ею возбуждение, в том числе, возможно, сразу от нескольких органов чувств, подавит все другие потребности (чувства) и переключит действие организма на соответствующую этой новой эмоции реакцию (бежать, принять угрожающую позу и т.п.).

Пока в ассоциативной области доминирует определенная возбужденная зона, эта зона является временным центром управления поведением организма до удовлетворения соответствующей основной потребности или до подавления этого центра появившейся более обширной зоной возбуждения, требующей других действий. При оценке степени достижения поставленной цели критерием оптимальности является чувство удовлетворения соответствующей основной потребности. На стратегическом уровне выбранная основная цель обычно разбивается на отдельные подцели, которые последовательно по мере их достижения выдаются на тактический уровень как самостоятельные цели. Работа тактического уровня, как упоминалось ранее, начинается каждый раз с формирования моделей среды и организма, ориентированных на спущенную очередную цель, и с высвобождения из памяти отработанных ранее соответствующих планов действий, в которых эта цель в свою очередь разбивается на более мелкие тактические подцели.

Эффективность работы стратегического уровня как наивысшего в иерархии управления действиями организма характеризует уровень его интеллекта в целом. Она определяется степенью оптимальности принимаемых решений, учета при этом различных факторов, способных влиять на эти решения, и длительностью охватываемого периода времени. Интеллектуальные возможности организма обусловлены прежде всего объемом памяти и эффективностью ее использования. В памяти – все знания и навыки, сама личность человека.

На рис.3.3 дана общая функциональная схема иерархической системы управления движениями человека. Здесь, в частности, показаны прямые управляющие воздействия сверху вниз, минующие отдельные промежуточные уровни (пирамидный путь), каналы обратной связи, идущие вверх на входы отдельных уровней управления, и воздействия на модели среды и тела со стороны стратегического и тактического уровней, осуществляющие управление этими моделями для подстройки их под очередную конкретную задачу и для прогнозирования результатов планируемых действий.

Завершая рассмотрение этой системы управления, еще раз подчеркнем, что каждый уровень реализует порученную ему операцию путем разбиения ее на более мелкие типовые операции, находящиеся в арсенале следующего уровня, и последовательной выдачи ему соответствующих команд. Наряду с таким последовательным иерархическим процессом управления здесь, во-первых, осуществляются, как уже упоминалось, прямые воздействия сверху с пропуском отдельных промежуточных уровней, а, во-вторых, отдельные реакции организма на внешние и внутренние возмущения реализуются без участия верхнего уровня определенным промежуточным уровнем в соответствии с его специализацией. Таким образом, все уровни управления в действительности работают как последовательно, так и параллельно, дополняя и резервируя друг друга.

Важными особенностями материальной реализации рассмотренной системы являются ее многоканальность и избыточность. Получение информации, ее обработка, запоминание и преобразование в мышечные усилия осуществляются по тысячам и миллионам параллельно действующих каналов из послойно построенных ансамблей нейронов. Эта информация носит вероятностный характер, как и состав обрабатывающих ее ансамблей нейронов, который сам определяется этой информацией. (При этом от слоя к слою каждый вид информации – зрительная, акустическая, температурная и т.п.– передается тактированно с распределением ее по слою в соответствии с пространственным размещением отображаемых ею объектов в реальной среде.) Такой принцип параллельной обработки сигналов обеспечивает системе в целом необходимые быстродействие и надежность, недостижимые пока в технических системах.

Рис.3.3. Общая функциональная схема иерархической системы

управления движениями человека.

1.6. Интеллект и творчество

Рассмотренные ранее функции головного мозга по оценке ситуаций и принятию решений, как уже отмечалось, относятся к интеллектуальной мыслительной деятельности человека. В общем виде интеллект определяется как способность приобретать и целенаправленно использовать знания.

Мышление – это пространственно-временной процесс, который совершается в коре и подкорке головного мозга в виде волн активации и торможения. В мозгу есть зоны с фиксированными функциями (обработка сенсорной информации, речь и др.), однако процесс мышления, как и память, охватывает весь мозг. При этом память включает врожденную (генетическую) информацию и приобретаемую благодаря собственному опыту в процессе жизни, и обучения в целом. Стимулы, мотивация или, наоборот, торможение мышления определяются эмоциями.

Основа мышления – это стереотипы (безусловные и условные рефлексы) и ассоциации. Отклонение внешней ситуации от комбинаций стереотипов является мотивом для того, чтобы «задуматься» и осуществить корректировку стереотипных реакций. Это процесс обучения. Параллельно идет процесс «борьбы» врожденного творческого начала со стереотипным (догматическим) мышлением и различными запретами (психологическими, социальными, профессиональными и т. п.).

Как известно, головной мозг, включая все рассмотренные его отделы, разбит на два полушария. Правое полушарие оперирует образной информацией, а левое – символьной. В ходе эволюции вначале возникло образное представление о мире на основе сенсорной информации, то же происходит и в процессе развития ребенка. Затем в результате процесса ее обобщения (классификация объектов, абстрагирование) возникает более обобщенное символьное (знаковое) представление о мире с переводом его в слова сначала внутреннего языка, а затем и языков общения во внешнем мире.

Мышление у человека возникло из видения внешнего мира, письменность – из изображения его объектов. У первобытных людей процесс развития мышления начался с наскальных рисунков отдельных объектов (зверей, людей), затем сцен (охоты, ритуалов и т. п.) и целых рассказов в виде последовательности таких рисунков. Примерно с IV тысячелетия до н. э. интенсифицировался процесс упрощения и стилизации изображений предметов; появилось рисуночное письмо – пиктограммы (клинопись на глиняных пластинах у шумеров, иероглифы в Египте и Китае) и, наконец, буквенное письмо, а затем и фонетическое буквенное, позволяющее произносить написанное (появились буквы и их комбинации, выражающие определенные звуки речи). У новорожденного оба полушария функционируют одинаково, и только постепенно левое полушарие берет на себя функцию логического анализа объектов и ситуаций внешней среды, специализируясь на символьном представлении информации. После этого оба полушария начинают работать поочередно: когда одно активизируется, другое притормаживается. В правом полушарии осуществляется обработка сенсорной информации, включая распознавание образов внешнего мира и построение соответствующей его модели. Левое полушарие отвечает за логическое мышление, языковую и другую знаковую информацию и речь. В нем формируется языковая модель мира. В каждом полушарии существует и своя модель двигательных действий (реакций).

Память правого полушария хранит представления о предметах и явлениях внешнего мира, а левого – понятия, знания, семантику языка. Все это объединено ассоциативными связями. Справа делается оценка по близости, по месту, по времени; слева– по сходству абстрактных логических признаков. Правая память позволяет быстро узнавать объекты, а левая оценивать их свойства и экстраполировать ситуации. Запоминание в правом полушарии чаще непроизвольное, а левом – осознанное.

В правом полушарии содержится эмоциональная память, которая определяет личное отношение к ситуациям. Прежде всего, это эмоции, ориентированные на самосохранение и обеспечивающие предельно быструю реакцию на опасность.

Обе модели мира взаимосвязаны. Точки одного полушария соединены с соответствующими точками другого, связывая образную и словесную информацию об одних и тех же объектах и явлениях.

Таким образом, процесс мышления включает две фазы– образную («правую») и логическую («левую»). В «правой» фазе мышление осуществляется в виде конкретных операций с образами реальных объектов или с их более абстрактными изображениями, а в «левой» – путем вскрытия логических отношений вне времени и пространства. При этом в процессе мышления происходит циклическая передача решаемой задачи от одного полушария к другому с соответствующим торможением первого и активацией второго. Каждое полушарие, принимая задачу, продолжает ее решение в соответствии со своей моделью мира до исчерпания своих возможностей, после чего возвращает ее другому полушарию.

Наиболее обобщенный оператор «правого» мышления – это образная и чувственная идея. Для ее передачи в левое полушарие необходимо ее символьное (языковое) описание. «Левое» мышление включает такие логические операции, как анализ, синтез, обобщение.

Инициатором очередного мыслительного процесса может быть любое из полушарий: правое – в виде эмоциональной выдачи какой-то задачи (цели) левому полушарию или начала по той же причине собственного подсознательного интуитивного процесса, левое – как результат сознательно сформулированной задачи. Например, это может быть задача обучения какому-либо техническому приему. Сначала в этом процессе будет доминировать левое полушарие, сознательно управляя движением тела, а затем эти движения перейдут в стереотип правого полушария.

Особый вид мыслительной деятельности, ее высшую форму, представляет процесс творчества. В основе творчества лежит интуиция. Поэтому творческие возможности связаны, прежде всего, не с эрудицией, т. е. не с левым полушарием мозга, а с воображением, т. е. с правым полушарием, со способностью преодолевать стереотипы и оригинально, нестандартно мыслить. Хотя творческие способности можно развить и эффективному их использованию – научиться, в их основе лежат прежде всего врожденные качества личности. Поэтому психологи отделяют творческие способности (креативность) от интеллекта. Их связь сводится к одному: для творчества необходим определенный уровень интеллекта, однако последний не предопределяет творческие возможности.

Творческое начало лежит в основе всех видов человеческой деятельности, включая, прежде всего, искусство, науку и технику. И везде оно явится самым загадочным, неконтролируемым и тем более не поддающимся планированию интуитивным процессом. При этом в каждой сфере человеческой деятельности творческий процесс имеет свою существенную специфику. Так, если в искусстве результат творчества всегда субъективен и неотделим от личности автора, то в науке он объективен и не зависит от личности, так как отражает закономерности природы. (В отличие от произведений Шекспира законы, получившие имя Ньютона, неизбежно были бы открыты и без Ньютона.) И если ученый должен во всем сомневаться, но зато быть совершенно и доказательно уверен в результатах своей деятельности, то истинный инженер-творец, наоборот, может быть уверен в положительном результате очередной разработки, но будет полон сомнений и даже желания все сделать по-новому по ее завершении. Если специалистов с такими подходами к делу и настроем поменять местами, то бывший инженер ничего не откроет в науке, а ученый не создаст в технике. Исключением, которое только подтверждает это правило, являются очень близкие друг другу ученые-организаторы и инженеры-создатели принципиально новой техники. Такие уникальные личности неизбежно носят в себе противоречие, конфликт между этими двумя началами, который все время требует мучительных компромиссов. Изобретательство находится где-то между наукой, как его базой и искусством, с которым его роднит личностный характер результатов творчества.

Всякий творческий процесс является многоэтапным. Подсознательная составляющая творчества является только одним из этапов этого процесса, который включает в целом и этапы сознательной деятельности, охватывая, таким образом, оба полушария головного мозга и представляя собой как бы диалог сознания с подсознанием. Процесс творчества начинается с сознательного этапа, на котором формулируется задача и делаются попытки ее решения формальными методами. Этот этап запускает следующий уже подсознательный процесс интуитивного поиска решения в виде перебора различных комбинаций и сочетаний в случайном беспорядке образов подсознания, в котором основное значение имеют аналогии и ассоциации.

Что касается критериев отбора решений, то основанием для их извлечения из подсознания является, по-видимому, эстетическое чувство гармонии, красоты решения. Так, по крайней мере, объясняли этот процесс многие великие творческие личности – Гаусс, Гельмгольц, Ламартин, Пуанкаре и др. (Стоит вспомнить критерий А. Н. Туполева при оценке новых самолетов: «Самолет должен быть красивым».)

После подсознательного, собственно творческого этапа должен следовать завершающий этап сознательной формулировки найденного решения и обязательной проверки, т. е. доказательства его правильности Основные средства здесь – эксперимент и математика. (В последнем случае математика выступает только как язык науки, а для понимания реальных процессов нужны понятия самой науки – сила, энергия, информация и т. д.)

В заключение необходимо отметить следующее. Ранее была рассмотрена интеллектуальная деятельность отдельного человека. Однако человеческий интеллект – прежде всего продукт развития всего человечества, а личный опыт – это лишь небольшое дополнение к нему, которое в лучшем случае может добавить некоторую крупицу к общечеловеческим знаниям и сохраниться в них.

1.3. Моделирование СОД

1.4. Техническая реализация СОД

2.2.1. Классификация приводов

Привод, как известно, включает, прежде всего двигатель и устройство управления им. Кроме того, в состав привода могут входить различные механизмы для передачи и преобразования движения (редукторы, преобразователи вращательного движения в поступательное и наоборот), тормоз и муфта.

К приводам, применяемым в роботах, предъявляют весьма жесткие специфические требования. В связи с необходимостью встраивания приводов в исполнительные системы робота – в манипуляторы и системы передвижения габариты и масса приводов должны быть минимальными. Приводы в роботах работают в основном в неустановившихся режимах и с переменной нагрузкой. При этом переходные процессы в них должны быть практически неколебательными. Важными параметрами приводов роботов являются также надежность, стоимость, удобство эксплуатации. Требования, предъявляемые к их способу управления, быстродействию и точности, непосредственно определяются соответствующими требованиями к роботу в целом. В частности, обычно требуется, чтобы скорость поступательного движения на выходе приводов роботов в среднем составляла от долей до нескольких м/c при погрешности отработки перемещения в долях миллиметра.

В роботах нашли применение практически все известные типы приводов: электрические, гидравлические и пневматические; с поступательным и вращательным движением; регулируемые (по положению и скорости) и нерегулируемые; замкнутые (с обратной связью) и разомкнутые; непрерывного и дискретного действия (в том числе шаговые).

На рис. 2.9 приведена типовая схема привода манипулятора. Наряду с общей обратной связью по положению в схеме имеется обратная связь по скорости, которая играет роль корректирующей гибкой обратной связи и часто, кроме того, служит для управления скоростью. В тех случаях, когда механизм М является редуктором и понижает скорость, датчик скорости ставится не как показано на рисунке, а на выходе двигателя перед механизмом, чтобы увеличить снимаемый с датчика сигнал то скорости. Устройство управления может быть непрерывного действия, релейным, импульсивным или цифровым.

Рис. 2.9. Типовая схема приводов манипуляторов:

Д – двигатель, М – механизм передачи и преобразования перемещения,

ДП, ДС – датчики положения и скорости,

УУП, УУП1, УУП2 – устройство управления и две его части

Применение пневматических приводов в робототехнике объясняется их дешевизной, простотой и соответственно надежностью. Правда, эти приводы плохо управляемы и поэтому используются в основном как нерегулируемые с цикловым управлением. Пневматические приводы применяют только в роботах небольшой грузоподъемности – до 10; реже 20 кг.

Гидравлические приводы наиболее сложны и дороги по сравнению с пневматическими и электрическими. Однако при мощности 500-1000 Вт и выше они обладают наилучшими массогабаритными характеристиками и поэтому являются основным типом привода для тяжелых и сверхтяжелых роботов. Гидравлические приводы хорошо управляются, поэтому они нашли также применение в роботах средней грузоподъемности, когда требуются высококачественные динамические характеристики.

Электрический привод, несмотря на его хорошую управляемость, простоту подвода энергии, больший КИД и удобство эксплуатации имеет худшие массогабаритные характеристики, чем пневматический и гидравлический приводы. Прогрессивное увеличение в последние годы доли электромеханических роботов в общем парке роботов в мире вызвано быстрым прогрессом в создании новых типов электрических двигателей, специально предназначенных для роботов и позволяющих создавать более компактные комплектные приводы всех требуемых типов. Основная область применения электрических приводов в робототехнике на сегодняшний день – это роботы средней грузоподъемности (десятки килограмм), легкие роботы с высококачественным управлением и мобильные роботы.

Для иллюстрации сказанного на рис. 2.10 и 2.11 приведены обобщенные сравнительные характеристики различных типов приводов по удельной мощности и стоимости. При расчете удельной мощности пневмоприводов учитывалась масса аппаратуры подготовки воздуха, а гидроприводов – масса гидростанции, которые входят в конструкцию роботов.

Рис.2.10. Удельная мощность (отнесенная к весу) электрических Э,

гидравлических Г и пневматических П приводов в зависимости

от их абсолютной мощности.

Рис.2.11. Стоимость электрических Э, гидравлических Г

и пневматических П приводов в зависимости от их мощности.

2.2.2. Искусственные мышцы

Важным бионическим направлением в робототехнике является создание приводов типа искусственная (техническая) мышца. Современные приводы, применяемые в робототехнике, по своим массогабаритным параметрам на порядок уступают поперечно-полосатым мышцам животных и человека. Учитывая, что параметры приводов в значительной степени предопределяют массогабаритные и энергетические характеристики роботов в целом, это определяет интерес к проблеме создания технических аналогов таких мышц.

Одна из очевидных причин неудовлетворительных массовых параметров современных приводов по сравнению с мышцами – это применение в них металлов, особенно ферромагнитных в электрических двигателях. Поэтому первыми разработками приводов, получивших название искусственная мышца, были пневматические приводы, в которых цилиндр с поршнем заменялся эластичной трубкой (резина, полимеры) в оплетке крест-накрест (нейлон). При подаче в трубку воздуха под давлением оплетка заставляет трубку раздуваясь сокращаться на величину до одной трети длины, имитируя работу мышцы. Такие приводы имеют в 3-4 раза меньшую массу, чем пневматические цилиндры на ту же мощность, и поэтому они получили применение, в частности, при протезировании конечностей. Источником сжатого газа при этом служат обычно одноразовые баллончики.

На рис. 2.12 показано устройство реверсивного привода такого типа, примененного в промышленном роботе «Софтарм» фирмы «Бриджестоун» (Япония). Устройство состоит из двух пневматических приводов одностороннего действия. При повышении давления в одном из них и одновременном понижении на ту же величину в другом первый привод сокращается, а второй удлиняется. В результате через трос происходит поворот блока, который связан со звеном манипулятора. Угол поворота блока практически прямо пропорционален разности давлений в приводах. Грузоподъемность шарнирного манипулятора с пятью степенями подвижности робота «Софтарм» – 3 кг при массе 5,5 кг. Погрешность позиционирования – 1.5 мм.

Рис.2.12. Реверсивный гибкий пневматический привод фирмы «Бриджестоун»:

1 – гибкий пневматический привод; 2 – трос; 3 – блок.

На рис.2.13 показан вариант пневматической искусственной мышцы, в которой газ под давлением получается непосредственно в самой трубке в результате нагрева электрическим током. При прохождении электрического тока по термоэлементу 3 наполнитель 4 нагревается и выделяет газ. В результате внутри трубки повышается давление и она, раздуваясь, сокращается по длине. После отключения тока наполнитель охлаждается, вновь поглощая выделившийся газ, и мышца приходит в исходное состояние.

Рис.2.13. Сорбиционная искусственная мышца:

1 – хордовая оболочка; 2 – эластичная трубка;

3 – термоэлемент; 4 – наполнитель; 5 – электрические выводы.

Длина мышцы – 150-300 мм, диаметр 3-5 мм. Величина сокращения – 10-15 %. Развиваемое усилие – 1-3 Н, при массе мышцы – единицы грамм. Главный недостаток этой мышцы – очень низкое быстродействие: время сжатия больше 30 с, а обратного расслабления еще в 2-3 раза больше. Другой вариант подобной пневматической мышцы с тепловым воздействием – заполнение трубки легкокипящей жидкостью с воздействием на нее внешним источником тепла.

Разновидностью пневматических искусственных мышц являются аналогичные устройства с заменой оплетки продольными тяговыми нитями. Такие конструкции имеют лучшие тяговые характеристики и развивают большие усилия. Еще большие тяговые усилия можно получить при замене газа жидкостью под давлением, т.е. при переходе к гидравлическим искусственным мышцам. Кроме того, такие гидравлические искусственные мышцы обладают более высокой точностью позиционирования и лучшей динамикой как все гидравлические приводы по сравнению с пневматическими.

Наряду с описанными пневматическими и гидравлическими приводами типа искусственная мышца существуют близкие им эластичные приводы, в которых работа совершается за счет изгибных деформаций эластичных полостей. Однако поскольку в этом случае используется деформация не сжатия как у мышц, а изгиба эти приводы формально не относятся к искусственным мышцам. В среднем описанные пневматические и гидравлические искусственные мышцы по сравнению с аналогичными традиционными приводами (цилиндрами) в 3 раза легче, в 2 раза меньше по габаритам и развивают в десятки раз большее усилие на единицу веса.

Кроме реализованных в конкретных конструкциях типов пневматических и гидравлических искусственных мышц в мире ведутся интенсивные исследования и разработки искусственных мышц, основанных на других физических принципах. Наиболее близки к рассмотренным устройствам разработки электромагнитных и электростатических искусственных мышц.

Электромагнитная искусственная мышца состоит из многовитковой обмотки, сжатой в жгут, в котором проводники с электрическим током противоположного направления прижаты друг к другу. При пропускании по ним тока они вследствие электромагнитного силового взаимодействия расходятся в поперечном направлении. В результате длина жгута сокращается подобно описанному выше сокращению пневматических и гидравлических мышц.

Один из первых вариантов электростатической искусственной мышцы представляет собой цилиндр, по оси которого расположен центральный электрод, а по образующим цилиндра – соединенные друг с другом гибкие периферийные электроды. При подаче на центральный и периферийный электроды электрического потенциала возникает электрическая сила, которая отталкивает периферийные электроды от центрального. В результате периферийные электроды изгибаются, вызывая сокращение мышцы. Другой вариант электростатической мышцы представляет собой столбик, составленный из тонких металлических дисков (пленок), разделенных упругими изолирующими прокладками. Все нечетные и все четные диски соединены друг с другом. При подаче на них электрического напряжения разной полярности диски сближаются, сжимая изолирующие прокладки, и мышца сокращается. Вместо изолирующих прокладок может быть использован газ.

В последнее время значительные успехи достигнуты в разработке электростатических искусственных мышц из полимеров, деформирующихся в электрическом поле. Так, силиконовые и акриловые пластины толщиной в десятки мкм под действием напряжения в несколько кВ расширяются перпендикулярно полю более чем вдвое, создавая усилия в десятки Н. линейный привод типа искусственная мышца, выполненный из такой пленки, покрытый с двух сторон эластичными электродами, представляет собой цилиндрическую пружину, покрытую этой пленкой. При приложении к пленке электрического напряжения цилиндр удлиняется.

Аналогичные приводы создаются на основе ионных полимеров и полимерно-металлических композитных материалах. В электрическом поле молекулы этих материалов ионизируются и испытывают механические силы, которые вызывают деформацию (изгиб) материала в направлении, перпендикулярном градиенту электрического поля. На этом принципе был создан, в частности, пятипальцевый схват для манипуляторов.

Разрабатываются также искусственные мышцы на базе различных искусственных волокон, деформируемых под действием химических реагентов. Для всех их характерным является низкое быстродействие (секунды) и величины хода (деформации) порядка 10-15%. Общим достоинством всех предложенных приводов типа искусственная мышца является в несколько раз лучшие массогабаритные параметры по сравнению с традиционными приводами.

2.2.3. Микроприводы

Развитие микроробототехники в первую очередь потребовало создания соответствующих микроприводов. Для этого наряду с традиционными принципами действия и конструкциями, созданными в рамках традиционного точного машиностроения, были разработаны совершенно новые приводы для микроперемещений, основанные на использовании управляемых гибких деформаций. Одним из таких перспективных типов микроприводов являются пьезоприводы. На рис. 2.14, а показана схема основного элемента такого привода – пьезопреобразователя электрической энергии в энергию механического перемещения. Он представляет собой пакет из пьезокерамических шайб 1 с нанесенными на торцы серебряными электродами, на которые параллельно подается электрическое напряжение. При этом за счет обратного пьезоэлектрического эффекта происходит увеличение или уменьшение толщины шайб в зависимости от полярности приложенного напряжения. На рис. 2.14, б показан другой тип таких преобразователей, основанный на изгибных деформациях многослойных пластин из пьезоэлектрических и пассивных металлических или полимерных слоев. Такие преобразователи имеют больший ход, чем использующие деформацию расширение-сжатие, но худшие точностные и силовые параметры.

Величина перемещения на выходе таких электромеханических преобразователей (ход) – до десятых долей мм; скорость – до 1–2 м/с, погрешность управляемого позиционирования – доли мкм, усилие – сотни Н, мощность – десятки Вт. Из таких преобразователей создаются трехстепенные микроманипуляционные системы. Они часто комбинируются с обычными электромеханическими манипуляционными системами, обеспечивающими перемещение в десятки мм с погрешностью, перекрываемой микроманипуляционной системой. Получается манипулятор, состоящий из последовательно соединенных систем грубого и точного позиционирования, рабочий ход которого определяется первой системой, а точность – второй.

Рис. 2.14. Пьезоэлектрические преобразователи микроприводов:

а – с поступательной деформацией растяжение-сжатие:

1 – секция пьезокерамических шайб, 2 – фланец, 3 – шпилька,

4 – гайка, 5 – пластмассовая втулка, 6 – слюдяная шайба;

б – с изгибной деформацией: 1,2 – пьезоэлектрические пластины,

3 – металлическая рессора

Помимо пьезоэлектрических существуют микроприводы и других типов – пьезомагнитные, электро- и магнитострикционные, биметаллические, на эффекте памяти формы, электростатические, пневматические, гидравлические.

Для мобильных микророботов, предназначенных для передвижения в узких полостях (тонкие трубопроводы, желудочно-кишечный тракт, кровеносные сосуды человека и т. п.), разработаны специальные микродвижители, реализующие способ передвижения, подобный используемому гусеницами и червями. Вариант такой системы передвижения на пьезоприводах состоит из нескольких пьезоэлектрических сегментов, соединенных центральным стержнем из того же материала. Попарно расширяющиеся за счет пьезоэффекта сегменты выполняют функции фиксаторов, а поступательное перемещение осуществляется путем удлинения центрального стержня. Частота импульсов движения – 10–20 МГц.

Существуют аналогичные системы, основанные на пневматике. На переднем и заднем концах такого микроробота имеются пневмофиксаторы, которые попеременно закрепляются на стенках полости. При этом корпус робота также попеременно удлиняется при закрепленном заднем и сокращается при закрепленном переднем конце. Для передвижения подобных роботов используется и управляемое внешнее силовое магнитное поле.

Основные уже определившиеся области применения микроприводов и основанных на них микроманипуляторов и микророботов – это микрооперации в промышленности (микрообработка, сборка, сварка и т. п.), биологические и фармакологические технологии, медицина (осмотр внутренностей, доставка туда лекарств, хирургические операции).

1.5. Генетико-прогностическое описание СОД

В табл.4.1 приведены основные этапы эволюции движения, начиная с первых возникших на Земле живых организмов и кончая человеком. Около 1 млрд. лет тому назад случайное соединение молекул в Мировом океане дало начало жизни – живую, т.е. размножающуюся клетку. Примерно через 200 млн. лет после этого появились первые многоклеточные, у которых со временем начался эволюционный процесс специализации клеток. Из наружных клеток, развивших способность реагировать на внешние раздражения (механические, химические, температурные и др.), возникли сенсорные клетки – рецепторы. Внутренние клетки, развив способность сокращаться, превратились в мышечные. В результате возникли первые еще беспорядочные рефлекторные движения прежде всего как реакция на внешние воздействия. Необходимая для этого связь между рецепторными и мышечными клетками была сперва реализована химических путем (с помощью специальных веществ – медиаторов), а затем с помощью электрических сигналов. Последнее позволило повысить быстродействие, хотя в начале эти сигналы тоже были ненаправленными, диффузно распространявшимися по всему телу. Затем постепенно оформились определенные пути для этих сигналов и появились соответствующие специальные нервные клетки.

Следующим принципиальным этапом эволюции было развитие специализации частей тела животных. Появились продолговатые животные, один конец тела которых, где помещался рот, постепенно обогащаясь рецепторами, стал главным, т.е. головой. Развитие чувствительности этих рецепторов привело к появлению дистанционных рецепторов – телерецепторов (обонятельных – из вкусовых, слуховых – из механических, зрительных – из температурных). Такая дистанционная чувствительность в определенных направлениях дала толчок к организации локомоций, т.е. к целенаправленному передвижению всего тела. В связи с этим потребовалась координация частей тела, в результате чего появился такой центр управления, как головной мозг, задачами которого стали сбор информации от рецепторов, обработка ее и на этой основе выработка сигналов управления мышцами, т.е. движением тела, как реакция на зарегистрированные внешние раздражения.

Следующий этапный момент в развитии движения животных – появление поперечнополосатой мышцы, которая в сотни и тысячи раз мощнее и динамичнее ранее возникшей гладкой мышцы. С появлением такого мощного двигателя потребовался жесткий скелет (до этого все живые существа были мягкотелыми). Эволюция пошла здесь двумя путями:

наружный скелет в виде панциря, состоящий из отдельных пластинок, соединенных внутри мышцами, у членистоногих;

скелет из костей внутри, а соединяющие их мышцы снаружи, у хордовых (позвоночных).

Второй путь был сложнее первого, так как помимо собственно движения тела требовалось еще поддержание позы и устойчивость тела. Однако именно этот путь обеспечил возможность реализовать значительно более сложные, быстрые и точные движения. В связи с этим, если первый путь завершился на насекомых, то второй привел к млекопитающим и человеку.

Появление поперечнополосатой мышцы и жесткого скелета стимулировало дальнейшее совершенствование управления движением путем развития оперативной сенсорной коррекции движений по текущей информации о внешней среде, т.е. адаптивного управления. Это в свою очередь вызвало дальнейшее совершенствование головного мозга.

Другой важный для нашей темы этап эволюции – появление у земноводных конечностей, которые образовались из парных плавников при переходе к водно-наземному образу жизни. Это привело к дальнейшему усложнению и совершенствованию системы управления. К возникшей ранее системе управления локомоциями, построенной по сегментарному принципу, когда каждая часть туловища управляется соответствующей частью спинного мозга, добавилась система управления конечностями посредством импульсов от головного мозга (который управляет при этом и локомоциями в целом). Постепенно развилась сложная иерархическая система управления – экстрапирамидная двигательная система, в которой образовывались новые уровни управления, решающие все более сложные задачи и действующие через ранее возникшие уровни, вплоть до сегментарного управления через спинной мозг. Пределом совершенства такого управления являются птицы, которые обладают по сравнению с предшествующими им пресмыкающимися исключительной динамичностью и координацией движения. Однако это управление в целом является рефлекторным, т.е. инстинктивным. Соответственно, и кора полушарий головного мозга у них осталась в зачаточном состоянии.

Следующим качественным этапом явилось возникновение прямого, так называемого пирамидного, пути управления мышцами от коры головного мозга параллельно многоуровневому и поэтому довольно медленно действующему экстрапирамидному пути. Этот канал управления движением взял на себя осуществление новых более сложных, быстрых и точных движений и привел в свою очередь к интенсивному развитию коры головного мозга. В результате возник качественно новый тип управления – интеллектуальное управление, основанное на обучении на основании наблюдений, собственного опыта и выработки соответствующих новых алгоритмов поведения. Это достижение принадлежит млекопитающим.

Ниже приведены основные типы локомоции, возникшие в живом мире в процессе эволюции.

1. В воде.

1.1. Передвижение по дну:

- путем подтягивания конца туловища к голове, затем перемещение вперед головы с выпрямлением туловища и т.д.;

- с помощью щупалец, присасывающихся к поверхности и затем сокращающихся по длине.

1.2. Реактивное движение:

- путем быстрого захлопывания створок раковин;

- путем забора и резкого выброса воды (каракатицы, гребешки).

1.3. Гребки хвостом у рака.

1.4. Плавание рыб за счет волнообразных изгибаний тела и движений хвоста с использованием парных плавников как рулей глубины.

1.5. Плавание на поверхности воды (животные).

1.6. Передвижение по поверхности воды (коллемболы и некоторые другие насекомые).

2. В воздухе.

2.1. Махание крыльями (птицы)

2.2. Планирование.

2.3. Парашютирование.

3. Под землей.

3.1. Путем раздвижения (уплотнения) земли (червь расширяет всунутую в землю голову).

3.2. Путем выбрасывания земли назад (кроты, мыши и др.).

4. По земле.

4.1. Ползание (змеи и др.).

4.2. Лазанье.

4.3. Хождение (с использованием разного количества ног).

4.4. Прыганье (на двух и четырех конечностях).

4.5. Бег симметричный, несимметричный, прыжковый, галоп и т.д. (с использованием разного количества конечностей).

Последним этапом эволюции движения в живом мире явилось развитие манипуляционных способностей. Самым совершенным универсальным средством для этого стали руки человека. С этого момента в дальнейшем развитии движений на первое место выступает уже не биологическое совершенствование отдельного человека, а значительно более интенсивное во времени его общественное развитие, включая разделение труда, с доведением до все большего совершенства профессиональных навыков, и развитие орудий труда.

И, наконец, завершением этого процесса явилось создание заменяющих человека роботов как универсальных устройств для манипуляционных и локомоционных действий в общественном производстве и других сферах человеческой деятельности. Дальнейшее совершенствование манипуляционных движений будет происходить, следовательно, уже в результате развития робототехники с преодолением, соответственно, тех принципиальных ограничений, которые присущи человеку и живой природе в целом.

Таблица 4.1. Этапы развития движений в живой природе.

Новое появившееся качество

У кого возникло

Сколько лет тому назад

Зарождение живой клетки в океане.

Одноклеточные

1 млрд.

Специализация клеток у многоклеточных с возникновением рецепторных, мышечных, а затем и

нейронных клеток, осуществляющих связь между

клетками, которая привела к возникновению

рефлекторности.

Губки

800 млн.

Формирование головы со ртом и развитие на ней

телерецепторов, ориентированных на внешнюю среду

и, соответственно, появление возможности

целенаправленного движения всего тела в сторону

определенных объектов внешней среды, т.е.

локомоций.

Черви

Головной мозг как центр координированного

управления движением всех частей тела.

Высшие

моллюски

(осьминоги,

каракатицы и др.)

500 млн.

Поперечнополосатая мышца и скелет, сперва

наружный.

Членистоногие

(ракообразные

и др.)

Внутренний скелет – основа дальнейшего

совершенствования двигательных способностей.

Рыбы и далее все

другие хордовые

(позвоночные)

Развитие сенсорной коррекции движений как нового

уровня управления движением в функции от текущей

информации о внешней среде и соответствующее

совершенствование головного мозга.

Конечности, возникшие из парных плавников рыб при

переходе от водного к водно-наземному образу жизни.

Земноводные

Экстрапирамидная двигательная система –

иерархическая система управления движением,

включающая как древние нижние уровни

сегментарного управления туловищем, так и новые

уровни управления конечностями, развившиеся в

головном мозгу и совершенствующиеся у

пресмыкающихся, а затем птиц. У последних эта

иерархическая система рефлекторного управления

достигла наибольшего совершенства. Развился

мозжечок, обеспечивающий координацию движений,

равновесие.

Земноводные,

пресмыкающиеся,

птицы

Пирамидный путь управления мышцами от коры

головного мозга, возникший параллельно с

иерархическим экстрапирамидным путем. Этот

качественный скачок произошел на фоне эволюционно усложняющегося экстрапирамидного пути в результате развития коры головного мозга (зачатки которой появились еще у пресмыкающихся) и явился базой для освоения новых более совершенных (по сложности, быстродействию, точности) движений и развития самообучения как основы уже не инстинктивного, а разумного поведения.

Млекопитающие

100 млн.

Рука для манипуляций в процессе трудовой

деятельности человека с использованием орудий труда. В результате развилась современная кора полушарий головного мозга.

Человек

Специализация

людей в трудовом

процессе

3 млн.

2 млн.

Биотехнические объекты, включающие живые существа и вживленные технические системы, которые расширяют их возможности

Биороботы

30-35

Симбиоз человека и робота – новый этап в развитии живой природы

Человек

Прогноз

4.2. Перспективы развития бионических СУД. Робототехника сегодня и завтра

Современная робототехника как новое научно-техническое направление идейно сформировалась через несколько лет после провозглашения Н.Винером концепции кибернетики под ее влиянием.

Робот как нового типа машина-автомат ворвался в сложившуюся классификацию машин как что-то инородное: он может быть и технологической машиной и транспортной и информационной, а может и вообще выпадать из этой категории, выполняя функции технологического устройства, приспособления или средства автоматизации. Правда, и в последнем робот тоже сразу же стал «возмутителем спокойствия» и породил новый термин «роботизация», который никак не вписывается в понятие «автоматизация». До этого были известны манипуляторы, управляемые человеком, однопрограммные автоматические манипуляторы-автооператоры, механические руки. Но, вот, появились манипуляторы с ЧПУ, их назвали роботами, и родилось новое научно-техническое направление – робототехника.

С самого начала в развитии робототехники определялись две, правда, сперва довольно слабо связанные цели – прикладная и фундаментальная. Прикладная цель была объективно обусловлена развитием современного производства, а именно переходом к комплексной гибкой автоматизации, к гибким автоматизированным производствам. Здесь одной из первоочередных задач стало создание выявленного в ходе этих работ недостающего звена в перечне компонентов таких производств, которое должно заменять человека, выполняющего различные манипуляционные операции – основные технологические и вспомогательные. Из этой задачи сразу же выделилась как отдельная задача высвобождения людей от опасных и вредных работ. Затем по мере развития робототехники, естественно, возникла задача создания средств робототехники, предназначенных для работ, которые принципиально не могут выполняться с помощью или даже просто в присутствии людей (дальний космос, глубины океана, новые интенсивные безлюдные технологии и т.д.). Возникли экстремальная робототехника, медицинская микроробототехника, биоробототехника, шагающие машины и другие специальные разделы робототехники. Появилось роботостроение с международной кооперацией и специализацией. Постепенно сложились определенные принципы построения, проектирования и применения средств робототехники и основанных на них технических систем. Определились основные области применения и перспективы их расширения, основанные на реальных технических и экономических характеристиках этой техники.

Принципиальный вопрос – по какому пути идти робототехнике – в сторону повышения универсальности роботов или, наоборот, их специализации разрешился признанием в качестве основного модульного принципа их построения. Этот принцип позволяет промышленности оперативно поставлять даже в единичных количествах роботы, собранные из хорошо отработанных унифицированных модулей, для выполнения самых разнообразных технологических операций. Таким образом, заманчивая идея создания сравнительно небольшого семейства универсальных роботов, такая близкая их прототипу – человеку, была заменена идеей универсального набора компонентов роботов – модулей.

Сегодня роботы применяются практически во всех сферах человеческой деятельности, а уровень робототехники является важным показателем научно- технического, промышленного и оборонного потенциалов каждой страны.

Вторая указанная выше фундаментальная цель робототехники – это экспериментальное изучение и воспроизведение феномена разумного поведения живых существ. В дальнейшем эта проблема развилась в самостоятельное научно-техническое направление, получившее название «искусственный интеллект». То, что эта проблематика наиболее остро встала именно в робототехнике, вытекает из самой ее исходной сущности, как альтернативы занятого физическим трудом человека. Первый же опыт создания таких машин показал недостаточность, и даже примитивность современной теории и техники автоматического управления и теории информации по сравнению с задачами, решаемыми человеком при выполнении даже самых простых манипуляционных операций.

В связи с этим были развернуты интенсивные экспериментальные исследования с объектами типа «глаз-рука» и различными очувствленными мобильными объектами – тележками, которые продолжаются и сегодня. В последнее время к ним добавились исследования группового поведения подобных объектов (мультиагентные системы, игры роботов и т.п.).

Это направление в робототехнике непосредственно соответствует основной идее кибернетики об общности информационно-управляющих процессов в технике и в живом мире. Одна из конечных целей этого направления в робототехнике – воспроизведение процесса эволюции живой природы, поскольку именно робот является технической системой, которая реализует триаду «сенсоры – мозг – активаторы (эффекторы)», замкнутую в кольцо через внешнюю среду. Именно на базе роботов представляется возможным реализовать и исследовать известный тезис «рука создала человека». Конечным научно-техническим результатом этих исследований должны стать принципы и методика самоусовершенствования интеллектуальных технических систем типа робот. Это позволит спустить курок эволюционного совершенствования роботов, пределом которого, разумеется, не будут интеллектуальные способности человека. Конечно, это эмпирика, но она даст результат, гарантированный опытом развития живой природы. Ведь ее эволюционное развитие – это тоже эмпирика, метод проб и ошибок.

Однако решить эту проблему в рамках одной робототехники нереально. Здесь необходимо скоординированное взаимодействие со многими смежными научно-техническими направлениями, хотя бы потому, что для этого требуется создание принципиально нового материально-технического обеспечения не только для информационно-управляющих систем (технические нейроподобные структуры и т.д.), но и для остальных компонентов названной выше триады – исполнительных систем и сенсоров.

Подобно тому как робототехника явилась одной из побудительных причин и полигоном развития работ по проблеме искусственного интеллекта, она же инициировала проблему «искусственной мышцы», как проблему создания принципиально новых приводных исполнительных систем с по крайней мере на порядок лучшими массо-габаритными характеристиками, чем у таких систем, основанных на современных электрических, гидравлических и пневматических приводах. Последние именно более чем на порядок уступают по указанным характеристикам поперечно-полосатым мышцам животных. Речь идет о принципиально новом подходе к построению приводов, так же заимствованном у живой природы и основанном на параллельно-последовательной работе сотен и тысяч элементарных микроактиваторов. Аналогичная проблема перехода к микромодульному построению стоит и перед сенсорными системами. Успешное решение этих проблем будет иметь революционизирующее значение не только для робототехники, но и для всего машиностроения.

Что касается собственно робототехники, то, как отмечено выше, прикладная робототехника в своем развитии практически быстро исчерпала научный задел, который был предоставлен ей, прежде всего теорией автоматического управления и информатикой, а также технический задел в виде приводов и систем ЧПУ, заимствованный у станкостроителей. И сегодня ее дальнейший прогресс почти целиком зависит от успехов в решении перечисленных ранее фундаментальных проблем. Так сомкнулись первоначально почти не связанные два направления развития робототехники – прикладное и фундаментальное.

В начале своего развития робототехника пережила период романтизма, период «бурь и натиска», когда казалось, что еще немного и мы «схватим бога за бороду» – наступит «роботовладельческий» строй. На смену порожденных кибернетикой споров о том может ли машина мыслить и превзойти в этом человека, разогрелись дискуссии об опасностях, которые могут принести роботы, вплоть до их бунта против человека. Затем наступили зрелость и прозрение: определился целый комплекс серьезнейших научно-технических проблем, которые стоят на пути к царству роботов. Основные из них были названы выше и, как следует из изложенного, генеральное направление дальнейшего развития робототехники – это прежде всего комплексная миниатюризация компонентов и интеллектуализация в виде распределенного интеллекта, пронизывающего все системы роботов от сенсорики до приводов и даже до конструктивных материалов и «кожи» роботов (интеллектуальные материалы) и искусственные мышцы.

Обе эти проблемы соответствуют общим тенденциям развития техники в целом, которые тесно взаимосвязаны, можно сказать, как форма и содержание. Само понятие интеллектуализации (искусственного интеллекта) могло возникнуть и приобрести реальный смысл только на определенном этапе развития миниатюризации прежде всего в вычислительной технике.

Проблема интеллектуализации возникла, прежде всего, именно в робототехнике, поскольку это соответствовало исходной идее робота.

Процесс миниатюризации изначально был связан с процессом повышения точности и разрешающей способности создаваемых изделий. Именно последнее является основанием для создания все более и более малоразмерных изделий.

Рис. 4.1 иллюстрирует сказанное применительно к автоматике и робототехнике. Здесь показано совместное развитие двух названных тенденций в виде сменяющих друг друга S-образных зависимостей эволюционного развития миниатюризации определенных типов техники, а справа дано развитие интеллектуализации как параметра исходной трехмерной временной зависимости.

Процесс миниатюризации, ее первый этап, связан с механикой и порожден, как сказано, развитием технологий, повышающих точность изготовления деталей. Начался он с производства замков (слесарь – от немецкого слова schlosser – замок, затвор и его же изготовитель. Кстати, и в английском языке слово слесарь – locksmith от того же корня «замок» – lock). Затем вышли в лидеры часовщики. Именно они создали первые механические изделия счетно-решающей (вычислительной) техники – арифмометры, интеграторы и т. п. В 1950-е гг. механические интеграторы сменили электромеханические (в составе первых электромеханических вычислительных машин).

Рис. 4.1. Развитие технических систем (автоматы и роботы)

Второй этап миниатюризации начался на базе двухмерных (2D) технологий микроэлектроники, сопряженной уже с интеллектуализацией. Символ этого этапа – многослойные платы печатного монтажа. В них достигнута уже субмикронная точность.

На рубеже XXI столетия, как известно, начался третий этап миниатюризации на базе 3D микросистемных технологий. Это уже не электроника, а (Трехмерная электромеханика– микроэлектромеханические системы (МЭМС).

Каждый из перечисленных этапов не сменял предыдущий, а «надстраивал» над ним новый уровень. Так, ЗD-технологии развились на базе 2D-технологий и добавили механику движений, но с микронным разрешением. Впереди нас ожидает уже исследуемый этап нанотехнологий с молекулярной разрешающей способностью и использование органики – симбиоз живого и техники (биокомпьютеры и т. п.). После этого очевидно, наступит последний физически возможный этап миниатюризации на атомном уровне.

Рассмотренный процесс помимо возможности создания все более малоразмерных мини-, микро- и наносистем создает техническую базу для разработки нового поколения и крупномасштабных объектов вплоть до тяжелого машиностроения, наделенных принципиально новыми, в том числе интеллектуальными функциональными возможностями и техническими характеристиками.

Интеллектуализация как процесс совершенствования информационно-управляющих возможностей техники также прошла 3 этапа: программное управление, адаптивное управление и, наконец, на базе микроэлектронной техники и технологий искусственного интеллекта (ИИ) возникло интеллектуальное управление. При этом искусственный интеллект постепенно охватил все функции технических систем помимо управления. Как и в процессе миниатюризации здесь каждый последующий этап не заменял предыдущий, а поглощал его: адаптивное управление образует следующий уровень управления над программным, а интеллектуальное включает и программное управление, и адаптацию. Дальнейшее развитие искусственного интеллекта– коллективный интеллект (как у людей), а затем и превышение интеллекта естественного. Следующий качественно новый этап – искусственный разум, воспроизводящий наряду с интеллектом творческие способности (креативность) человека. Разумеется, имеется в виду узко специализированный профессиональный интеллект и разум. (Например, уже не вызывает сомнений, что скоро компьютеры переиграют самых сильных шахматистов.)

Рассматриваемый процесс миниатюризации и интеллектуализации техники начинается прежде всего с ее основных компонентов – три замкнутых в кольцо через внешнюю среду, – сенсорные, информационно-управляющие и исполнительные– компонента, затем связь и энергопитание (рис. 4.2). В общем случае их совокупность образует открытую систему, информационно и энергетически зависимую от окружающей среды, включая и другую подобную технику. (В том числе в недалеком будущем – в виде коллективов роботов.)

Рис. 4.2. Функциональный состав автоматических систем

В основе миниатюризации этих компонентов, как уже сказано, – повышение точности изготовления деталей (рис. 4.3). Сегодня в этом процессе, по-прежнему, лидирует вычислительная техника на базе микроэлектроники: прежде всего информационно-управляющие компоненты, а за ними с определенным отставанием следует сенсорика и связь. Их общая база – 2D-микротехнологии. Начавшийся качественный переход к 3D-микротехнологиям особенно важен для сенсорики, а еще более для силовых компонентов– исполнительных и энергопитания. Общесистемное развитие пока сдерживают последние. Здесь происходит возврат к проблеме миниатюризации механики движений. Пока эти компоненты все еще продолжают эволюционировать на идеях прошлых веков. Но общая тенденция очевидна: технологическое сближение всех компонентов и их конструктивное объединение в мехатронные системы.

Рис. 4.3. Развитие компонентов технических систем

Подобно тому, как микроэлектроника, начавшись с отдельных транзисторов, диодов и других элементов, перешла к объединению их во все более крупные интегральные схемы в виде чипов, эволюция МЭМС так же развивается в направлении создания все более крупных технических систем, объединяющих все рассмотренные ранее функциональные компоненты в единый мехатронный конструктив.

Дальнейшая миниатюризация ведет к переходу на новый наноуровень молекулярной размерности и соответственно к аналогичному укрупнению интегральных наноэлектромеханических систем – НЭМС.

В заключение приведенного исторического обзора отметим некоторые актуальные задачи по созданию перечисленных ранее компонентов нового поколения робототехнических устройств.

Для сенсорных систем первоочередная задача – комплексирование сенсорных систем различного типа (СТЗ, УЗ, ИК, УФ, радиотехнические и лазерные дальномеры и т. д.). Необходимо также развитие химических сенсоров, что, в частности, важно для поиска взрывчатки, наркотиков, и более специальных – интроскопических.

Для информационно-управляющих компонентов наряду с дальнейшим развитием формализуемых символьных технологий искусственного интеллекта предстоит приступить к решению проблемы создания методов работы с образной информацией и творчества (интуиции).

Для связи применительно к робототехнике одна из важных проблем – вязь «оператор-робот». В нее входят задачи:

3D-виртуальные обобщенные сцены внешней среды;

эффект присутствия;

неконтактные способы управления (с отказом от джойстиков как основного средства) через 3D-картины внешней среды, включая управление голосом, световыми метками и т. п.

К силовым компонентам (исполнительным и энергопитания) в отличие других компонентов предъявляются другие основные требования – КПД и удельные массо-габаритные параметры. Эти компоненты в своем эволюционном развитии давно уже пришли к насыщению. Во всем мире дет поиск на базе 3D-технологий принципиально новых решений типа искусственных мышц и т. п.

Проведенный анализ общих закономерностей развития техники подтверждает, что рассмотренные основные направления развития робототехники – миниатюризация и интеллектуализация – соответствуют общим тенденциям в целом и, следовательно, будут реализовываться в тесном взаимодействии со всеми необходимыми для этого отраслями техники.

В заключение перечислим основные области применения робототехники, где в первую очередь будут реализовываться достижения в решении рассмотренных научно-технических проблем.

Робототехника наземного и воздушного базирования. Сюда относятся создание автоводителей и автопилотов, решение проблемы «человеческого фактора» в человеко-машинных системах, робототехнические системы для действий в экстремальных условиях, в том числе для вооруженных сил и других силовых структур, групповое применение роботов, в том числе в конфликтных ситуациях, и создание следующих интеллектуальных поколений таких роботов, ориентированных на автономное функционирование. Особенно большие перспективы связаны при этом с микроробототехникой. Летающие, плавающие ползающие и т. п. микророботы произведут качественные изменения во многих важнейших сферах человеческой деятельности.

Био- и медицинская робототехника. С ней связана как проблематика заимствования бионических решений, так и обратный процесс внедрения робототехники в живые организмы. Начало последнему положило протезирование конечностей, затем усиление физических возможностей человека для функционирования в экстремальных условиях (активные скафандры, биоуправляемые шагающие машины и т. п.). Наконец, появились новые поколения интеллектуальных протезов и экзоскелетонов, роботы-сиделки, робототехнические системы для реабилитации инвалидов, массажисты и т. п. Однако прежде всего – это новые области применения робототехники, такие как хирургия, в том числе дистанционная, микророботы для внутрисосудистой и внутриполостной диагностики и хирургии.

Космическая робототехника. Сегодня это важнейшая часть очередного этапа развития космонавтики. К ней относится, прежде всего, освоение дальнего космоса, ближайших планет и Луны. Космическая робототехника открывает перспективы создания принципиально новых космических объектов и систем, в том числе и в околоземном пространстве, включая наноспутники, монтажно-сборочные и регламентные работы на орбите и т. п.

Подводная робототехника. Наряду с космосом это второе направление «экспансии» человечества, в котором решающую роль должна играть робототехника нового поколения. Если человек-амфибия – это фантастика, то роботы-амфибии – это уже реальность. Достаточно напомнить их работу по обследованию затонувших кораблей, использование подводных роботов-геологов. А, ведь, это, по существу, еще только предыстория подводной робототехники.

В настоящее время еще нет ни лунных, ни других космических баз, обслуживаемых саморемонтирующимися роботами, нет и подобных подводных сооружений. Однако если сегодня основное направление развития современного машинного производства – это создание безлюдных комплексно-роботизированных предприятий, то тем более это должно относиться к освоению космоса и глубин океана.

Среди перечисленных перспективных областей применения робототехники не названа промышленная робототехника. Объясняется это тем, что, хотя в обозримом будущем основной мировой парк роботов по-прежнему будут составлять промышленные роботы, не этот уже сложившийся раздел робототехники будет определять ее развитие в рассмотренных ранее направлениях.

Как уже отмечалось, для решения рассмотренных ранее проблем необходима консолидация робототехники со смежными научно-техническими направлениями. И в этой связи назрела потребность в анализе сложившейся системы таких направлений, которые так или иначе тоже порождены идеями кибернетики и соответственно близки робототехнике. Основой такой консолидации может стать названная выше триада «сенсорика-процессор-активатор». Она появилась в технике вместе с первыми автоматами древности, затем составила основу теории автоматического управления и кибернетики, а в последние годы начинает пронизывать буквально все направления научно-технического прогресса, начиная с материаловедения (интеллектуальные материалы) и кончая компьютерно-сетевыми технологиями (мультиагентные системы).

Другим важным принципом для указанной консолидации может стать и системный подход к реализации названной триады, заключающийся в отказе при создании технических систем от разделения их на объект управления и управляющую систему. Перспективность такого подхода для робототехники и особенно для микроробототехники очевидна и он прогрессивно внедряется, в частности, в ходе интеллектуализации роботов. Этот принцип, основанный на использовании общесистемных критериев, начал применяться в технике давно, еще при создании первых статически неустойчивых объектов, например, в электроэнергетике («искусственная устойчивость»), в авиации. В частности, он лежит в основе мехатроники, которая тоже входит в родственные робототехнике научно-технические направления и наиболее близка ей.

В этой связи остановимся на связях робототехники и мехатроники. Формально они уже объединены в соответствующие научное и учебное направления хотя, строго говоря, они определяются по разным квалификационным признакам. Робототехника определена по функциональному назначению, а мехатроника – по физическому составу. Однако, действительно, мехатроника и робототехника имеют много общего и довольно тесно взаимосвязаны. Многие компоненты средств робототехники можно отнести к мехатронным. В свою очередь мехатронные устройства в наиболее развитом виде реализуют как и робототехнические системы, упомянутую триаду «сенсорика-процессоры-активаторы». Из этого следует, что мехатроника должна иметь много общего с робототехникой в принципах построения и методах проектирования. К ним прежде всего относятся модульный принцип построения и упомянутый ранее системный подход к проектированию

Мехатроника как новое научно-техническое направление возникла в результате органического слияния электромеханики и микроэлектроники в виде прежде всего автоматических технических объектов и систем. (Аналогичным образом в свое время возникла электромеханика в результате интеграции механики и электротехники.)

Мехатроника возникла как самостоятельное научно-техническое направление благодаря наличию таких объектов нового типа, которые требуют системного подхода, охватывающего его механику и микроэлектронику. В этой связи в соответствии с рассмотренной ранее общей тенденцией развития техники одним из основных направлений мехатроники в ближайшие годы станет создание микроэлектромеханических систем (МЭМС). К ним, в частности, относятся некоторые типы гироскопов, аксельрометров и других микроэлектромеханических сенсорных систем, микроэлектромашины. Поэтому одним из направлений робототехники, наиболее тесно связанным с мехатроникой, является, прежде всего, микроробототехника.

1.8. Устройство управления роботов

Устройство управления робота осуществляет автоматическое управление его исполнительными системами – манипуляционными и передвижения, образуя в совокупности с ними как объектами управления систему автоматического управления робота. Кроме того, часто устройство управления роботов используют и для управления различными другими объектами (технологическим оборудованием, транспортными устройствами и т. п.), которые работают совместно с роботом, образуя с ним единый технологический комплекс.

Как уже было отмечено, по способу управления различают следующие системы управления роботов и соответствующие устройства управления:

программные, в которых управление осуществляется по заранее составленной и остающейся неизменной в процессе реализации управляющей программы;

адаптивные, в которых управление осуществляется в функции от информации о текущем состоянии внешней среды и самого робота, получаемой в процессе управления от сенсорных устройств;

интеллектуальные, в которых адаптивные свойства развиты до уровня интеллектуальной деятельности.

Устройства управления могут быть индивидуальными, входящими в состав каждого робота, и групповыми, управляющими несколькими роботами. Конструктивно индивидуальные устройства управления выполняют обычно 4 отдельно от механической части робота, либо, значительно реже, в общем корпусе, а у мобильных роботов обычно такое устройство состоит из 2 частей – бортовой и входящей в состав пульта оператора (или в дополнение к нему).

Подавляющее большинство роботов имеет электронные устройства управления, выполненные на микропроцессорной базе. Однако существуют и неэлектрические устройства управления роботов, чаще всего реализуемые на пневмонике и предназначенные для применения в особых взрыво- и жароопасных условиях.


Часть 2.
СЕНСОРНЫЕ СИСТЕМЫ

2.1. Морфологическое описание СС

Три с половиной миллиарда лет назад первые предшественники прокариот возникли в уже тогда древнем океане. Еще до того в первичном бульоне появились примитивные самовоспроизводящиеся молекулы. Вероятно, наиболее ранним репликатором была РНК, а не ДНК, поскольку некоторые формы РНК (рибозимы) обладают ферментативной активностью, а репликация в этом случае протекает быстрее. Хотя репликация ДНК более эффективна, она всегда зависима от белковых ферментов, что трудно себе представить в примитивном океане. Следовательно, более сложный процесс репликации ДНК должен был развиться позднее. Однако, эффективная репликация РНК или ДНК, a fortiori (в особенности) – последней, зависит от множественности молекул. Из этого следует, что эти молекулы должны находиться в достаточной близости друг от друга. Возможно, что все началось с их адсорбции на какой-либо обычной поверхности, например на глинах. Однако наиболее эффективным средством удержания взаимодействующих молекул вместе было помещение их в тонкий мешочек или пузырек.

Простейшие современные прокариоты – это микоплазма. Самое малое из них имеет диаметр 0,3 мкм и содержит не более 750 различных типов белков, но даже эти крошечные клетки куда более продвинуты, чем протоклетки, существовавшие три с половиной миллиарда лет назад, поскольку они, как и современные клетки, используют ДНК, а не РНК, как наследственный материал. Так или иначе, рассматриваем ли мы простейшие из живых клеток или их гипотетических предшественников, одно их выделяет – они существуют как отдельности в окружающей среде. Их внешние мембраны отграничивают внутреннюю среду от внешней. Биологи с философскими наклонностями прослеживают происхождение индивидуального организма до этого изначального периода.

Все организмы живут в окружающей среде. Все организмы тем или иным образом реагируют на окружающую среду. Это то, что отличает их от неодушевленных предметов. Ясно, что поверхностная мембрана, отграничивающая организм от окружающей среды, должна играть критически важную роль. Именно здесь развиваются специализации, которые способны детектировать благоприятные и неблагоприятные изменения. Иными словами, именно здесь возникает простейшая сенсорная система. Будучи информирован об изменениях в окружающей среде, организм может реагировать на них благоприятным для себя образом. Благоприятным для чего? В конечном счете, преимущества могут быть прослежены до уровня физической химии реплицирующихся молекул. Те из них, которые реплицируются более эффективно, поглощают больше доступных ресурсов и выживают.

Итак, начнем с начала: рассмотрим элементы, из которых построена сенсорная система.

1.1.1. Аллостерические эффекторы

Ферментативные белки имеют сложную трехмерную структуру. Ковалентно связанная первичная структура, состоящая из одной или более аминокислотной цепочки, свернута в сложную конформацию, т. н. третичную структуру. Эта структура стабилизирована многочисленными «слабыми» взаимодействиями: водородными связями, вандерваальсовыми и гидрофобными силами и т. д. Стоит подчеркнуть, что каждая из этих сил по отдельности слаба. Тогда как энергия единичной ковалентной связи составляет около 100 ккал/моль (двойные и тройные связи, обладают, соответственно, большими энергиями), водородная связь характеризуется энергиями всего в 1–5 ккал/моль, а гидрофобные и очень короткодистантные вандерваальсовы силы – всего около 1 ккал/моль. Хотя, по сравнению с ковалентными связями, все они очень слабы, однако часто они чрезвычайно многочисленны. Большое число таких слабых взаимодействий и поддерживает сложную конформацию белковой молекулы.

В то же время это означает, что такая пространственная структура ферментативного белка чрезвычайно хрупка и легко ранима. Это также означает, что такая структура может легко перестраиваться из одной конформации в другую. Именно эта черта лежит в основе феномена аллостерии. В сущности, это означает, что когда молекула (или лиганд) связывается с одним из сайтов на поверхности белка, это вызывает изменения конформации, которые демаскируют активные сайты в других участках белка. В известном смысле это может рассматриваться как наиболее примитивная сенсорная система – белковая молекула меняет свое поведение в ответ на какой-либо фактор окружающей среды (рис. 1.1).

Рис.1.1. Принципиальная схема действия эффектора на активность фермента.

АЕ – аллостерический эффектор, AS – активный сайт, Е – фермент, S – субстрат.

Когда АЕ связывается с ферментом, индуцируются изменения трехмерной конформации последнего (показанные стрелками), так что AS становится недоступным для субстратной молекулы(S).

Аллостерические переходы играют настолько важную роль, что можно сказать, что они лежат в основе всей клеточной биологии. Часто такие аллостерические переходы встречаются у белков, состоящих из более чем одной субъединицы. В таких случаях связывание лиганда с аллостерическим сайтом одной из субъединиц вызывает изменения, которые облегчают связывание лигандов с аллостерическими сайтами других субъединиц. Такое явление известно как кооперативная аллостерия и может приводить к более существеннным изменениями поведения аллостерического белка.

Одним из наиболее эффективных факторов, вызывающих аллостерические переходы, является фосфорилирование. Реакция фосфорилирования катализируется протеинкиназой. Протеинкиназы образуют большое семейство из нескольких сотен белков, каждый из включает каталитический домен из 250 аминокислот. Основная реакция состоит в переносе фосфатной группы с АТФ на гидроксильную группу боковой цепи аминокислот субстратного белка. Только три аминокислоты – серин, треонин и тирозин – обладают гидроксильной группой в боковых цепях, так что только эти аминокислоты и могут участвовать в реакции, которая схематически представлена на рис. 1.2.

Рис.1.2. Белок с боковой цепью (серин, треонин или тирозин), обозначенной на рисунке «аа». Протеинкиназы фосфорилируют боковую цепь за счет АТФ. Протеинфосфатазы затем дефосфорилируют боковую цепь.

Протеинкиназы, фосфорилирующие субстратные белки (что ведет к аллостерическим переходам в последних) сами находятся под аллостерическим контролем. Нет необходимости углубляться в биохимические тонкости процесса, однако стоит упомянуть о других ферментах – протеинфосфатазах, которые в цитозоле присутствуют, чтобы ликвидировать последствия деятельности киназ (рис. 1.2). Эти ферменты устраняют фосфат с субстратного белка, что позволяет последнему возвратиться к исходной конформации.

1.1.2. Мембраны

Второй элемент любой сенсорной системы – это биомембраны. Хотя наиболее древние мембраны, сформировавшиеся в первобытные времена, могли быть построены из аминокислот, все современные биологические мембраны (или биомембраны) состоят из липидного бислоя с белковыми включениями. Кроме того, большинство биомембран содержит и углеводы. Липиды образуют матрикс или основу, в которую погружены белки, а углеводы (там, где они присутствуют) присоединены либо к липидам (гликолипиды) или к белкам (гликопротеины) (рис. 1.3).

Липиды

На рис. 1.3 видно, что липиды образуют бимолекулярный слой. Они разделяются на три большие группы: фосфолипиды, гликолипиды и стероиды (в частности, холестерин). Важно отметить, что все эти молекулы относятся к амфипатическим, т. е. частично растворимым в воде, а частично – в органических растворителях. Типичный мембранный липид на одном из концов молекулы несет электростатический заряд и, таким образом, может связываться с водорастворимыми веществами, а другой конец, ковалентно не связанный с электростатическим зарядом, чувствует себя, как дома, в органическом растворителе. Поскольку и внеклеточная, и внутриклеточная среда практически исключительно водные, липиды, образующие бислойную мембрану, выстраиваются так, что их гидрофильные «головы» обращены в водную среду, а гидрофобные «хвосты» – друг к другу (изолированно как от водной среды снаружи, так и внутри клетки). Некоторые типичные мембранные липиды показаны на рис. 1.4.

Рис.1.3. Мембрана быстро заморожена до температуры жидкого азота и вскрыта сколом. Плоскость скола проходит через середину липидного бислоя. Рисунок показывает, как белки погружены в мембрану, а также положение углеводных цепей, проецирующихся с наружной поверхности («strings of sausages»).

Рис.1.4. Некоторые распространенные липиды мембран.

(А) Фосфатилилхолин (лецитин); (Б) сфингомиелин; (В) ганглиозид; (Г) холестерин. Пунктирная линия символизирует длинную алифатическую цепь.

Gal – галактоза, Glc – глюкоза, NANAN-ацетилнейраминовая кислота.

Из того, что было сказано выше, а также рис. 1.3 и 1.4 ясно, что биологические мембраны – это весьма тонкие структуры. Составляющие их липиды удерживаются гидрофобными силами и случайными электростатическими взаимодействиями их «головных» групп. Чрезвычайно свободная структура липидного бислоя означает, что при комнатной температуре индивидуальные молекулы пребывают в постоянном движении. Действительно, гидрофобные жирнокислотные хвосты молекул липидов сравнимы с корзиной змей, переплетенных в постоянном движении. Внутренность мембраны, таким образом, с любой точки зрения представляет собой органическую жидкость.

Не все липидные составляющие биомембран столь же лабильны, как фосфолипиды. Холестерин, в частности, – это совершенно другой тип молекулы. Как показано на рис. 1.4, молекула холестерина состоит из трех составных частей: гидрофильной «головы» – гидроксильной группы, жесткого тарелкообразного стероидного кольца и гибкого гидрофобного хвоста. Количество холестерина в мембране значительно варьирует; когда он присутствует, увеличивается жесткость мембраны и уменьшается ее текучесть.

Текучесть мембраны определяется, на самом деле, не только количеством присутствующего в ней холестерина, но и длиной и насыщенностью жирных кислот, образующих ее основу. Искусственные мембраны, образованные липидами только одного вида, обладают достаточно резкой характеристикой данного фосфолипида – «температурой перехода» от жидкого состояния к гелю. Эта температура варьирует в различных местах естественной биомембраны, в зависимости от количества холестерина и насыщенности фосфолипидных «хвостов». Естественная мембрана может, таким образом, рассматриваться как мозаичная структура с различной степенью текучести.

Белки

В «лоскутное одеяло» биомембраны погружены белки. Хотя гликолипиды (такие, как молекулы клеточной адгезии) очень важны для клеточного распознавания, все же наиболее важные характеристики биомембран обусловлены не липидами, в белками. Количество белка в мембранах варьирует от 20% (миелин) до прибл. 75% массы (внутренняя мембрана митохондрий). Большинство мембран содержит по массе около 50% белка.

Большинство белков (как показано на рис. 1.4), погружено в мембрану. Они «плавают», как айсберги в переменчивом «море» фосфолипидов, или, если посмотреть на это иначе, образуют мозаику в жидком фосфолипидном матриксе. По этим причинам такая концепция структуры биомембран называется «жидкостно-мозаичной» моделью. В некоторых случаях белки пронизывают весь бислой и соприкасаются как с внутриклеточным, так и внеклеточным пространствами. В других случаях белки присоединены к мембране цепью жирной кислоты, фосфолипидом или пренильной группой. В этих случаях сам белок расположен в цитозоле. Некоторые из этих вариантов присоединения белков показаны на рис 1.5. Необходимо отметить, что мембранно связанные белки образуют базовые элементы всех сенсорных рецепторов.

Рис.1.5. Некоторые пути, которыми белки ассоциируются с мембраной. Цилиндры внутри мембраны символизируют α-спирали. (А) Одиночная α-спираль проходит через мембрану; (Б) многочисленные α-спирали проходят через мембрану; (В) белок соединен с цитоплазматической частью бислоя жирнокислотной цепью или пренильной группой (важный пример такого типа связи – G-белки); (Г) белок, погруженный в мембрану, нековалентно связан с другим белком в цитозоле.

Трансмембранные белки построены таким образом, что гидрофобные домены погружены в мембрану, а гидрофильные обращены в водные – внутриклеточный и(или) внеклеточный компартменты (см. рис. 1.5) По сравнению с глобулярными белками водного цитозоля внутримембранные домены мембранных белков в известном смысле перевернуты: их гидрофобные аминокислотные остатки обращены кнаружи, а гидрофильные загнуты внутрь. Это обеспечивает способность белка удерживаться в мембране. Очень часто, как это показано на рис. 1.5, внутримембранные домены состоят из α-спиральных сегментов. Опять-таки, огромное большинство аминокислотных остатков, образующих α-спирали, гидрофобны.

Исследования включения ферментативных белков в искусственный липидный бислой показывают, что активность таких белков кондиционируется их липидным окружением. Характеристики бислоя, такие как длина жирно-кислотной цепи, степень их насыщенности и природа липидных «голов», влияют на биологическую активность фермента. Точно так же, как на водорастворимые ферменты влияют характеристики водного окружения (рН, концентрация солей и т. д.), так ферменты, погруженные в слой липидов, зависят от конкретной структуры последних.

Подвижность белков

Мы уже сравнивали мембранные белки с айсбергами, плавающими в липидном море. Поэтому неудивительно, что многие из них обладают значительной латеральной подвижностью. Эта подвижность с большим эффектом была использована в формировании сигнальных систем, основанных на перемещениях белков в плоскости мембраны. Коэффициент диффузии белков составляет от прибл. 10-9 см2/с для зрительных пигментов наружного сегмента палочек до прибл. 10-11 см2/с для других белков. В первом случае белок проходит около 0,1 мкм в секунду, а во втором – 0,001 мкм/с. Существует множество причин для таких больших различий подвижности. Во-первых, это может происходить вследствие различий липидного состава мембран, который, как указывалось выше, влияет не ее текучесть. Белок может быть также частью большого комплекса с другими белками, который оказывается слишком большим, чтобы легко перемещаться. Подвижность может быть затруднена не принадлежащими собственно мембране структурами, такими как щелевые и тесные контакты, а также десмосомы и т. д. Последнее по порядку, но далеко не последнее по важности – возможность того, что мембранные белки заякорены за элементы примембранного цитоскелета.

1.1.3. Рецепторные молекулы

На границе между организмом и окружающей средой располагаются рецепторные молекулы. Не все органы чувств обращены такими молекулами во внешнюю среду, однако две важные экстероцепторные системы организованы именно так – хеморецепторы и фоторецепторы. Даже сенсорные системы, которые не полагаются на рецепторные молекулы в детектировании изменений окружающей среды, механо- и терморецептивная, тем не менее используют (как мы увидим ниже) мембранные белки, хотя и несколько иным образом.

Хемо- и фоторецепторные клетки имеют особую белковую организацию, сходную с той, которая обнаружена в рецепторных молекулах, реагирующих на нейромедиаторы в множестве синапсов. Полипептидные цепи таких рецепторов семь раз проходят через мембрану (рис. 1.6). Из-за такой организации – с семью трансмембранными сегментами, рецепторы именуются семидоменными (или 7ТМ), а иногда и змеевидными. Многие, но далеко не все семидоменные рецепторы эволюционно связаны. Они принадлежат огромному суперсемейству белков – согласно расчетам до 2% генома может быть занято кодированием этих вездесущих рецепторов.

Схематическое изображение на рис. 1.6А показывает, как семь трансмембранных сегментов расположены в мембране. Оно также показывает наличие больших внутри- и внеклеточных доменов. Рис. 1.6Б показывает, что в реальности семь трансмембранных сегментов образуют как бы пилоны полой колонны, ориентированные подобно лепесткам диафрагмы объектива или клепкам в бочке.

Рис.1.6. Архитектура семидоменного рецептора. (А) схематическое изображение: семь трансмембранных сегментов обозначены цифрами от 1 до 7. N-конец расположен внеклеточно, к нему обычно присоединены углеводные остатки (т.е. он гликолизован), что обозначено знаками е-1, е-2, е-3, они также могут быть гликолизированы. Внутриклеточные петли i-1, i-2, i-3 представляют собой места распознавания для специфических G-белков. Темными точками обозначены места фосфорилирования для протеинкиназ, а крестиками – сайты, на которые воздействуют специфические десенситизирующие протеинкиназы. (Б) Трехмерная конформация рецептора в мембране.

Семидоменные рецепторы не только имеют общую архитектуру, но и мембранно-связанные средства усиления сигнала. Этот механизм основывается на латеральной подвижности белков, в данном случае – G-белков, в биомембранах и на том обстоятельстве, что липидный бислой удерживает эти белки в тесной близости, так что они не могут диффундировать в цитозоль. Тонкий структурно-функциональный анализ семидоменных рецепторов показал, что первая, вторая и третья цитоплазматическая петли (1-1,1-2 и 1-3), а также карбоксильный конец (рис. 1.6 А) критичны для связывания с С-белком, при этом третья петля особенно важна в распознавании специфических G-белков. Кроме того, показано, что рецептор, подвергнутый длительному воздействию лиганда, значительно уменьшает свою чувствительность – это явление известно как десенситизация. Десенситизация происходит вследствие активности специфических протеинкиназ, фосфорилирующих гидроксильные группы серинового, треонинового и тирозинового остатков карбоксильного конца рецептора. Эти остатки обозначены крестиками на рис. 1.6 А. Помимо того сериновые, треониновые и тирозиновые остатки подвергаются воздействию неспецифических протеинкиназ (обозначены кружками). Фосфорилирование меняет трехмерную конформацию рецептора. Чувствительность восстанавливается при дефосфорилировании одним из многих фосфатазных ферментов, распространенных в цитозоле.

1.1.4. Мембранные сигнальные системы

Внешние мембраны клеток, разграничивающие внешнюю среду и цитозоль, развили множество биохимических механизмов, которые преобразуют внешние стимулы в передаваемые в цитозоль сигналы.

G-белки

Когда семидоменная рецепторная молекула, локализованная в мембране сенсорной клетки, активируется какими-то изменениями во внешней среде, она претерпевает конформационные изменения. Последние детектируются G-белками, связанными с мембраной, которые, в свою очередь, активируют эффекторные молекулы в мембране. Часто это приводит к выделению вторичных мессенджеров в цитозоль. Этот процесс схематически показан на рис. 1.7.

Рис.1.7. Схема G-белок сигнальной системы. S – стимул; R – мембранный рецептор; E – эффектор (фермент, ионный канал и т.д.); M – вторичный мессенджер.

G-белки, участвующие в передаче сигнала, являются членами еще одного большого надсемейства белков, в данном случае – гуанин-связывающих белков. G-белки – это прецизионные регуляторы, включающие или выключающие активность других молекул. Все С-белки «включаются» при связывании с ГТФ и «выключаются» гидролизом ГТФ до ГДФ. Этот гидролиз катализируется ГТФ-азной активностью самих G-белков. Процесс этот сравнительно медленный, протекающий в течение секунд – десятков секунд.

G-белки биологических мембран имеют гетеротримерную структуру. Они состоят из большой α-субъединицы (около 45 килодальтон – кДа), а также меньших β- и γ-субъединиц (рис. 1.8). α-субъединица обладает ГТФ-азной активностью, в неактивной («выключенной») форме она связывает молекулу ГДФ на активном сайте. Субъединицы β и γ связаны между собой, и в физиологических условиях не могут быть диссоциированы. В неактивном состоянии β-γ-комплекс непрочно связан с α-субъединицей. β-субъединица связана с цитоплазматическим листком биологической мембраны геранил-гераниловой цепью (20 атомов углерода в цепи), близкой по структуре к холестерину, α-субъединица также связана с мембраной жирной кислотой с длиной цепи в 14 атомов углерода (миристоевая кислота). Такие связи обеспечивают то, что комплекс G-белка удерживается в плоскости мембраны, но в то же время способен легко двигаться в этой плоскости. Легко себе представить, как весь комплекс G-белка с присоединенным ГДФ перемещается в плоскости мембраны под действием тепловых сил.

Рис.1.8. Конформация гетеротримерного мембрано-связанного G-белка. α-субъединица изображена с полостью, символизирующей сайт связывания ГДФ или ГТФ.

α-субъединицы чрезвычайно вариабельны. Например те, что обнаружены в обонятельной системе, существенно отличаются от таковых в зрительной системе, β- и γ-субъединицы менее гетерогенны, хотя известно множество различных их типов. Такая молекулярная гетерогенность дает возможность организовать гибкую высокоадаптивную сигнальную систему.

Когда комплекс G-белка, перемещающийся в мембране, входит в контакт с активированным семидоменным рецептором, это приводит к освобождению ГДФ. Вследствие избытка в цитозоле ГТФ диффузия последнего обеспечивает занятие освободившегося сайта. После того, как это происходит, тримерный комплекс G-белка разделяется. β- и γ-субъединицы, остающиеся соединенными между собой, диссоциируют от α-субъединицы, далее эти части комплекса двигаются своими отдельными путями, α-субъединица с присоединенным с ней ГТФ способна взаимодействовать с «эффектором» в мембране – ферментами, такими, как аденилатциклаза, или, возможно, ионными каналами. Фермент может активироваться или ингибироваться, а ионный канал – открываться или закрываться. Конкретные примеры будут рассмотрены в последующих главах. Взаимодействие с эффектором, однако, длится до тех пор, пока α-субъединица, являющаяся ГТФ-азой, удерживает ГТФ. Так что, очень вскоре присоединенный ГТФ гидролизуется до ГДФ. Когда это происходит, α-субъединица снова меняет свою конформацию и теряет способность активировать эффектор. После этого α-ГДФ взаимодействует с β-γ-комплексом и снова образует тримерный комплекс, завершая, таким образом, цикл (рис. 1.9). До недавнего времени полагали, что β - γ -комплекс не играет серьезной роли в мембранной сигнализации. Теперь это ставится под сомнение – существуют данные о том, что этот комплекс может играть независимую роль. Возможно, что он способен ингибировать активность свободной α-субъединицы или независимо влиять на мембранные эффекторы.

Рис.1.9. Сигнальная система G-белка в биологической мембране. (А) фаза покоя; (Б) лиганд присоединяется и активирует рецептор; (В) G-белок сталкивается с активированным рецептором, диссоциирует, и α-субъединица теряет ГДФ; (Г) α-субъединица активируется, присоединяя ГТФ; (Д) α-субъединица присоединяется к эффектору и активирует его, эффектор, в свою очередь, катализирует синтез вторичного мессенджера; (Е) дефосфорилиррование ГТФ деактивирует α-субъединицу, которая отсоединяется от эффектора, готовая начать весь цикл сначала. Пунктирное окрашивание рецептора на рисунке символизирует активацию; Е – эффектор; L – лиганд, R – рецептор.

Эффекторы и вторичные мессенджеры

Существует целый ряд классов эффекторных молекул: циклазные ферменты, фосфолипазы, фосфодиэстеразы, мембранные каналы. Соответственно, существуют и различные типы вторичных мессенджеров: цАМФ, цГМФ, инозитолтрифосфат (ИФ3), диацилглицерин (ДАГ) и вездесущий ион Са2+. В данном разделе будут рассмотрены только два типа эффекторов – аденилат-циклазы (АЦ) и фосфолипаза С-β (ФИФ2-фосфолипаза), которые продуцируют важные вторичные мессенджеры.

Аденилатциклазы

Эти ферменты катализируют формирование цАМФ, вездесущего и, возможно, самого важного вторичного мессенджера в клетках животных. Наиболее существенная роль цАМФ состоит в активации цАМФ-зависимых протеинкиназ (ПК). Будучи активирован, этот мультимерный фермент фосфорилирует (при участии АТФ) тот или иной из множества биологически активных белков, представленных в клетке – ферментативных, рецепторных и канальных белков, ядерных гистонов, факторов транскрипции и т. д. Фосфорилируются, как правило, сериновые, треониновые или тирозиновые остатки, что приводит либо к ингибированию (ср. упомянутую выше десенситизацию G-белок-связанных рецепторов), либо активации белка. Последующее дефосфорилирование, восстанавливающее исходное состояние, обеспечивается одним из множества фосфатазных ферментов цитозоля.

Молекулярно-биологическими методами показано существование в клетках млекопитающих по крайней мере шести различных аденилатциклаз. Все они имеют молекулярную массу около 120–130 кДа, а исследование их гидрофобной части показывает наличие 12 трансмембранных сегментов. Шесть циклаз различаются по чувствительности к β-γ-комплексу G-белков и к Са2+-связывающему белку кальмодулину. Аденилатциклаза типа 1, например, стимулируется Са2+-кальмодулином и ингибируется β-γ-димером, тогда как аденилатциклаза типа 2 не реагирует на первый и стимулируется вторым.

Фосфолипаза С-β (ФЛС-β или ФИФ2-фосфолипаза)

Активация этого важного вторичного эффектора приводит к продукции двух вторичных мессенджероь: инозитолтрифосфата (ИФ3) и диацилглицерина (ДАГ С-β фосфолипида – фосфатидилинозитол 4,5 бифосфата (ФИФ2), который в основном содержится во внутреннем листке плазматической мембраны (рис. 1.10).

Рис.1.10. Путь формирования вторичного мессенджера, включающий ФЛС-β. Активация рецептора ведет через G-белок-связывающий систему к активации ФЛС-β. Последняя расщепляет мембранный липид фосфатидилинозитол-дифосфат на ИФ3 и ДАГ. ИФ3 диффундирует в цитозоль; ДАГ остается в мембране.

Более полное рассмотрение – в тексте.

Рис. 1.10 показывает рецептор, взаимодействующий с неким внешним сигналом, что приводит через G-белковый механизм к активации погруженной в мембрану ФЛС-β. Последняя реагирует с ФИФ2, образуя ИФ3 и ДАГ. ИФ3 – это водорастворимая молекула и потому легко диффундирует в цитозоль. Здесь он может взаимодействовать с соответствующими рецепторами в мембранах эндоплазматического ретикулума, что приводит к освобождению Са2+. Эти ионы имеют многочисленные эффекты на клеточную биохимию. В конце концов ИФ3 инактивируется инозитолтрифосфатазой. С другой стороны, ДАГ – гидрофобное вещество и потому остается в мембране.

Мы не закончили рассмотрение данной системы, поскольку еще не рассмотрели функцию ДАГ. Он взаимодействует с мембранно-связанной протеинкиназой – протеинкиназой С (ПКС), эта реакция является Са2+-зависимой. Следовательно, когда концентрация Са2+ в цитозоле повышается (эффект, который мы видели в случае ИФ3), ДАТ активирует ПКС. Такая активация также требует участия фосфолипида – фосфатидилсерина, который присутствует во внутреннем листке мембраны. Активированная ПКС может активировать белки, вызывающие специфические биохимические ответы. В нейронах продемонстрирован целый ряд таких реакций, в том числе синтез и секреция нейромедиаторов, изменение чувствительности рецепторов и функции цитоскелета.

Из изложенного выше ясно, что G-белковая система обеспечивает чрезвычайно гибкий способ трансформаци внешнего сигнала во вторичный мессенджер, который может диффундировать в цитозоль. Вторичных мессенджеров достаточно много (в зависимости от эффекторного фермента), однако наиболее распространенным является циклический АМФ (цАМФ). Альтенативным вариантом, как упоминалось выше, может быть воздействие α-субъединицы на работу мембранного канала, что в свою очередь может изменять электрическую полярность мембраны.

1.1.5. Каналы и воротные механизмы

Как показано выше, биомембрана состоит из белков, погруженных в липидный бислой, эффективно препятствующий проникновению гидрофильных веществ через мембрану. Погруженные в бислой белки часто формируют гидрофильные каналы, через которые могут проходить неорганические ионы и другие водорастворимые вещества. Некоторые из этих каналов, т. н. «каналы утечки», позволяют ионам, например ионам калия, перемещаться по градиенту концентрации в клетку или из нее; другие играют более активную роль и действуют как воротный механизм, контролирующий ионные потоки.

Каналы разделяются на две основные категории: активируемые лигандам и потому называемые медиаторными ионными каналами (МК) и управляемые потенциалом на мембране (потенциал-зависимые каналы, ПЗК).

Медиаторные каналы (МК)

Существует множество МК. Наиболее интенсивно исследуемым является никотиновый ацетилхолиновый рецептор (н-АХР). Он представляет собой большой (268 кДа) пентамерный белок, погруженный в мембрану. Пентамер объединяет две (по 461 аминокислоте) α-субъединицы, одну (493 аминокислоты) β-субъединицу, одну – (506 аминокислот) γ-субъединицу и одну (522 аминокислоты) δ-субъединицу. Каждая из субъединиц образует 4 трансмембранных сегмента (рис. 1.11 А), а все вместе 5 субъединиц компактно собраны вокруг центральной ионной поры (рис. 1.11 Б). Когда лиганд, в данном случае ацетилхолин (АХ), присоединяется к сайтам связывания двух α-субъединиц, канал открывается и одновалентные катионы двигаются по электрохимическому градиенту.

Рис.1.11.(А) Схематическое изображение α-субъединиц н-АХ-рецептора. Четыре спирали, представленные цилиндрами, пересекают мембрану. И С-, и N-концы локализованы внеклеточно. (Б) Сечение рецептора. Пентамерная структура целого рецептора сверху. Предполагается, что вторая спираль каждой субъединицы образует поверхность поры.

Известно много других типов МК, они активируются различными медиаторами (серотонином, глицином, γ -аминомасляный кислотой – ГАМК и т. д.) и все эти основные типы МК подразделяются на множество подтипов. Что касается сенсорных систем, наиболее важные МК, обнаруженные в обонятельных и фоторецепторных клетках, чувствительны к циклическим нуклеотидам (ЦНВ). В отличие от н-АХР-каналов, белок субъединицы образует 6 трансмембранных сегментов, а целый канал состоит из четырех субъединиц.

Потенциал-зависимые ионные каналы (ПЗК)

Существует также множество типов ПЗК. Все они активируются изменениями мембранного потенциала и различаются по типу ионов, движение которых регулируют. Таким образом, есть огромное множество потенциал-зависимых К+-каналов, а также различные типы С1, Са2+- и Nа+-каналов. Рассмотрим потенциал-чувствительного Nа+-канала. Именно этот канал ответствен за восходящую фазу потенциала действия и является, таким образом, определяющим элементом возбудимых тканей, таких, как нервы и поперечно-полосатая мускулатура.

Потенциал покоя на мембране большинства клеток составляет около 50-60 мВ (заряд внутриклеточной среды отрицательный по отношению к внеклеточной). Казалось бы – немного. Однако следует помнить, что биологические мембраны очень тонки – не более 6-7 нм, так что разность потенциалов, на самом деле, очень значительна. Градиент потенциала в 60 мВ на 6 нанометрах составляет 105 В/см. Потенциал-зависимые белки в этом интенсивном электрическом поле ведут себя очень специфически. Любые изменения градиента потенциала воздействуют на конформацию ПЗК и, соответственно, открытое или закрытое состояние ионного канала.

Структура Nа+-канала была объектом интенсивных исследований и к на
стоящему времени хорошо известна (схематически показана на рис. 1.12).
Этот массивный полипептид (1820 аминокислот), как показано на рис. 1.12,
состоит из четырех последовательных гомологичных друг другу доменов, каждый из которых образует шесть трансмембранных спиралей. Четвертая из них
(54) в каждом домене содержит множество положительно заряженных аминокислотных остатков (особенно, аргинина и лизина), что и образует, как полагают, «сенсор потенциала», чувствительный к изменениям потенциала на мембране. Предполагается, что между пятой (85) и шестой (56) трансмембранной спиралями в каждом домене полипептидной цепи формируется «шпилька» (Н5), входящая в мембрану. Если представить трехмерную форму белка как полого цилиндра, «шпилька» выстилает пору и обеспечивает ионную селективность. Наконец, внутриклеточный сегмент полипептида между гомологичными доменами III и IV ответствен за инактивацию канала.

Рис.1.12. Схема расположения Nа+-канала в мембране. Четыре домена помечены I, II, III, IV. В реальности четыре домена формируют трехмерный агрегат с центральным каналом. Дальнейшие объяснения – в тексте.

Физиология Nа+-канала также глубоко исследована. Показано, что, когда разность потенциала на мембране падает ниже определенного порога, канал открывается на прибл. 1 мс и пропускает ток порядка 2 пА. По прошествии 1 мс времени открывания канал закрывается и не откроется больше, пока мембрана остается деполяризованной. Инактивация, как говорилось выше, связана с сегментом полипептида между доменами III и IV, блокирующим канал. Таким образом, канал существует в трех основных конформациях: закрытой, открытой и инактивированной. Этот цикл показан на рис. 1.13.

Рис.1.13. Цикл изменения конформации натриевого канала. (А) В покоящейся мембране натриевый канал закрыт. Активирующий воротный механизм (AG) закрыт, инактивирующий (IG) – открыт. (Б) Когда мембрана деполяризуется, изменение потенциала детектируется «сенсором потенциала», и активирующий механизм открывается. Ионы натрия двигаются по электрохимическому градиенту. Они перепрыгивают с одного сайта в канале на другой (как показано на рисунке) и, таким образом, «двигаются колонной». (В) через 1 мс инактивирующий механизм закрывается. (Г) Когда мембрана возвращается к уровню потенциала, активирующий механизм закрывается, а инактивирующий – открывается снова.

Точное время открывания и закрытия канала точно непредсказуемо, иными словами – это стохастический процесс. Кроме того, каждый участок возбудимой мембраны обладает большой популяцией Nа+-каналов, и порог открывания каждого из них несколько варьирует. По мере того, как возбудимая мембрана деполяризуется, открывается все больше Nа+-каналов. Входящий поток ионов Nа+ деполяризует и, в конце концов, даже реполяризует мембрану, образуя то, что электрофизиологи называют потенциалом действия (спайк).

2.2. Мембрана и потенциал действия

Как было показано ранее, с самого начала липидная биомембрана является границей между первичными клетками и окружающей средой. Поскольку ныне существующие клетки эукариот содержат множество внутренних мембран (митохондриальные, мембраны эндоплазматического ретикулума, лизосом и т. д.), стоит выделить внешнюю мембрану как плазматическую. Мы видели выше, что белковые элементы плазматической мембраны эволюционировали в направлении детектирования изменений во внешней среде и (в некоторых случаях) сигнализации об этих изменениях через мембранно-связанный G-белок. Плазматическая мембрана также развила средства контроля движения различных веществ в клетку и из нее. Следует помнить, что основой современных биомембран является липидный бислой. Гидрофильные вещества не могут (по определению) диффундировать через гидрофобный барьер липидного бислоя. Здесь не место для рассмотрения множества механизмов, которые сформированы клеткой, чтобы обойти это препятствие, однако, один из них должен быть рассмотрен здесь в некоторых деталях. Это – механизм или, скорее, группа механизмов, которые контролируют движение малых неорганических ионов через мембрану.

Неорганические ионы, конечно, водорастворимы. Электростатический заряд позволяет им входить в водную структуру и смешиваться с ней (рис. 2.1). С другой стороны, он препятствует их смешиванию с органической фазой, которая в данном случае представлена липидным бислоем. Чтобы пропустить их внутрь, необходимы гидрофильные «поры» в биомембране. Множество видов таких пор возникло с тех пор, как первые прокариоты возникли три с половиной миллиарда лет назад. Во всех случаях – это сложные белковые структуры, погруженные в мембрану. В целом, каналы очень специфичны в отношении того, какие ионы они пропускают.

Рис.2.1. Ионы в водной структуре. Молекулы воды электрически поляризованы. Поскольку кислород оттягивает на себя электрон от водорода, локальный отрицательный заряд связан с этим концом молекулы. Равный ему и противоположный по знаку заряд связан с другим концом. Вследствие этого молекулы воды стремятся образовать структуру вокруг положительно или отрицательно заряженных ионов, таких как С1 или Nа+, изолируя их друг от друга в растворе.

Сам факт, что ионы – это заряженные частицы, означает что их распределение у мембраны может быть выражено в электрических величинах. Еще со времен Гальвани и Вольта в конце восемнадцатого столетия известно, что функционирование нервной системы связано с электрическими явлениями. Однако только к середине XX века, когда были развиты электрические (в особенности, электронные) технологии, а также адекватные биологические препараты (гигантский аксон) удалось добиться истинного понимания «животного электричества».

Рассмотрим в первую очередь происхождение потенциала покоя (Vm), который существует на плазматической мембране, и покажем, как он меняется, когда рецепторные клетки подвергаются воздействию стимула и формируют т. н. «рецепторные потенциалы». Затем мы рассмотрим пассивные свойства электрических токов – т. н. кабельное или электротоническое проведение, которое играет важную роль во всех сенсорных и нейросенсорных клетках. Наконец, мы кратко рассмотрим природу рецепторного и генераторного потенциалов, сенсорной адаптации и важного феномена потенциала действия.

2.2.1. Измерение потенциала покоя

Уже говорилось, что потенциал покоя формируется на всех плазматических мембранах. Большинство клеток, в особенности нейронов и сенсорных клеток, крайне малы. Хотя сейчас методы исследования их электрических характеристик уже развиты, очень долго не удавалось провести точные измерения. Осознание того факта, что огромная трубчатая структура с диаметром 500–600 мкм у кальмара Loligo представляет собой гигантский аксон, имело огромное значение для электрофизиологов. Наконец-то они получили возможность ввести тонкие стеклянные микропипетки, заполненные электролитом, в аксон и измерить электрическую полярность мембраны непосредственно (рис. 2.2). Оказалось возможным и выдавить аксоплазму, как пасту из тюбика, и подвергнуть ее химическому анализу (табл. 2.1). Большинство пионерских работ, которые установили физические основы потенциалов покоя и действия были выполнены на этом общепринятом препарате.

Рис.2.2. На схеме показан стеклянный микроэлектрод, заполненный раствором KCl, введенный в гигантский аксон. Электрический контур проходит через вольтметр на пластину электрода на внешней поверхности аксона.

Используя условия, показанные на рис. 2.2, было обнаружено, что внутриклеточный электрод регистрирует на мембране падение потенциала на прибл. 50 мВ. Этот потенциал был определен как потенциал покоя, Vm. Что же вызывает формирование разности потенциалов на мембране?

2.2.2. Ионные основы потенциала покоя

Мы уже отмечали, что был определен ионный состав аксоплазмы (табл. 2.1). Известно также, что существуют уравнения физической химии, которые связывают электрический потенциал на мембране с распределением ионов, способных проникать через нее. Наиболее известно уравнение Нернста, которое может быть записано в форме:

(2.1)

В уравнении 2.1 – потенциал на мембране (в вольтах, хотя обычно это величины порядка милливольт), возникающий вследствие распределения иона I; R – газовая константа; Т– температура по Кельвину; F– число Фарадея (величина электрического заряда на моль одновалентного иона);  – валентность иона (+1 для Nа+ и К+; –1 для С1); ln – натуральный логарифм; и – концентрации иона I по внешнюю и внутреннюю стороны мембраны, соответственно. Важно отметить, что одной из посылок, из которой получено уравнение Нернста, является то, что мембрана полностью проницаема для рассматриваемого иона. При выполнении этого условия и известных равновесных концентрациях иона на мембране можно предсказать равновесный электрический потенциал.

Табл.2.1. Концентрации ионов внутри и во внешней среде некоторых из обсуждаемых клеток.

Проверим уравнение заменой некоторых значений концентраций К+ по обе стороны мембраны. Во-первых, если предположить, что концентрации К+ по обе стороны мембраны равны, тогда подстановка их в уравнение Нернста обращает часть под логарифмом в единицу. Поскольку логарифм 1 – ноль, то уравнение дает нулевой потенциал на мембране. Это, собственно, то, что и наблюдается. Когда клетка погибает, мембрана утрачивает целостность, а ее насосные механизмы исчезают. Ионы движутся по своим градиентами концентраций до тех пор, пока их концентрации по обе стороны мембраны не уравниваются, а потенциал на ней не исчезает.

Теперь проверим уравнение подстановкой значений концентраций [К+]0 (около 5,5 мМ) и [К+]i (около 150 мМ), показанных в табл. 2.1. Тогда

Эта величина известна как нернстовский калиевый потенциал Vm или потенциал реверсии для калия. Смысл последнего термина состоит в том, что, когда на мембране удерживается такой градиент потенциала, отсутствует какой-либо результирующий поток этого иона через мембрану. Измерение реального потенциала покоя Vm на клеточной мембране обычно дает значения между –50 мВ и –75 мВ. Vk очевидно больше этих величин, однако совпадает по знаку и порядку величины. Если, однако, подставить в уравнение Нернста значения концентраций других существенных ионов (С1, Nа+ и т. д.) получающиеся значения (VCl, VNa и т. д.) отличаются от Vm очень сильно. Особенно это заметно, если подставить значения концентраций для Nа+.

Причины таких отклонений понять нетрудно. Клеточные мембраны – это очень сложные структуры. Их проницаемость для разных ионов резко различается и, как было отмечено выше, уравнение Нернста работает только в случае ионов, для которых мембрана полностью проницаема. Известно, однако, что и ионы натрия, и ионы хлора имеют очень маленькие коэффициенты проницаемости через покоящиеся биомембраны.

Далее, важно, что Vm зависит не от трансмембранного распределения какого-то одного вида ионов, а от распределения всех ионов. Таким образом, для более полного понимания природы потенциала покоя следует обобщить уравнение Нернста. Оно должно учитывать различную проницаемость мембраны для разных ионов и то, что существенен не один тип ионов, а много.

Уравнение, о котором идет речь, выведено Дэвидом Голдманом и впоследствии стало известно как уравнение Голдмана. Его иногда называют и «уравнением постоянного поля», поскольку предполагается, что электрическое поле на мембране (градиент электрического потенциала Vm) неизменно, что, конечно, очень большое допущение. Тем не менее, уравнение Голдмана дает полезное первое приближение оценки биофизической ситуации на мембране. Оно записывается следующим образом:

(2.2)

где Р – константа проницаемости иона, квадратные скобки обозначают, как это принято, концентрации иона с внутренней (обозначены «i») и внешней (обозначены «о») стороны мембраны, а R, T и F– их обычные значения.

Отметьте, что, если внешние концентрации катионов К+ и Na+ помещены в числитель уравнения, то внешняя концентрация аниона С1 – в знаменатель.

Проведем еще несколько опытов. Во-первых, если мы примем константы проницаемости для Nа+ и С1 равными нулю, то уравнение вырождается в уравнение Нернста для калия. Сходным образом, если принять РК = РС1 = 0, уравнение сводится к уравнению Нернста для Nа+ и дает VNa равным потенциалу на мембране (величина проницаемости для Nа+ удалена).

Липидный бислой плазматической мембраны, как это было показано в начале данной главы, полностью непроницаем для неорганических ионов. Они перемещаются через мембрану по каналам, образованным мембранными белками. Многие из этих т. н. «каналов утечки» еще не охарактеризованы полностью. Проницаемость плазматической мембраны для гидрофильных ионов зависит от этих каналов. «Пропускная способность» этих каналов у разных клеток варьирует. Нейроглиальные клетки, например, вероятно, более проницаемы для К+, чем нейроны.

Большинство сенсорных клеток, однако, сходны с нейронами по их большей проницаемости к К+, чем к С1 и Nа+:

Можно привести некоторые данные по сравнительной проницаемости, полученные из измерения потоков радиоизотопов ионов через плазматические мембраны:

Подставим эти константы проницаемости и соответствующие концентрации ионов (табл. 2.1 – мотонейрон кошки) в уравнение Голдмана:

Это значение Vm действительно очень близко к значению потенциала покоя у мотонейронов кошки, наблюдаемого при микроэлектродной регистрации.

Теперь посмотрим, что происходит, если повысить калиевую проницаемость на порядок. Если подставить в уравнение величину Рк = 1·10-6 см/с, все остальные параметры оставив неизменными, получим

Vm = –83 мВ

Уже было отмечено, что некоторые глиальные клетки существенно более проницаемы для К+, чем мембраны нейронов. Потому-то Vm на мембранах глиальных клеток заметно выше, чем потенциал покоя мембран нейронов. В сетчатке крупные глиальные клетки – мюллеровские клетки, имеют Vm от –70 до –90 мВ. Эта большая, чем обычно, К+-проницаемость, вероятно, имеет существенное значение для устранения избытка К+, образующегося в клетках сетчатки в ответ на освещение. Избыток К+ затем растворяется в жидкости стекловидного тела. Напротив, если повысить в уравнении Голдмана константу проницаемости для Nа+, можно предсказать значительное понижение Vm.

Необходимо отметить, что значительно легче измерять относительные, а не абсолютные проницаемости для ионов, поэтому уравнение Голдмана часто записывают в несколько ином виде:

(2.3)

где и

Поскольку ион хлора играет меньшую роль во многих нейрофизиологических функциях, уравнение иногда упрощают еще больше:

(2.3)

Однако, хотя ион хлора несущественен в многих областях нейрофизиологии, он играет ключевую роль в гиперполяризации в тормозных синапсах и в других случаях. В таких и подобных случаях важно использовать полную форму уравнения Голдмана.

2.2.3. Электротонические потенциалы и кабельное проведение

Рассмотрим рис. 2.3. Невозбудимая мембрана слабо деполяризована. Это следует особо подчеркнуть – на невозбудимой мембране нет риска вызвать формирование потенциала действия. Подобраны условия для детектирования очень маленьких, т. н. локальных токов. Внутренняя среда клетки, по сути дела, – ионный раствор, так же как и внеклеточная жидкость. Из этого следует, что они пропускают электрический ток. Если деполяризовать мембрану в точке «х», установится некоторая разность потенциалов между ней и точкой «у», находящейся от нее на некотором расстоянии. Расстояние, конечно, небольшое – редко больше, чем 1 микрон. Тем не менее, на этой дистанции малые электрические токи протекают до тех пор, пока не будет устранена разность потенциалов. Следовательно, и в точке «у» мембрана будет слегка деполяризована. Такие небольшие потенциалы известны как электротонические, а локальные токи – как электротонические токи или кабельное проведение.

Рис.2.3. Электротоническое проведение. Ток входит в точке «х» и приводит к формированию потенциала на мембране Vx. Отводящий электрод в точке «y» измеряет электротонический потенциал. Локальные токи показаны стрелками. Для упрощения рисунка токи из внешней среды не показаны.

Амплитуда электротонических потенциалов по крайней мере на порядок, а иногда и на два или более порядков, меньше, чем потенциала действия. Тем не менее, как ни малы электротонические потенциалы, их эффекты могут быть весьма значительны. Чтобы убедиться в этом, достаточно лишь вспомнить о чрезвычайной чувствительности потенциал-зависимых ионных каналов, таких как Ка+-каналы. Если локальные токи, распространяющиеся из области, где мембрана деполяризована, достигнут участка, изобилующего Nа+-каналами, возникающая деполяризация может запустить потенциал действия, передающийся в мозг, что само по себе может иметь непредсказуемые последствия.

2.2.4. Рецепторный и генераторный потенциалы

Рецепторный и генераторный потенциалы – это частные случаи электротонических потенциалов. Когда рецепторная (сенсорная) клетка, например механочувствительная волосковая или вкусовая, подвергается воздействию соответствующего стимула, реализуется более или менее сложный набор событий (который будет рассмотрен в деталях в последующих главах), ведущих к изменениям электрической полярности участка их мембраны. Это явление именуется рецепторный потенциалом. В большинстве случаев рецепторные потенциалы – это деполяризация, в других, однако, в частности в палочках и колбочках сетчатки, – это гиперполяризация. Так или иначе, результат – одни и тот же – возникают токи между подвергающимся воздействию участком мембраны и другими участками мембраны рецепторной клетки (рис. 2.4). В общем случае, изменения электрической полярности (увеличение ее или уменьшение) влияет на выделение медиатора на подлежащий сенсорный нейрон.

Рис.2.4. Рисунок показывает локальные токи, распространяющиеся от деполяризованного участка мембраны (отмечен черным) рецепторной клетки. В общем случае это ведет к деполяризации клетки, а это путем сложного биохимического процесса к выделению медиаторного канала.

Рис.2.5. Деполяризация окончаний нейросенсорной клетки ведет к формированию локальных токов, которые инициируют потенциал действия.

Не все сенсорные системы развили специализированные семерные клетки. Обонятельные и некоторые механорецептивные системы построены на нейросенсорных клетках. В таких случаях функции детектирования соответствующих факторов внешней среды и передачи информации в мозг совмещаются в одной клетке (рис. 2.5). Электрофизиологические феномены при этом аналогичны только что описанным. Когда чувствительные окончания нейросенсорной клетки подвергаются воздействию стимула, ряд биохимических процессов приводит к изменению электрического потенциала (в случае нейросенсорных клеток – это всегда деполяризация). Механизмом локальных токов деполяризация распространяется в область мембраны, изобилующую потенциал-зависимыми Nа+-каналами. Если деполяризация достаточно велика, Nа+-каналы открываются, в результате чего генерируется потенциал действия, который без декремента передается в центральную нервную систему. Поскольку первоначальная деполяризация происходит не в специальной рецепторной клетке, она часто именуется генераторным потенциалом. Многие, однако, оба варианта называют рецепторными потенциалами.

Амплитуда генераторных и рецепторных потенциалов зависит от величины стимула – между потенциалом и интенсивностью стимула существует практически прямая пропорциональная зависимость (рис. 2.6). Из-за того, что локальные токи должны быть достаточно значительными по величине, чтобы запустить выделение медиатора (рис. 2.4) или активировать хотя бы часть популяции потенциал-зависимых Nа+-каналов до порогового уровня, запуск потенциала действия в сенсорном нерве наблюдается только, когда рецепторный или генераторный потенциал достигают определенной амплитуда. Иными словами, потенциал действия не генерируется до тех пор, пока стимул не достигнет критической величины (Sс на рис.2.6).

Рис.2.6. Соотношение интенсивностей стимула и величины рецепторного (генераторного) потенциала. График показывает первичные ответы на стимулы разной интенсивности. Как указывается в тексте, адаптация снижает амплитуду рецепторного (генераторного) потенциала при большой продолжительности стимула.

2.2.5. Сенсорная адаптация

Все сенсорные системы демонстрируют адаптацию. Это означает, что ответ (каким бы они ни был) на постоянный стимул с течением времени уменьшается. В сенсорных системах многоклеточных это выражается в том, что частота импульсации в волокне сенсорного нерва со временем снижается. В таких системах присутствует несколько форм адаптации. Обычно различают две крайние формы – быструю и медленную адаптацию (рис. 2.7). В первом случае при включении стимула сначала наблюдается быстрый залп активности в сенсорном волокне, которая быстро уменьшается еще до того, как стимул будет выключен. Выключение стимула также сопровождается залпом активности. Во втором случае также наблюдается залп активности при включении стимула, которая, хотя и уменьшается со временем, никогда не достигает нуля. Активность остается на некотором уровне плато до выключения стимула, когда она переходит на исходный уровень. В обоих случаях именно частота первого залпа характеризует интенсивность стимула.

Рис.2.7.Сенсорная адаптация. (А) Быстро адаптирующееся волокно; (Б) медленно адаптирующееся волокно.

Биологические причины сенсорной адаптации многочисленны и разнообразны. Например, в некоторых случаях бактериальной хемочувствительности это происходит в результате метилирования белков «переноса рецептора». В многих животных системах, в которых рецепторные молекулы связаны с системой G-белков, это – результат инактивации рецепторной молекулы путем дефосфорилирования. Присутствие Са2+-каналов и кальций-зависимых К+-каналов (КСа) наряду с Nа+-каналами, в которых зарождается потенциал действия в сенсорных нервных окончаниях, также очень существенно. Когда мембрана деполяризуется в ответ на локальные токи, приходящие от стимулированных окончаний, потенциал-зависимые Са2+-каналы открываются, и поток Са2+ устремляется по градиенту концентрации в нейрон. Повышение внутриклеточного уровня Са2+ внутри клетки открывает Са2+-зависимые К+-каналы и избыток К+ также двигается по градиенту концентрации вовне клетки. Другими словами, мембрана становится необычно проницаемой для К+. Если подставить эту увеличенную константу проницаемости для К+ в уравнение Голдмана, то оно предскажет гиперполяризацию мембраны. В таких условиях локальным токам значительно труднее открыть потенциал-зависимые Nа+-каналы и инициировать потенциал действия. Таким образом, скорость импульcации снижается, в чем и проявляется сенсорная адаптация. Эта последовательность событий схематически отражена на рис. 2.8.

Рис.2.8.Один из механизмов, вызывающих адаптацию сенсорных окончаний. Деполяризация вызывает открытие Са2+-воротного механизма; ионы Са2+ входят в цитоплазму и воздействуют на Са2+-зависимые К+-каналы, что ведет к увеличению мембранной полярности, вследствие чего снижается вероятность инициации потенциала действия.

Биофизическая и молекулярно-биологическая ситуация в сенсорных окончаниях животных несомненно чрезвычайно сложна.

2.2.6. Потенциал действия

Поскольку органы чувств животных передают информацию в аналитический аппарат центральной нервной системы в форме потенциалов действия в сенсорных нервных волокнах, то их следует описать хотя бы в общих чертах.

Мы уже отмечали выше, что когда мембранное окружение популяции Nа+-канальных белков деполяризовано, каналы с наиболее низким порогом открываются, и Nа+ начинает по градиенту концентрации поступать в аксон. Этот процесс имеет эффект положительной обратной связи. По мере того, как Nа+ во все большем количестве входит в клетку, мембрана деполяризуется еще больше, вследствие чего открываются соседние более высокопороговые Nа+-каналы. Поток Nа+ увеличивается, мембрана деполяризуется и так далее. Мембрана достигает нулевого потенциала и реполяризуется (отрицательный заряд снаружи, положительный – внутри) до достижения нернстовского потенциала для Nа+ (VNa). Вследствие эффекта положительной обратной связи реверсия потенциала происходит очень быстро. В большинстве случаев VNa достигается в течение 0,5 мс, затем воротный механизм для Nа+ начинает закрываться.

Очень вскоре после открытия Nа+-каналов (<0,5 мс) срабатывает другой воротный механизм – открывается калиевый. Это позволяет ионам К+ покинуть аксон, а, поскольку Nа+-механизм закрывается, мембрана возвращается к исходной полярности, несколько превышает ее и приближается к нернстовскому К+-потенциалу, VK. Активность АТФ-зависимого Nа+/ К+-насоса в мембране возвращает ее к нормальному уровню потенциала покоя (Vm). Все эти события и результирующие изменения мембранной полярности показаны на рис. 2.9.

Рис. 2.9. Основные ионные каналы и характеристики проведения, ответственные за формирование потенциала действия. (A) Na+- и К+-проведение показано кривыми, помеченными gNa и gK (левая ордината градуирована в мСи/см2). Пунктирная линия показывает потенциал на мембране, образующийся за счет этих проводимостей. Горизонтальные пунктирные линии вверху и внизу рисунка показывают VNa и VK, соответственно. (Б) Ось времени сильно растянута по сравнению с (А). Верхнюю часть рисунка (Б) следует сравнивать с пунктирной линией на рисунке (А). Нижняя часть рисунка (Б) показывает потоки Na+ и К+, которые возникают вследствие открывания и закрывания Na+- и К+-каналов аксональной мембраны.

Ну, теперь все в порядке, однако смысл потенциала действия (нервного импульса) заключается в его распространении. Как это драматическое изменение мембранной полярности распространяется? И снова ответ заключается в локальных токах. Мы уже видели, что деполяризация небольшого участка мембраны ведет к возникновению малых электрических токов, распространяющихся отсюда и деполяризующих следующие участки мембраны на небольшом расстоянии. То же самое происходит и когда мембрана резко меняет полярность при прохождении потенциала действия, описанного выше. Локальные токи, деполяризуя соседний участок мембраны, так же открывают в нем Nа+-каналы и запускают последовательность событий, ответственную за формирование потенциала действия, описанную выше. Можно сказать, что потенциал действия похож на огонь, бегущий по дорожке из пороха. Каждый активированный участок запускает последующий, оставляя за собой дорожку из пепла. В случае нервного волокна инактивация, символизируемая пеплом, представляет собой гиперполяризацию мембраны вслед за прошедшим потенциалом действия (рис. 2.9) и, что более существенно, то, что Ка+-воротный механизм остается в закрытом состоянии в течение прибл.1,5 мс после их потенциал-зависимого открывания. Это состояние мембраны именуется рефрактерностью.

Рефрактерный период длительностью 1,5–2 мс имеет существенное значение для сенсорной сигнализации. Он ограничивает частоту, с которой импульсы могут следовать по сенсорному нервному волокну. Такая длительность означает, что сенсорное волокно в состоянии проводить импульсы с частотой не выше 500 Гц. Это важно, например, в детектировании частоты звука и частотной дискриминации в слуховой системе.

В то время, как рефрактерный период ограничивает частоту, с которой импульсы могут проводиться по нервному волокну, диаметр последнего (при прочих равных) определяет скорость проведения (табл. 2.2). Чем больше диаметр, тем дальше по аксоплазме распространяются локальные токи и на большем расстоянии они могут открыть Nа+-воротный механизм. Поэтому у многих беспозвоночных, например, кольчатых червей и головоногих моллюсков, развились гигантские волокна, обеспечивающие быстрое проведение, необходимое для реакции избегания. Позвоночные развили иной механизм увеличения скорости проведения – миелинизацию.

Табл.2.2.Некоторые характеристики афферентных волокон млекопитающих.

Миелин состоит из нескольких слоев мембран шванновских клеток, обвивающихся вокруг аксон, и обеспечивает очень эффективную электрическую изоляцию. Последняя предупреждает утечку внутриклеточного компонента локального тока из аксоплазмы, «удерживая» его внутри волокна, и обеспечивает его распространение. У беспозвоночных такого специфического и эффективного механизма повышения скорости проведения не развилось.

Табл. 2.2 показывает скорость проведения импульсов в афферентных волокнах млекопитающих. Афферентные волокна мышц состоят из четырех перекрывающихся классов (I–IV), чья скорость проведения составляет от 120 м/с в наиболее крупных миелинизированных волокнах (диаметр ок. 20 мкм) до прибл. 0,5 м/с в самых тонких немиелинизированных (диаметр ок. 0,5 мкм). В сенсорных нервах кожи отсутствуют наиболее быстрые волокна класса I (или Аα). Кожные нервы, таким образом, подразделяются на три группы Аβ, Аδ и С, что соответствует группам II, III и IV мышечных афферентов.

2.2. Функциональное описание СС

В этом разделе мы рассмотрим глобальные черты, общие для различных сенсорных систем. Однако, прежде, чем мы займемся этим, стоит провести разграничение между двумя подходами к изучению сенсорных систем.

Первый подход сводится к установлению корреляций между физическим стимулом и ответной реакцией животного (и человека). Сенсорная система рассматривается как «черный ящик». Исследователь анализирует (часто – в мельчайших деталях), что может, а чего не может сделать «черный ящик», что он может или не может детектировать или дискриминировать. При этом исследователь, однако, не лезет внутрь ящика, чтобы разобраться, какие шестеренки, колесики и проводки важны для того, чтобы он работал. В случае изучения человека экспериментатор пытается коррелировать физический стимул со словесным ответом испытуемого, выражающего его или ее субъективную реакцию. Такие исследования по очевидным причинам именуются психофизическими. В случае животного психофизический подход более сложен. Приходится устанавливать корреляции между физическим стимулом и каким-либо аспектом поведения животного. Поведенческие реакции могут быть весьма утонченными, животное можно натренировать давать ответ на стимул (кондиционировать), сам стимул можно варьировать по интенсивности, чтобы изучить, на каком уровне он может детектироваться. Можно отметить, что многие и делают, что вербальный ответ испытуемого – тоже не более, чем форма поведения. И снова, как и всегда при изучении сенсорных систем, мы оказываемся в непосредственной близости от проблемы соотношения мозга и мышления. Все же, оставляя в стороне все эти сложности, можно сказать, что намного проще коррелировать стимул и ответ у подготовленного человека, чем у других животных. Действительно, психофизические исследования человека принесли некоторые наиболее точные определения того, что центральная нервная система может, а чего – нет.

Второй подход состоит в том, что исследователь пытается залезть внутрь черного ящика психофизики. Внимание здесь сфокусировано на физиологии сенсорной системы, включая, в случае млекопитающих, сенсорную кору, а не на поведенческом ответе. Реакция этой системы на адекватные стимулы исследуется на различных уровнях – от молекулярного и субклеточного до уровня сенсорных анализаторов в мозге. Исследователь может изучать и ответы индивидуальных сенсорных клеток на стимул или – на противоположном конце спектра – регистрировать физиологические ответы коры мозга. Вся надежда на то, что эти два подхода – сенсорно-физиологический и психофизическо-поведенческий – в конце концов объединившись, принесут всестороннее понимание того пути, которым человек и другие животные реагируют на внешнюю среду.

2.3. Классификация чувств

Все организмы живут в среде, полной изменений, полной событий. Какие-то из этих изменений благоприятны для организма, какие-то неблагоприятны. Некоторые происходят независимо от организма, а некоторые являются плодом деятельности самого организма. Для выживания организму необходима максимальная информация о том, что происходит, поэтому он развил целый арсенал сенсорных датчиков. Как всегда, работу лучше всего делают специалисты. Сенсорные детекторы специализированы для того, чтобы отвечать на определенный тип изменений окружающей среды. Как мы увидим, они становятся чрезвычайно чувствительными к специфическому типу стимула, во многих случаях достигая физического предела. Основные изменения в окружающей среде (тех, что касаются большинства организмов) могут быть сгруппированы в большие категории механических, химических, электромагнитных и термических. Соответственно, мы можем классифицировать основные сенсорные системы как механорецептивную, хеморецептивную и фоторецептивную. В отличие от этих трех основных классов рецепторов, терморецепторы, хотя и так же вездесущие, за исключением некоторых зачатков у змей, не развили сложного чувствительного органа. Помимо этих четырех классов рецепторов у некоторых животных развились электрорецепторы, чувствительные к электрическим полям и магниторецепторы, известные у прокариот и подозреваемые у некоторых животных. Тип стимула, на который настроен специфический рецептор называется адекватным стимулом.

Классификация сенсорных рецепторов в соответствии с типом энергии из окружающей среды, к которой они наиболее чувствительны, – важный и очевидный путь группировки чувствительных органов.

Альтернативная классификация построена не на типе детектируемой энергии, а на том, направлены ли чувствительные окончания вовнутрь организма, контролируя события внутренней среды организма, либо вовне – во внешнюю среду. Эта классификация – на интеро- и экстерорецепторы. Тогда как фоторецепторы являются исключительно экстерорецепторами (не существует существенных электромагнитных полей внутри организма, которые требуют контроля), остальные три модальности чувств могут быть связаны как с экстеро-, так и интерорецепторами. Интерорецепторы, хотя они и не развитых столь же впечатляюще, как многие экстерорецепторы, тем не менее также важны. У высших животных, особенно млекопитающих и птиц, контроль внутренней среды важен для гомеостатического механизма, от которого зависит сама их жизнь.

3.2. Модальность, интенсивность, адаптация

Модальность

Как было отмечено ранее, биофизика нервного импульса идентична во всех нервных волокнах. Эволюция, единожды «найдя» эффективный механизм передачи информации, придерживалась его, лишь едва усовершенствуя в геологических масштабах времени. Это означает, что информация из всех сенсорных органов трансформируется в идентичные сигнала в центральную нервную систему (ЦНС). Из этого следует, что ЦНС не имеет иного пути распознать, о чем говорят поступающие в нее по нервным волокнам импульсы – звуке, свете, температуре или запахе, – кроме как по тому, какие именно волокна активированы. Имеются данные, что, если переключить эти «меченные линии» хирургически – направив слуховые волокна в зрительную кору, а зрительные волокна – слуховую, то мы услышим молнию, как гром, и увидим гром, как молнию. Это, естественно, ставит перед нами потрясающие философские вопросы. Поскольку зрительная и слуховая кора на клеточном уровне существенно не различаются (еще менее – на биофизическом), то почему активность в одном участке коры вызывает ощущение звука, а в другом – совершенно иное ощущение – зрения? Еще интереснее и, может быть важнее для ответа на философские вопросы то, что если хирургическое «переключение» выполнено точно на эмбрионах млекопитающих, то слуховая кора развивает некоторые характеристики зрительной и наоборот.

Интенсивность

События во внешнем мире различаются не только по типу, но и по интенсивности. Грубо говоря, интенсивность стимула кодируется частотой потенциалов действия в волокне сенсорного нерва. То есть ЦНС необходимо «разобраться», какой именно сенсорный нерв активирован (что определяет сенсорную модальность) и оценить частоту импульсации в нем (которая определяет интенсивность модальности), чтобы получить адекватную информацию о событиях во внешней и внутренней среде.

Наиболее слабые стимулы, которые организм способен детектировать называются пороговыми (сенсорный порог). Организму (или в случае человека – субъекту) предъявляется серия стимулов возрастающей интенсивности и выясняется (выработкой рефлекса или словесным ответом в случае человека), когда стимул детектируется впервые. Порог определяется как стимул, детектируемый в половину случаев предъявления (рис. 3.1). Кривая, представленная на рис. 3.1, известна как психометрическая функция или кривая.

Рис.3.1. Психометрическая кривая. Порог определен как интенсивность стимула, при которой половина реакции правильна. Ордината дана в условных единицах. Кривая сдвигается вправо или влево в зависимости от обстоятельств.

Сенсорные пороги не постоянны. Они зависят от множества факторов, в особенности от утомления, ситуации, опыта и т. д. Это подчеркивает тонкость физиологии мозга, здесь задействованы многочисленные петли прямых и обратных связей. Если рассматривать боль, то наша чувствительность к этой пренеприятной сенсорной модальности варьирует очень сильно. В разгар событий мы можем и не почувствовать повреждения, и только потом будем страдать от боли. Сдвиг психометрической кривой вправо встречается и при родах. Болевой порог варьирует и в зависимости от типа культуры. То, что неприемлемо для человека одной культуры – в порядке вещей для другой.

Возвращаясь к физиологии, лежащей в основе психофизики, следует, в первую очередь, отметить, что даже в отсутствие стимула по сенсорным волокнам потенциалы действия все же передаются, но с малой частотой. Это – активность покоя. Она может варьировать (в разных сенсорных волокнах) от 1–2 имп./с до более, чем 50 имп./с. Когда подается адекватный стимул достаточной интенсивности, частота импульсации возрастает. Ясно, что для ЦНС очень важно отличать сигнал, свидетельствующий о наличии адекватного стимула малой интенсивности, от случайных флуктуации. То есть, иными словами, отличать сигналы от шума.

И активность покоя, и разряд, возникающий на предъявление адекватного стимула, варьируют около некоторых средних. Например, первая из них имеет частоту 20±5 Гц, а реакция на стимул – 25±6 Гц. Ясно, что эти величины в крайних значениях перекрываются, т. е. ЦНС «не может быть уверена» в том, был стимул или нет. Иногда реакция будет верной, иногда – ошибочной. Эта ситуация приблизительно схожа с сенсорным порогом, определенным нами выше. По мере увеличения интенсивности стимула, сигнал все более и более удаляется от уровня шума. При 30±7 Гц «перекрытие» с активностью покоя становится меньше, а при 35±8 Гц уже нет сомнений, что стимул действительно присутствует.

Отметим, однако, что в приведенном гипотетическом примере разброс частот вокруг среднего значения растет с увеличением интенсивности стимула. Это означает, что с ростом интенсивности стимула амплитуда физических изменений стимула, способного создать минимально различимое отличие стимулов (МРО) тоже растет. Это соотношение было подмечено Вебером в 1834 году и известно как закон Вебера:

где – МРО, – субъективное восприятие стимула, а – константа. Наиболее часто упоминаемый пример действия закона Вебера связан с восприятием массы. Легко различить массы в 1 и 1,5 кг, но очень трудно, если не невозможно, – 25 и 25,5 кг.

Позднее в XIX столетии (1860 г.) Фехнер расширил закон Вебера, дав соотношение между субъективно воспринимаемыми пороговым и надпороговым стимулами. Это соотношение стало известно как закон Вебера–Фехнера:

где – субъективная величина стимула по сравнению с – костанта. Почти через столетие, в 50-е годы XX века Стэнли Стивене исследовал большое количество сенсорных модальностей и показал, что «психофизический закон» следует несколько более сложному соотношению, лучше всего выражаемому степенной функцией:

или

то есть,

Показатель степени n варьирует от одной модальности к другой: п1 для восприятия длины, п0,4 для восприятия яркости, п3,5 – для электрического шока. Некоторые из этих соотношений между стимулом и ответом показаны на рис. 3.2. Их гораздо легче сравнивать, когда они представлены в логарифмической форме, поскольку это прямые.

Рис.3.2.Психофизические соотношения. (А) Когда субъективно восприниаемая величина стимула наносится на график против амплитулы стимула в линейных координатах, линии часто изгибаются вверх и вниз. (Б) Когда кривая наносится в логарифмических координатах, образуя прямые линии, угол наклона которых зависти от степенного показателя п.

Хотя в предыдущем изложении мы рассматривали случай, когда импульсация, ответственная за субъективное восприятие, проводится по одиночному сенсорному волокну, – это большая редкость, если вообще возможно. На самом деле все естественным образом воспринимаемые надпороговые стимулы вовлекают больше, чем одно волокно, и чем выше интенсивность стимула, тем больше сенсорных волокон участвуют в проведении.

Адаптация

Известно, что все сенсорные волокна демонстрируют адаптацию. Здесь нет необходимости распространяться на эту тему больше. Тем не менее, стоит отметить, что в некоторых случаях адаптация может снижать уровень импульсации до уровня, ниже порогового. Субъективно мы можем перестать ощущать стимул. Только при включении и(или) выключении стимула поток импульсации возрастает настолько существенно, чтобы вызвать осознанное ощущение. Всем нам случалось испытывать, что только когда некоторый постоянный стимул внезапно исчезает, мы осознаем, что он был.

3.3. Рецептивные поля и карты сенсорных поверхностей

Рецептивные поля

Сенсорные нервные окончания, как правило, чувствительны к стимуляции малых участков своего окружения. Эти участки называются рецептивными полями (РП) сенсорного волокна. Во многих случаях рецептивные поля имеют свою внутреннюю организацию. Часто стимуляция одной из частей РП ведет к возбуждению сенсорного нейрона, в другой – к торможению.

Рецептивные поля существенно разнятся и по площади. В тех участках сенсорной поверхности, где важно, чтобы стимул был точно локализован, РП малы. Напротив, там, где локализация стимула не так важна, РП больше. Это хорошо показано опытом Фехнера по изучению порога в двух точках. Некоторые части тела – кончики пальцев и губы – способны различать два близко расположенных стимула (укола), тогда как другие (тыльная сторона ладони, спина) – только значительно дальше разнесенные стимулы. В некоторых случаях есть и связь между чувствительностью и точностью локализации ощущения. Если только строго определенное количество энергии взаимодействует с сенсорной поверхностью, как это происходит, например, при постоянном освещении сетчатки, то большее рецептивное поле способно получить больше энергии, чем меньшее. При прочих равных оно обладает большей чувствительностью. Но по некоторым причинам оно неспособно обеспечить точную информацию о том, какая именно часть сетчатки стимулирована.

Хотя сенсорные поверхности, такие как сетчатка или кожа, могут рассматриваться как мозаика РП, не следует думать, что РП имеют ясно очерченные границы, отделяющие их друг от друга, подобно кусочкам стекла, составляющим декоративную мозаику классического или восточного типа. На самом деле, РП в сенсорной поверхности образуют широкие перекрытия и, более того, особенно в сетчатке, варьируют в размерах в зависимости от физиологических условий. Это – одно из проявлений динамического характера сенсорных систем, который накладывается на сравнительно «жесткую» сеть нейронов и сенсорных клеток протекающими в них активными биохимическими и молекулярно-биологическими процессами. Это очень резко отличает их от неизменяющихся неорганических компонентов нашей, основанной на кремнии, электронной технологии.

Карты сенсорных поверхностей

Сенсорные окончания и их рецептивные поля часто (но не всегда) организованы в двумерные структуры – карты. Очевидным образом это так в случае сетчатки и кожных рецепторов прикосновения. Менее очевидно это применительно к базилярной мембране улитки. Пространственные связи этих структур поддерживаются ЦНС. У людей в соматосенсорной коре постцентральной извилины имеется карта поверхности тела, карта сетчатки в первичной зрительной коре затылочной доли, и карта базилярной мембраны в первичной слуховой коре височной доли. Эти карты называются, соответственно, соматотопической, ретинотопической и тонотопической.

Не следует думать, однако, что все эти карты изоморфны сенсорным поверхностям. Во всех случаях те части сенсорной поверхности, которые имеют большее биологическое значение, где требуется большая точность дискриминации сенсорной информации, занимают непропорционально большее место в коре. Это не-изоморфное картирование частично отражает тот упомянутый выше факт, что части сенсорных поверхностей, имеющие большее биологическое значение, характеризуются меньшими по размеру рецептивными полями (или большим числом сенсорных волокон на единицу поверхности). Это также связано с большей сложностью нейрональных связей в таких участках коры. Хотя неизоморфное картирование характерно для всех карт сенсорных поверхностей в ЦНС, вероятно наиболее широко известно это для соматосенсорной коры. Сенсорные «гомункулусы» с их огромными губами, гигантскими кистями рук, на которых выделяется еще и большой палец, и напротив – с крошечными ножками и ступнями, уже почти превратились в икону.

В некоторых сенсорных системах, особенно в зрительной системе приматов, карта из первичного сенсорного экрана проецируется далее во вторичный, третичный и более высокие уровни. Однако в целом, эти более высокие уровни становятся топографически все менее и менее точными. Одновременно, несмотря на эту неточность, высшие уровни обработки сигнала могут одновременно обеспечивать точную карту других свойств стимула. Например, в зрительной системе приматов (макак), наиболее изученной среди высокоразвитых сенсорных систем, картируются скорее 4 цвета, чем пространственное расположение на сенсорной поверхности. Длины волн света, на которые реагируют клетки У4, определенным образом меняются от одной клетки к другой, соседней. Сходным образом, в зрительном поле 5, которое связано с восприятием движения зрительного стимула, обнаружено, что направление движения, на которое реагируют соседние клетки, меняется регулярным образом.

Но почему карты? Почему вообще сенсорные системы развили карты сенсорных поверхностей организма? Краткий ответ на этот вопрос – этого не знает никто, но спекуляций на эту тему множество. Возможно, дело в том, что сенсорные волокна, которые в норме срабатывают одновременно, стремятся и пространственно сгруппироваться вместе. В пользу такого предположения есть, как мы увидим, существенное свидетельство из области биологии развития. Понятно, что волокна из соседних участков сенсорной поверхности (например, сетчатки) с большей вероятностью срабатывают одновременно. Есть также аргумент, связанный с экономией организации. Высказывается мнение, что сенсорный анализ, обработка сигнала, более эффективна, если схожие части сенсорной картины, как топографически, так и функционально содержатся близко друг от друга. В отличие от компьютеров, основанных на кремнии и меди, мозг не может работать со скоростью света. Скорость обмена информацией в немиелинизированных коротких аксонах и дендритах серого вещества на несколько порядков ниже, чем у электрического проведения в компьютере. Если же сигналу требуется пройти большие расстояния (сантиметры, а не миллиметры), то связность «целого» объекта перцепции рискует оказаться невозможной. Здесь мы оказываемся в окрестностях проблемы связывания – того, каким образом получается, что наше восприятие целостно и связно, хотя мозг в высшей степени гетерогенен и построен из модулей. Решения проблемы связывания у нас нет. Не знаем мы и ответа на наше «почему?» о сенсорных картах. Нельзя исключать, что оба эти вопроса – аспекты одной и той же проблемы. Когда удастся достичь нового понимания в одном из них, это может пролить свет и на второй.

2.4. Иерархическая и параллельная организация

Иерархическая и параллельная организация

Из предыдущего раздела могло сложиться впечатление, что сенсорные системы организованы исключительно иерархическим образом. Могло бы показаться, что сенсорные поверхности дают проекцию в первичную сенсорную кору, где сохраняются топографические взаимоотношения, та дает свои дальнейшие проекции, несколько утрачивая топографическую точность, те передают информацию в следующую в ином участке коры, и так далее. Хотя это и правда, но не вся. То есть это не один экран, проецирующийся в более высокие уровни по иерархическому принципу, а несколько параллельных экранов, взаимосвязанных и взаимодействующих между собой. К тому же, иерархическая последовательность карт связана и в центрипетальном, и центрифугальном направлениях. Организация сенсорного мозга позволяет и параллельную, и последовательную обработку информации, и лучше всего описывается термином Хофштадтера как «усложненная иерархия».

Выделение отличительных характеристик и пусковые стимулы

В заключение еще одна общая черта сенсорных систем должна быть упомянута. Необходимо отметить, что в высокоразвитых системах, таких как слуховая и зрительная, в ходе обработки в мозге в восходящих уровнях выделяются специфические черты полученной информации. Эти черты связаны с теми аспектами окружающего мира, которые имеют первостепенное значение для животного. Лишь небольшое количество клеток в слуховой коре отвечают на продолжительные чистые тоны, которые так эффективны в стимуляции базилярной мембраны улитки. Напротив, щелчки и потрескивания, издаваемые хищником, подкрадывающимся через подлесок, или частотно-модулированные тоны, повышающиеся или понижающиеся по высоте, оказываются значительно более эффективными. Эти черты широко используются в высокоспециализированных участках коры человека (в формировании звуков речи) и летучих мышей (в эхолокации). Сходным образом, в зрительной системе яркие пятна света или длительное нефокусированное освещение, эффективно стимулирующие сетчатку, вызывают в клетках зрительной коры лишь небольшой эффект. Напротив, контуры объекта вызывают выраженный эффект в первичной зрительной коре. С повышением уровня переработки сигнала ответ запускают все более содержательные черты объекта. Например, в высших уровнях у макак (нижне-теменная кора) есть клетки, отвечающие исключительно на характерные черты обезьяньих морд (в фас и в профиль).

Эти специфические черты сенсорного мира, которые имеют в жизни животного важное значение, называются триггерными стимулами. Этой категории стимулов посвящено большое количество исследований. Сначала популярной стала концепция иерархии уровней выделения специфических черт. Предполагалось, что выделяются еще более специфические, чем обезьяньи морды, черты визуальной картины – в случае человека вплоть до распознавания лица бабушки. Признание возможности существования клеток распознавания лица бабушки или понтификальных клеток приобрело широкое хождение, однако, не исключено, что это все же следует принимать как reduction ad absurdum (упрощение до абсурда) или, по крайней мере, с большой осторожностью. Хватит ли клеток в коре, чтобы разобраться со всеми бабушкиными прическами, бижутерией, шляпками и приступами дурного настроения? Что же, отбросить прочие специфические детали визуального восприятия? А что, если клетка, ответственная за бабушку, по каким-то причинам повредится или заболеет, мы бабушку узнавать перестанем? К тому же, осложняются и философские проблемы. Можно ли всерьез предполагать, что активность одной-единственной клетки преобразуется в зрительный образ бабушки? Кажется все же более вероятным, что распознавание бабушки зависит от активности популяции клеток, распределенной в зрительных участках коры и других участках мозга, включая (что важно) эмоциональные центры лимбической системы. Вероятность этого возрастает, если признать упомянутую в предыдущем разделе роль параллельной обработки информации в зрительной системе. Таким образом, идея об однонаправленном потоке информации, передаваемой в иерархически высшие центры мозга, очевидно, устарела.

Заключение

«Эволюция – халтурщица», – сказал Франсуа Жакоб. Но в случае сенсорных систем она употребила биофизику и молекулярную биологию, компоновала их в течение многих миллионов лет в удивительные и чувствительные устройства для обнаружения событий в окружающей среде. Эволюция, может быть и халтурщица, но халтурщица, движимая страхом смерти. Сенсорные системы чрезвычайно важны для борьбы за существование, в том, что некоторые называют «эволюционной гонкой вооружений». Как и в технологической гонке вооружений, с которой мы знакомы, важна информация. Битва за Британию и битва за Атлантику были выиграны (и проиграны) благодаря радарам и взлому радиокодов. Сенсорные системы подверглись всем безжалостным испытаниям естественного отбора, но если вернуться к метафоре Жакоба, у эволюции не было возможности отбросить лишнее и начать все заново. Халтурщица работала с тем, что получилось. Потому и сенсорные системы большинства высокоразвитых животных сохраняют следы организации далеких предков. Несмотря на это, они развились до такого уровня чувствительности, который во многих случаях недоступен для человеческой технологии.

2.3. Моделирование СС

2.4. Техническая реализация СС

Сенсорные системы в технической сфере – это чувствительные устройства, предназначенные для получения оперативной информации о состоянии внешней среды. В отдельных системах роботов имеются также различные чувствительные устройства – датчики, необходимые для функционирования этих систем (например, датчики обратной связи в приводах, во вторичных источниках питания и т.п.). Эти устройства, ориентированные на внутренние параметры робота, не специфичны для него в целом и не относятся к сенсорным системам робота.

По выявляемым свойствам и параметрам сенсорные системы можно разделить на следующие три группы:

Системы, дающие общую картину окружающей среды с последующим выделением отдельных объектов, значимых для выполнения роботом его функций.

Системы, определяющие различные физико-химические свойства внешней среды и его объектов.

Системы, определяющие координаты местоположения робота и параметры его движения, включая его координаты относительно объектов внешней среды.

К сенсорным системам первой группы относятся системы технического зрения и различного типа локаторы. Вторая группа сенсорных систем наиболее многообразна. Это измерители геометрических параметров, плотности, температуры, оптических свойств, химического состава и т.д. Третья группа сенсорных систем определяет параметры, относящиеся к самому роботу. Это измерители его географических координат в пространстве от спутниковых систем до использующих геомагнитное поле Земли, измерители угловых координат (гироскопы), измерители перемещения и скорости, в том числе и относительно отдельных объектов внешней среды вплоть до фиксации соприкосновения с ними.

В составе робота все эти сенсорные системы ориентированы на обслуживание двух исполнительных систем – передвижения и манипуляционной. Это определяет и основные требования к сенсорным системам – дальность действия, точность, быстродействие и т.д.

Сенсорные системы, используемые в системах передвижения робота подразделяются на системы, обеспечивающие навигацию в пространств' и системы, обеспечивающие безопасность движения (предотвращение столкновений с препятствиями и опрокидываний на уклонах, попадали в недопустимые для робота внешние условия и т.п.).

Сенсорные системы, обслуживающие манипуляторы, тоже образуют две подгруппы: системы, входящие в контур управления движением манипулятора, и системы, очувствления его рабочего органа. В число последних систем часто входят размещенные у рабочего органа манипулятора системы технического зрения и измерители усилий.

Важным параметром сенсорных систем является дальность действия. По этому показателю сенсорные системы роботов можно разделить на контактные, ближнего, дальнего и сверхдальнего действия.

Контактные сенсорные системы применяются для очувствления рабочих органов манипуляторов и корпуса (бампера) мобильных роботов. Они позволяют фиксировать контакт с объектами внешней среды (тактильные сенсоры), измерять усилия, возникающие в месте взаимодействия (сило-моментные сенсоры), определять проскальзывание объектов при их удержании захватным устройством. Контактным сенсорным системам свойственна простота, но они накладывают существенные ограничения на динамику и прежде всего на быстродействие управления роботом.

Тактильные сенсоры помимо получения информации о контакте применяются и для определения размеров объектов (путем их ощупывания). Они реализуются с помощью концевых выключателей, герметизированных магнитоуправляемых контактов, на основе токопроводящей резины («искусственная кожа») и т. д. Важным требованием, предъявляемым к этим устройствам, является высокая чувствительность (срабатывание при усилии в единицы и десятки грамм), малые габариты, высокая механическая прочность и надежность.

Сенсорные системы ближнего действия обеспечивают получение информации об объектах, расположенных в непосредственной близости от рабочего органа манипулятора или корпуса робота, т. е. на расстояниях, соизмеримых с их размерами. К таким системам относятся оптические локаторы, дальномеры, дистанционные измерители плотности грунта и т. п. Такие бесконтактные устройства технически сложнее контактны», но позволяют роботу выполнять задание с большей скоростью, заранее выдавая информацию о различных объектах до соприкосновения с ними.

Сенсорные системы дальнего действия служат для получения информации о внешней среде в объеме всей рабочей зоны манипуляторов роботов и окружающей среды мобильного робота.

Сенсорные системы сверхдальнего действия применяются главным образом в мобильных роботах. К ним относятся различные навигационные системы, локаторы и другие сенсорные системы соответствующей дальности действия. Эти устройства находят применение и в стационарных роботах при работе с подвижными объектами, чтобы заранее предвидеть их появление в рабочей зоне.

В бесконтактных сенсорных системах для получения требуемой информации используются излучаемые ими специальные сигналы (оптические, радиотехнические, ультразвуковые и т. д.) и естественные излучения среды и ее объектов. В зависимости от этого различают активные и пассивные сенсорные системы. Активные сенсорные системы имеют передатчик, излучающий первичный сигнал, и приемник, регистрирующий прошедший через среду прямой сигнал или вторичный сигнал, отраженный от объектов среды. Пассивные системы имеют, естественно, только приемное устройство, а роль излучателя играют сами объекты внешней среды. Поэтому пассивные сенсорные системы технически обычно проще и дешевле активных, но менее универсальны. Для некоторых применений важна также скрытность действия пассивных систем. (Заметим, что все органы чувств человека являются пассивными. Однако у некоторых животных (летучие мыши, дельфины), поскольку подобные системы и, прежде всего, зрение не обеспечивают их необходимой информацией, существуют и активные сенсорные системы.)

Наконец, сенсорные системы роботов можно разделить на системы с фиксированным направлением восприятия и с переменным (сканирующие).

В настоящее время для очувствления роботов наиболее широкое применение получили системы технического зрения, локационные, сило-моментные и тактильные. Наиболее универсальными из них являются системы технического зрения. Развитие систем технического зрения и использующих их очувствленных роботов стало одним из определяющих направлений современной робототехники. При этом наряду с изучением и использованием методов решения этой задачи, присущих живой природе, широким фронтом ведутся разработки технических решений, не имеющих аналогов в природе. По сравнению со зрением живых организмов задачи технического зрения проще, так как для них, как правило, существенно более ограничен и заранее известен перечень объектов внешней среды, с которыми предстоит иметь дело. Часто также существует возможность специально организовать внешнюю среду для облегчения работы видеосистем. Например, для распознавания объектов можно маркировать их, применять контрастирующие с объектами поверхности, на которых они расположены, специальные системы освещения и т. д.

Вместе с тем по сравнению с видеосистемами других назначений к системам, предназначенным для использования в составе роботов, предъявляются такие важные требования, как необходимость работать в реальном масштабе времени и иметь высокую надежность при невысокой стоимости.

Системы технического зрения могут быть монокулярными, бинокулярными (стереозрение) и многоракурсными (с большим числом «точек зрения»). Специфическим для роботов вариантом является применение подвижных видеосенсорных устройств, в том числе размещаемых непосредственно на манипуляторах.

Зрительная информация обрабатывается иерархически на нескольких уровнях аналогично тому, как это происходит в живых организмах. В аппаратной реализации эти уровни образуют 2 основных этапа обработки информации. Первый этап – предварительная обработка первичной зрительной информации с целью сокращения объема информации с выделением только той, которая необходима для функционирования робота при выполнении им конкретных операций.

Для этого используются методы пространственно-временной фильтрации, подобной реализуемой в нейронных системах живых организмов. Поэтому на данном этапе применяются технические нейроподобные структуры и аналоговые оптические системы параллельной обработки информации, в том числе с использованием голографических методов. Да втором этапе информация обрабатывается тоже иерархически путем последовательного выделения все более общих признаков объектов внешней среды и формирования моделей среды той степени абстракции, которая необходима для решения на ее основе конкретных задач, стоящих перед роботом.

Конструктивно сенсорные устройства размещают на рабочих органах манипуляторов (устройства ближнего действия), на корпусе робота или вне робота (устройства дальнего и сверхдальнего действия). На рис. 2.10 показаны примеры очувствленных схватов роботов.

Рис.2.10. Очувствленные схваты ЦНИИ РТК:

1 – СЗУ 1 с девятью ультразвуковыми датчиками;

2 – ССЛТ-1 с девятью тактильными и восемью световыми локаторами;

3 - ССЛТ-2 с 26 тактильными датчиками и 16 световыми локаторами;

4 – СУЗ-2 с 12 ультразвуковыми локаторами.

2.5. Генетико-прогностическое описание СС

2.5. Эволюция развития сенсоров у биологических организмов

3.1.1. Систематика

Стороннему наблюдателю может показаться удивительным, что биологическая систематика до сих пор не завершена и не согласована. Даже число крупнейших групп (типов), на которые подразделяется царство животных, остается предметом противоречий. Кроме того, с введением Хеннигом в 50-е годы XX века не-эволюционной кладистической схемы классификации, систематики оказались в центре горячей полемики. К счастью, нам нет необходимости вступать на это «минное поле». Наш интерес к положению организмов в классификации имеет выраженную эволюционную природу. Наш интерес к органам чувств животных, а не только нашим собственным, обусловлен не просто тем, что они существуют (хотя и это вполне уважительная причина), но главным образом тем, что их изучение способно пролить свет на сенсорные системы человека, а также продемонстрировать альтернативные пути решения тех же самых проблем. В некоторых случаях – это радикально иные решения (глаза насекомых и позвоночных), в других – поразительно схожие (глаза головоногих и позвоночных). Понимание эволюционных связей между группами животных – это основа полного понимания сенсорных систем животных и, в частности, тех, которые приобрели мы сами.

3.1.2. Классификация на шесть царств

Мы будем использовать общепринятую схему классификации организмов на шесть царств: Archaebacteria (архебактерии), Eubacteria (собственно бактерии), Protista (протисты), Plantae (растения), Fungi (грибы) и Animalia (животные). Внутри этих шести царств организмы подразделяются далее на большие группы со сходным планом строения, которые называются типами. Такой принцип классификации, как и можно было ожидать, куда более очевиден на многоклеточных – грибах, растениях и животных, чем в трех царствах одноклеточных. Действительно, классификация оказывается общепринятой только для царства животных. В изучении сенсорных систем именно оно занимает доминирующее положение, потому и наше внимание по большей части будет сконцентрировано на нем.

3.1.3. Одноклеточные

Archaebacteria и Eubacteria часто объединяются в единую группу «бактерий» или, иногда, монер (Moneres – греч., одинокий). Известно свыше 5 000 видов, представляющих собой маленькие клетки без ядра и органоидов. Поскольку эти клетки не имеют ясно выраженного ядра (т. е. нуклеиновые кислоты не отделены от цитоплазмы ядерной мембраной), они получили наименование прокариот. В течение прибл. 2 миллиардов лет (начиная с 3 600 млн лет назад до 1 600 млн лет назад) монеры владели миром. Сенсорные системы бактерий, конечно, предельно просты. Однако они представляют для нас значительный интерес, поскольку на них часто можно проследить, по крайней мере на биохимическом уровне, зачатки тех бесконечно сложных систем, которые развились у животных.

Спустя 2 млрд лет появились более крупные и более сложные клетки – эукариоты. Вероятно, они более тесно связаны с архебактериями, чем с собственно бактериями. Все эукариоты имеют выраженное ядро (их генетический материал сосредоточен за ядерной мембраной) и органоиды, такие как митохондрии, хлоропласты и т. д., локализованные в цитоплазме. Ранние классификации объединяли автотрофных эукариот с растениями в Prophyta, а гетеротрофных – с животными в Protozoa (простейшие). Более современный альтернативный анализ предполагает, что одноклеточные эукариоты схожи друг с другом значительно больше, чем с многоклеточными животными, растениями и грибами, и к тому же сама многоклеточность могла возникать несколько раз. Исходя из этого одноклеточные эукариоты и объединены в отдельное царство Protista или Protoctista (protos – первичный, kristos – устанавливать, греч.). Протисты – чрезвычайно разнообразная группа, подразделяющаяся на типы, которых насчитывается до 30, однако, в этой книге они, в основном, не фигурируют. С нашей точки зрения, самое интересное, возможно, заключается в наличии у них наиболее ранних фоторецепторов – различных типов светочувствительных пятен. Они обнаружены в типе Eustigmatophyta, Chlorophyta и, особенно, Euglenophyta (Euglena viridis), а также у некоторых представителей динофлагеллят (Pouchetia sp., Erythropsidinium pavillardii).

Рис. 4.1. (А) (а) Спиральное и (б) радиальное дробление. По Caroll, 1988. (Б) Первичноротые и вторичноротые. (а) Бластула; (б) инвагинация при формировании гаструлы. Бластоцель в основном смыкается, и образуется первичная кишка или архэнтерон, открытый во внешнюю среду (бластопор). У первичноротых он в дальнейшем формирует рот, а у вторичноротых возникает еще одна инвагинация (на противоположном от бластопора конце эмбриона), которая прорывается в архэнтерон. Здесь формируется рот, тогда как по соседству (рядом с зарастающим бластопором) прорывается вторичный анус.

3.1.4. Многоклеточность

Многоклеточность, вероятно, возникла около 1 млрд лет назад. Биологи выделяют три царства многоклеточных – грибы, растения и животные. Только последнее представляет интерес для данной работы. Здесь тоже имеется несколько различных методов классификации. В старых работах царство животных подразделялось на три полцарства: Protozoa (простейшие), Parazoa (Mesozoa, губки) и Metazoa (истинно многоклеточные). Позже, как мы видели, Protozoa были объединены с другими одноклеточными формами в царство Protista. Animalia (животные), в свою очередь, подразделяются на два под-царства – Parazoa и Metazoa. Parazoa далее подразделяются на Porifera (губки) и Placozoa (с единственным видом Trichoplax adhaerans, размером с большую амебу). Все остальные животные образуют Metazoa – многоклеточных. Старая (в высшей степени антропоцентрическая) классификация делит многоклеточных на позвоночных и беспозвоночных – в зависимости от наличия или отсутствия позвоночного столба. Такая классификация остается общепризнанной и общеупотребительной, но необъективной из-за нашего самомнения. Позвоночные (если быть более точным – черепные) образуют два подтипа внутри типа Chordata (хордовые), одного из более чем тридцати в подцарстве Metazoa.

Рис. 4.2. Эволюционные взаимоотношения между основными группами организмов. Числами (в млн лет) показана давность дивергенций. Псевдоце-ломические животные представлены нематодами (напр. С. elegans).

3.1.5. Первичноротые и вторичноротые

Если внимательно рассмотреть ранний эмбриогенез целомических многоклеточных, то мы обнаружим несколько фундаментальных черт, которые предполагают разделение их на две большие группы форм животных: ветвь кольчатых червей – членистоногих – моллюсков (КЧМ) и ветвь иглокожих – хордовых (ИХ) (рис. 4.3). У кольчатых червей – членистоногих – моллюсков первые деления зигот (деления дробления) имеют спиральный характер (рис. 4.1 А(а)). Слои дочерних клеток (бластомеров) выстраиваются со сдвигом относительно друг друга. Проспективная судьба клеток таких зародышей детерминирована. Если одна из них удалена, соответствующая часть организма не сформируется. Напротив, в линии развития иглокожих – хордовых зигота претерпевает радиальное дробление (рис. 4.1 А(б)), а слои клеток расположены строго один над (под) другим. Судьбы бластомеров на этой стадии строго не детерминированы. Если один из них удален, остальные способны это компенсировать, так что формируется нормальный зародыш.

Рис. 4.3. Эволюционное древо царства животных. Всего насчитывается около 30 типов, но на рисунке показаны только те, которые включают виды, упоминающиеся на последующих страницах этой книги. Возникновение царства из протестов произошло около 1 млрд лет назад. Некоторые важные стадии формирования плана строения показаны на основном стволе схемы: билатеральная симметрия (BILATERALIA); выраженная полость тела (целом), отделяющая кишку от мускулатуры (COELO-МАТА); развитие рта из бластопора (PROSTOMA-ТА – первичноротые) или на противоположном конце (DEUTEROSTOMATA -вторичноротые). Все эти важные события эволюции имели место в докембрийский период.

Далее, две эти большие ветви демонстрируют глубокие различия путей формирования целома (полости тела). В линии КЧМ это происходит в результате расщепления мезодермы (шизоцель). В линии ИХ это происходит в результате отшнуровки выпячиваний кишки (энтероцель).

Наконец, важное различие – в том, как формируется рот. Сфера из клеток, образующаяся в результате делений дробления оплодотворенной яйцеклетки – бластула – затем инвагинирует, формируя первичную кишку – архэнтерон. Этот процесс называется гаструляцией. В ветви КЧМ отверстие первичной кишки – бластопор – в конце концов развивается в рот взрослой особи. Животные, у которых рот развивается таким образом, относятся к первичноротым. Напротив, в ветви ИХ рот развивается иначе. В этом случае новое отверстие в конце концов возникает на конце, противоположном бластопору, а бластопор преобразуется в анус (рис. 4.1 А(б)). Животные с таким типом развития относятся к вторичноротым (поскольку рот развивается у них «вторично»). Эти два термина – первичноротые и вторичноротые – обычно употребляются для обозначения двух упомянутых выше крупных ветвей развития.

Хотя т. н. «биогенетический закон» Геккеля (онтогенез отражает филогенез), в настоящее время принимается со значительными оговорками, нет сомнений, что последовательность событий раннего эмбриогенеза сложилась в эволюционной истории очень давно. Из этого ясно, что и принципиальные различия эмбриогенеза первично- и вторичноротых возникли в филогенезе очень рано. Молекулярно-биологические данные предполагают, что их общий предок существовал более, чем 670 млн лет назад. Недавние работы отодвинули этот срок на еще более давний срок – порядка 830 млн лет. Таким образом, эти две ветви в течение более трех четвертей миллиарда лет развиваются независимо друг от друга. Это делает возможность сравнения органов чувств между этими ветвями особенно интересной – нам нет необходимости лететь на другую планету, чтобы получить возможность сравнения с эволюционными альтернативами форм жизни, основанных на углероде.

В заключение, накапливаются молекулярно-биологические данные, дающие основания полагать, что первичноротые очень рано разделились на две крупных группы. Первая из них – Ecdyozoa – включающая, помимо прочих, нематод и членистоногих и характеризующаяся твердым наружным покровом, что требует периодических линек (ecdysis) для обеспечения возможности роста. Другая – Lophotrochozoa – жестким покровом не обладает (что, правда, отрицательно сказывается на их защищенности) и включает плоских и кольчатых червей, моллюсков, а также несколько других типов животных.


Часть 3.
НЕЙРОННЫЕ СЕТИ

Введение. Основные понятия в теории нейронных сетей. элементы нечеткой логики.

Пожалуй, наиболее поразительным свойством человеческого интеллекта является способность принимать правильные решения в обстановке неполной и нечеткой информации. Построение моделей приближенных к рассуждениям человека и использование их в компьютерных системах будущих поколений представляет сегодня одну из важнейших проблем науки.

При обработке знаний с применением жестких механизмов формальной логики возникает противоречие между нечеткими знаниями и четкими методами логического вывода. Преодолеть это противоречие можно или путем преодоления нечеткости (когда это возможно) или с использованием методов представления и обработки нечетких знаний.

Значительное продвижение в этом направлении сделано 30 лет тому назад профессором Калифорнийского университета (Беркли) Лотфи А. Заде (Lotfi A. Zadeh). Его работа «Fuzzy Sets», появившаяся в 1965 г. в журнале Information and Control, № 8, заложила основы моделирования интеллектуальной деятельности человека и явилась начальным толчком к развитию новой математической теории.

Л. Заде расширил классическое канторовское понятие множества, допустив, что характеристическая функция (функция принадлежности элемента множеству) может принимать любые значения в интервале [0; 1], а не только значения 0 либо 1. Такие множества были названы им нечеткими (fuzzy). Он определил также ряд операций над нечеткими множествами и предложил обобщение известных методов логического вывода modus ponens и modus tollens.

Введя затем понятие лингвистической переменной и допустив, что в качестве ее значений (термов) выступают нечеткие множества, Л. Заде создал аппарат для описания процессов интеллектуальной деятельности, включая нечеткость и неопределенность выражений.

Дальнейшие работы профессора Л. Заде и его последователей заложили прочный фундамент новой теории и создали предпосылки для внедрения методов нечеткого управления в инженерную практику.

Уже к 1990 г. по этой проблематике опубликовано свыше 10000 работ, а число исследователей достигло 10000, причем в США, Европе и СССР по 200-300 человек, около 1000 – в Японии, 2000 3000 – в Индии и около 5000 исследователей в Китае.

В последние 5-7 лет началось использование новых методов и моделей в промышленности и в военном деле. Спектр приложений их широк: от управления процессом отправления и остановки поезда метрополитена, управления грузовыми лифтами и доменной печью до стиральных машин, пылесосов и СВЧ-печей. При этом нечеткие системы позволяют повысить качество продукции при уменьшении ресурсо- и энергозатрат и обеспечивают более высокую устойчивость к воздействию мешающих факторов по сравнению с традиционными системами автоматического управления.

Другими словами, новые подходы позволяют расширить сферу приложения систем автоматизации за пределы применимости классической теории. В этом плане любопытна точка зрения Л. Заде: «Я считаю, что излишнее стремление к точности стало оказывать действие, сводящее на нет теорию управления и теорию систем, так как оно приводит к тому, что исследования в этой области сосредоточиваются на тех и только тех проблемах, которые поддаются точному решению. В результате многие классы важных проблем, в которых данные, цели и ограничения являются слишком сложными или плохо определенными для того, чтобы допустить точный математический анализ, оставались и остаются в стороне по той причине, что они не поддаются математической трактовке. Для того чтобы сказать что-либо существенное для проблем подобного рода, мы должны отказаться от наших требований точности и допустить результаты, которые являются несколько размытыми или неопределенными».

Смещение центра исследований нечетких систем в сторону практических приложений привело к постановке целого ряда проблем, таких как новые архитектуры компьютеров для нечетких вычислений, элементная база нечетких компьютеров и контроллеров, инструментальные средства разработки, инженерные методы расчета и разработки нечетких систем управления и многое другое.

Математическая теория нечетких множеств позволяет описывать нечеткие понятия и знания, оперировать этими знаниями и делать нечеткие выводы.

Нечеткое управление оказывается особенно полезным, когда технологические процессы являются слишком сложными для анализа с помощью общепринятых количественных методов или когда доступные источники информации интерпретируются качественно, неточно или неопределенно. Нечеткая логика, на которой основано нечеткое управление, ближе по духу к человеческому мышлению и естественным языкам, чем традиционные логические системы. Нечеткая логика, в основном, обеспечивает эффективные средства отображения неопределенностей и неточностей реального мира. Наличие математических средств отражения нечеткости исходной информации позволяет построить модель, адекватную реальности.

1.1. Нечеткие множества

Пусть Е – универсальное множество, х – элемент Е, a R – некоторое свойство. Обычное (четкое) подмножество А универсального множества Е, элементы которого удовлетворяют свойству R, определяется как множество упорядоченных пар

,

где – характеристическая функция, принимающая значение 1, если х удовлетворяет свойству R, и 0 – в противном случае.

Нечеткое подмножество отличается от обычного тем, что для элементов х из Е нет однозначного ответа «да-нет» относительно свойства R. В связи с этим нечеткое подмножество А универсального множества Е определяется как множество упорядоченных пар

,

где – характеристическая функция принадлежности (или просто функция принадлежности), принимающая значения в некотором вполне упорядоченном множестве М (например, М=[0,1]).

Функция принадлежности указывает степень (или уровень) принадлежности элемента х подмножеству А. Множество М называют множеством принадлежностей. Если М = {0, 1}, то нечеткое подмножество А может рассматриваться как обычное или четкое множество.

Примеры записи нечеткого множества

Пусть E = {x1, x2, x3, x4, x5}, М = [0,1]; А – нечеткое множество, для которого

μА (х1) = 0,3; μА (х2) = 0; μА (х3) = 1; μА (х4) = 0,5; μА (х5) = 0,9.

Тогда А можно представить в виде

А = {0,3/x1; 0/x2; 1/x3; 0,5/x4; 0,9/x5},

или

А = {0,3/x1 + 0/x2 + 1/x3 + 0,5/x4 + 0,9/x5},

или

А =

x1

x2

x3

x4

x5

0,3

0

1

0,5

0,9

Замечание. Здесь знак «+» не является обозначением операции сложения, а имеет смысл объединения.

1.1.1. Основные характеристики нечетких множеств. Пусть М = [0, 1] и А – нечеткое множество с элементами из универсального множества Е и множеством принадлежностей М.

• Величина называется высотой нечеткого множества А. Нечеткое множество А нормально, если его высота равна 1, т.е. верхняя граница его функции принадлежности равна 1 (). При нечеткое множество называется субнормальным.

• Нечеткое множество пусто, если  . Непустое субнормальное множество можно нормализовать по формуле

Нечеткое множество унимодально, если μА (х) = 1 только на одном х из Е.

Носителем нечеткого множества А является обычное подмножество со свойством μА (х) > 0 т.е. носитель

Элементы для которых μА (х) = 0,5, называются точками перехода множества А.

Примеры нечетких множеств

Пусть Е = {0, 1, 2, . . ., 10}, М = [0, 1]. Нечеткое множество «Несколько» можно определить следующим образом:

«Несколько» = 0,5/3 + 0,8/4+1/5 + 1/6 + 0,8/7 + 0,5/8;

его характеристики: высота = 1, носитель = {3, 4, 5, 6, 7, 8}, точки перехода – {3, 8}.

Пусть Е = {0, 1, 2, 3, . . ., п, . . .}. Нечеткое множество «Малый» можно определить:

«Малый» = .

Пусть Е = {1, 2, 3, . . ., 100} и соответствует понятию «Возраст», тогда нечеткое множество «Молодой» может быть определено с помощью

Нечеткое множество «Молодой» на универсальном множестве Е' = {ИВАНОВ, ПЕТРОВ, СИДОРОВ,...} задается с помощью функции принадлежности μМолодой (х) на Е = {1, 2, 3, . . ., 100} (возраст), называемой по отношению к Е' функцией совместимости, при этом:

μМолодой (СИДОРОВ) := μМолодой (х),

где х – возраст СИДОРОВА.

4. Пусть Е = {ЗАПОРОЖЕЦ, ЖИГУЛИ, МЕРСЕДЕС,...} – множество марок автомобилей, а Е' = [0,∞) – универсальное множество «Стоимость», тогда на Е' мы можем определить нечеткие множества типа: «Для бедных», «Для среднего класса», «Престижные», с функциями принадлежности вида рис. 1.1.

Имея эти функции и зная стоимости автомобилей из Е в данный момент времени, мы тем самым определим на Е' нечеткие множества с этими же названиями.

Так, например, нечеткое множество «Для бедных», заданное на универсальном множестве

Е = {ЗАПОРОЖЕЦ, ЖИГУЛИ, МЕРСЕДЕС,...},

выглядит так, как показано на рис. 1.2.

Аналогично можно определить нечеткое множество «Скоростные», «Средние», «Тихоходные» и т. д.

5. Пусть Е – множество целых чисел:

Е = {-8, -5, -3, 0, 1, 2, 4, 6, 9}.

Тогда нечеткое подмножество чисел, по абсолютной величине близких к нулю, можно определить, например, так:

А = {0/-8 + 0,5/-5 + 0,6/-3 + 1/0 + 0,9/1 + 0,8/2 + 0,6/4 + 0,3/6 + 0/9}.

1.1.2. О методах построения функций принадлежности нечетких множеств.

В приведенных выше примерах использованы прямые методы, когда эксперт либо просто задает для каждого значение µA(x) либо определяет функцию совместимости. Как правило, прямые методы задания функции принадлежности используются для измеримых понятий, таких как скорость, время, расстояние, давление, температура и т.д., или когда выделяются полярные значения.

Во многих задачах при характеристике объекта можно выделить набор признаков и для каждого из них определить полярные значения, соответствующие значениям функции принадлежности, 0 или 1.

Например, в задаче распознавания лиц можно выделить шкалы, приведенные в табл. 1.1.

Таблица 1.1. Шкалы в задаче распознавания лиц

0

1

х1

х2

х3

х4

х5

х6

х7

х8

х9

высота лба

профиль носа

длина носа

разрез глаз

цвет глаз

форма подбородка

толщина губ

цвет лица

очертание лица

низкий

курносый

короткий

узкие

светлые

остроконечный

тонкие

темный

овальное

высокий

горбатый

длинный

широкие

темные

квадратный

толстые

светлый

квадратное

Для конкретного лица А эксперт, исходя из приведенной шкалы, задает , формируя векторную функцию принадлежности {µA(x1), µA(x2), …, µA(x9)}.

При прямых методах используются также групповые прямые методы, когда, например, группе экспертов предъявляют конкретное лицо и каждый должен дать один из двух ответов: «этот человек лысый» или «этот человек не лысый», тогда количество утвердительных ответов, деленное на общее число экспертов, дает значение µлысый (данного лица). (В этом примере можно действовать через функцию совместимости, но тогда придется считать число волосинок на голове у каждого из предъявленных эксперту лиц.)

Косвенные методы определения значений функции принадлежности используются в случаях, когда нет элементарных измеримых свойств, через которые определяется интересующее нас нечеткое множество. Как правило, это методы попарных сравнений. Если бы значения функций принадлежности были нам известны, например, µA(xi) = wi, i = 1,2,…, n, то попарные сравнения можно представить матрицей отношений A = {aij} где aij = wi/wj (операция деления).

На практике эксперт сам формирует матрицу А, при этом предполагается, что диагональные элементы равны 1, а для элементов симметричных относительно диагонали aij = 1/aij, т.е. если один элемент оценивается в α раз сильнее, чем другой, то этот последний должен быть в 1/α раз сильнее, чем первый. В общем случае задача сводится к поиску вектора w, удовлетворяющего уравнению вида Аw = λmaxw, где λmax – наибольшее собственное значение матрицы А. Поскольку матрица А положительна по построению, решение данной задачи существует и является положительным.

Можно отметить еще два подхода:

использование типовых форм кривых для задания функций принадлежности (в форме (L-R)-типa – см. ниже) с уточнением их параметров в соответствии с данными эксперимента;

использование относительных частот по данным эксперимента в качестве значений принадлежности.

1.2. Операции над нечеткими множествами

1.2.1. Логические операции

Включение. Пусть А и В – нечеткие множества на универсальном множестве Е. Говорят, что А содержится в В, если  .

Обозначение: .

Иногда используют термин доминирование, т.е. в случае, когда , говорят, что В доминирует А.

Равенство. А и В равны, если  .

Обозначение: А = В.

Дополнение. Пусть М = [0, 1], А и В – нечеткие множества, заданные на Е. А и В дополняют друг друга, если  .

Обозначение: или .

Очевидно, что (дополнение определено для М = [0, 1], но очевидно, что его можно определить для любого упорядоченного М).

Пересечение.  – наибольшее нечеткое подмножество,

содержащееся одновременно в А и В:

.

Объединение.  – наименьшее нечеткое подмножество,

включающее как А, так и В, с функцией принадлежности:

.

Разность.  с функцией принадлежности:

.

Дизъюнктивная сумма

с функцией принадлежности:

.

Примеры. Пусть

A = 0,4/x1+0,2/x2+0/x3+1/x4;

B = 0,7/x1+0,9/x2+0,1/x3+1/x4;

C = 0,1/x1+1/x2+0,2/x3+0,9/x4.

Здесь:

1) т. е. А содержится в В или В доминирует А; С несравнимо ни с А, ни с В, т.е. пары {А, С} и {А, С} – пары недоминируемых нечетких множеств.

2) .

3) ;

.

4) .

5) .

6) ;

.

7) .

Наглядное представление логических операций над нечеткими множествами. Для нечетких множеств можно строить визуальное представление. Рассмотрим прямоугольную систему координат, на оси ординат которой откладываются значения µA(x), на оси абсцисс в произвольном порядке расположены элементы Е (мы уже использовали такое представление в примерах нечетких множеств). Если Е по своей природе упорядочено, то этот порядок желательно сохранить в расположении элементов на оси абсцисс.

Такое представление делает наглядными простые логические операции над нечеткими множествами (см. рис. 1.3).

На рис. 1.3а заштрихованная часть соответствует нечеткому множеству А и, если говорить точно, изображает область значений А и всех нечетких множеств, содержащихся в А. На рис. 1.3б, в, г даны .

Свойства операций

Пусть А, В, С – нечеткие множества, тогда выполняются следующие свойства:

1) ;

2) ;

3) ;

4) ;

5) , где – пустое множество, т.е.  ;

6) ;

7) , где Е – универсальное множество;

8) ;

9)  – теоремы де Моргана.

В отличие от четких множеств, для нечетких множеств в общем случае:

,

(что, в частности, проиллюстрировано выше в примере наглядного представления нечетких множеств).

Замечание. Введенные выше операции над нечеткими множествами основаны на использовании операций max и min. В теории нечетких множеств разрабатываются вопросы построения обобщенных, параметризованных операторов пересечения, объединения и дополнения, позволяющих учесть разнообразные смысловые оттенки соответствующих им связок «и», «или», «не».

Один из подходов к операторам пересечения и объединения заключается в их определении в классе треугольных норм и ко-норм.

Треугольной нормой (t-нормой) называется двуместная действительная функция удовлетворяющая следующим условиям:

1) T(0,0) = 0; T(µA,1) = µA; T(1,µA) = µAограниченность;

2) T(µA, µB) ≤ T(µC, µD), если µA  µC, µC  µDмонотонность;

3) T(µA, µB) = T(µB, µA) – коммутативность;

4) T(µA, T(µB, µC) = T(T(µA, µB), µC) – ассоциативность.

Примеры треугольных норм

min (µA, µB)

произведение µA · µB

max (0, µA + µB - 1)

Треугольной конормой (t-конормой) называется двуместная действительная функция со свойствами:

1) S(1,1) = 1; S(µA,0) = µA; S(0,µA) = µAограниченность;

2) S(µA, µB) ≥ S(µC, µD), если µA  µC, µC  µDмонотонность;

3) S(µA, µB) = S(µB, µA) – коммутативность;

4) S(µA, S(µB, µC) = S(S(µA, µB), µC) – ассоциативность.

Примеры t-конорм

max (µA, µB)

µA + µB - µA · µB

min (1, µA + µB).

1.2.2. Алгебраические операции над нечеткими множествами

Алгебраическое произведение А и В обозначается А·В и определяется так:  

Алгебраическая сумма этих множеств обозначается и определяется так:

 

Для операций выполняются свойства:

1) ;

2) ;

3) , , , ;

4)  – теоремы де Моргана.

Не выполняются:

1) ;

2) ;

3) а также , .

Замечание. При совместном использовании операций выполняются свойства:

1) ;

2) ;

3) ;

4) .

На основе операции алгебраического произведения определяется операция возведения в степень α нечеткого множества А, где α – положительное число. Нечеткое множество Aα определяется функцией принадлежности µAα = µAα(x) Частным случаем возведения в степень являются:

1) CON(А) = А2 – операция концентрирования (уплотнения);

2) DIL(А) = А0,5 – операция растяжения,

которые используются при работе с лингвистическими неопределенностями (рис. 1.4).

Умножение на число. Если α – положительное число, такое, что , то нечеткое множество αA имеет функцию принадлежности:

.

Выпуклая комбинация нечетких множеств. Пусть A1, А2,…, Ап – нечеткие множества универсального множества Е, а ω1, ω2, …, ωn – неотрицательные числа, сумма которых равна 1.

Выпуклой комбинацией A1, А2,, Ап называется нечеткое множество А с функцией принадлежности:

 µA(x1, x2, …, xn) = ω1µA1(x) + ω2µA2(x) +…+ ωnµAi(x).

Декартово (прямое) произведение нечетких множеств. Пусть А1, А2,..., Ап – нечеткие подмножества универсальных множеств E1, Е2,..., Еп соответственно. Декартово, или прямое произведение является нечетким подмножеством множества с функцией принадлежности:

µA(x1, x2,…, xn) = min (µA1(x1), µA2(x2),…, µAi(xn)).

Оператор увеличения нечеткости используется для преобразования четких множеств в нечеткие и для увеличения нечеткости нечеткого множества.

Пусть А – нечеткое множество, Е – универсальное множество и для всех определены нечеткие множества К(х). Совокупность всех К(х) называется ядром оператора увеличения нечеткости Ф. Результатом действия оператора Ф на нечеткое множество А является нечеткое множество вида

,

где µA(x)K(x) – произведение числа на нечеткое множество.

Пример. Пусть

E = {1, 2, 3, 4}; A = 0,8/1 + 0,6/2 + 0/3 +0/4; K(1) = 1/1 + 0,4/2;

K(2) = 1/2 + 0,4/1 + 0,4/3; K(3) = 1/3 + 0,5/4; K(4) = 1/4.

Тогда

Четкое множество α-уровня (или уровня α). Множеством α-уровня нечеткого множества А универсального множества Е называется четкое подмножество Аα универсального множества Е, определяемое в виде

Аα = {x/µA(x)α },

где α ≤ 1.

Пример. Пусть A = 0,2/x1 + 0/x2 + 0,5/x3 + 1/x4, тогда

A0,3 = {x3, x4}, A0,7 = {x4}.

Достаточно очевидное свойство: если α1α2, то Aα1Aα2

1.3. Нечеткая и лингвистическая переменные

Понятие нечеткой и лингвистической переменных используется при описании объектов и явлений с помощью нечетких множеств.

Нечеткая переменная характеризуется тройкой , где

α – наименование переменной;

X – универсальное множество (область определения α);

А – нечеткое множество на X, описывающее ограничения (т.е. µA(x)) на значения нечеткой переменной α.

Лингвистической переменной (ЛП) называется набор , где

β – наименование лингвистической переменной;

T – множество ее значений (терм-множество), представляющих собой наименования нечетких переменных, областью определения каждой из которых является множество X. Множество T называется базовым терм-множеством лингвистической переменной;

G – синтаксическая процедура, позволяющая оперировать элементами терм-множества T, в частности, генерировать новые термы (значения). Множество , где G(T) – множество сгенерированных термов, называется расширенным терм-множеством лингвистической переменной;

М – семантическая процедура, позволяющая превратить каждое новое значение лингвистической переменной, образуемое процедурой G, в нечеткую переменную, т.е. сформировать соответствующее нечеткое множество.

Замечание. Чтобы избежать большого количества символов:

1) символ β используют как для названия самой переменной, так и для всех ее значений;

2) пользуются одним и тем же символом для обозначения нечеткого множества и его названия, например терм «Молодой», являющийся значением лингвистической переменной β = «возраст», одновременно есть и нечеткое множество М («Молодой»).

Присвоение нескольких значений символам предполагает, что контекст позволяет разрешить возможные неопределенности.

Пример. Пусть эксперт определяет толщину выпускаемого изделия с помощью понятий «Малая толщина», «Средняя толщина» и «Большая толщина», при этом минимальная толщина равна 10 мм, а максимальная – 80 мм.

Формализация такого описания может быть проведена с помощью следующей лингвистической переменной , где

β – толщина изделия;

Т – {«Малая толщина», «Средняя толщина», «Большая толщина»};

X – [10, 80];

G – процедура образования новых термов с помощью связок «и», «или» и модификаторов типа «очень», «не», «слегка» и т.п. Например: «Малая или средняя толщина», «Очень малая толщина» и т.д.;

М – процедура задания на X = [10, 80] нечетких подмножеств А1 = «Малая толщина», А2 = «Средняя толщина», A3 = «Большая толщина», а также нечетких множеств для термов из G(T) в соответствии с правилами трансляции нечетких связок и модификаторов «и», «или», «не», «очень», «слегка» и других операций над нечеткими множествами вида: и т. п.

Замечание. Наряду с рассмотренными выше базовыми значениями лингвистической переменной «Толщина» (Т = {«Малая толщина», «Средняя толщина», «Большая толщина»}) возможны значения, зависящие от области определения X. В данном случае значения лингвистической переменной «Толщина изделия» могут быть определены как «около 20 мм», «около 50 мм», «около 70 мм», т.е. в виде нечетких чисел.

Терм-множество и расширенное терм-множество в условиях примера можно характеризовать функциями принадлежности, приведенными на рис. 1.5 и 1.6.

1.3.1. Нечеткие числа

Нечеткие числа – нечеткие переменные, определенные на числовой оси, т.е. нечеткое число определяется как нечеткое множество А на множестве действительных чисел R с функцией принадлежности где х – действительное число, т.е. R.

Нечеткое число А нормально, если  выпуклое, если для любых xyz выполняется

.

Множество α-уровня нечеткого числа А определяется как

Aα = {x/µA(x) ≥ α}.

Подмножество R называется носителем нечеткого числа А, если

SA = {x/µA(x) > 0}.

Нечеткое число А унимодально, если условие µA(x) = 1 справедливо только для одной точки действительной оси.

Выпуклое нечеткое число А называется нечетким нулем, если

.

Нечеткое число А положительно, если и отрицательно, если .

1.3.2. Операции над нечеткими числами. Расширенные бинарные арифметические операции (сложение, умножение и пр.) для нечетких чисел определяются через соответствующие операции для четких чисел с использованием принципа обобщения следующим образом.

Пусть А и В – нечеткие числа, и – нечеткая операция, соответствующая произвольной алгебраической операции над обычными числами. Тогда (используя здесь и в дальнейшем обозначения вместо и вместо ) можно записать

.

Отсюда

,

,

,

,

,

,

.

1.3.3. Нечеткие числа (L-R)-типа. Нечеткие числа (L-R)-типа – это разновидность нечетких чисел специального вида, т.е. задаваемых по определенным правилам с целью снижения объема вычислений при операциях над ними.

Функции принадлежности нечетких чисел (L-R)-типа задаются с помощью невозрастающих на множестве неотрицательных действительных чисел функций действительного переменного L(x) и R(x), удовлетворяющих свойствам:

а) L(-x) = L(x), R(-x) = R(x);

б) L(0) = R(0).

Очевидно, что к классу (L-R)-функций относятся функции, графики которых имеют вид, приведенный на рис. 1.7.

Примерами аналитического задания (L-R)-функций могут быть

 ,

и т.д.

Пусть L(у) и R(у) – функции (L-R)-типa (конкретные). Унимодальное нечеткое число А с модой а (т. е. µA(a)=1) с помощью L(у) и R(у) задается следующим образом:

где а – мода; α > 0, β > 0 – левый и правый коэффициенты нечеткости.

Таким образом, при заданных L(у) и R(у) нечеткое число (унимодальное) задается тройкой A = (a, α, β).

Толерантное нечеткое число задается, соответственно, четверкой параметров A = (a1, a2, α, β) где а1 и а2 – границы толерантности, т.е. в промежутке [а1, a2] значение функции принадлежности равно 1.

Примеры графиков функций принадлежности нечетких чисел (L-R)-типа приведены на рис. 1.8.

Отметим, что в конкретных ситуациях функции L(у), R(у), a также параметры α, β нечетких чисел (a, α, β) и (a1, a2, α, β) должны подбираться таким образом, чтобы результат операции (сложения, вычитания, деления и т.д.) был точно или приблизительно равен нечеткому числу с теми же L(у) и R(у), а параметры α' и β' результата не выходили за рамки ограничений на эти параметры для исходных нечетких чисел, особенно если результат в дальнейшем будет участвовать в операциях.

Замечание. Решение задач математического моделирования сложных систем с применением аппарата нечетких множеств требует выполнения большого объема операций над разного рода лингвистическими и другими нечеткими переменными. Для удобства исполнения операций, а также для ввода-вывода и хранения данных, желательно работать с функциями принадлежности стандартного вида.

Нечеткие множества, которыми приходится оперировать в большинстве задач, являются, как правило, унимодальными и нормальными. Одним из возможных методов аппроксимации унимодальных нечетких множеств является аппроксимация с помощью функций (L-R)-типа.

Примеры (L-R)-представлений некоторых лингвистических переменных приведены в табл. 1.2.

Таблица 1.2. Возможное (L-R)-представление некоторых лингвистических переменных

Терм ЛП

(L-R)-представление

Графическое представление

Средний

А = (а, α, β)LR

α = β > 0

α β

Малый

А = (а, , β)LR

α = ∞

α = ∞ β

Большой

А = (а, α,)LR

β = ∞

α β = ∞

Приблизительно в диапазоне

А = (а1, а2, α, β)LR

α = β > 0

α β

а1 а2

Определенный

А = (а, 0, 0)LR

α = β = 0

α = 0 β = 0

Разнообразный:

зона полной неопределенности

А = (а, ,)LR

α = β =

α = β = ∞

1.4. Нечеткие отношения

Пусть – прямое произведение универсальных множеств и М – некоторое множество принадлежностей (например, М = [0, 1]). Нечеткое n-арное отношение определяется как нечеткое подмножество R на Е, принимающее свои значения в М. В случае n = 2 и М = [0, 1] нечетким отношением R между множествами X = Е1 и Y = Е2 будет называться функция которая ставит в соответствие каждой паре элементов величину .

Обозначение: нечеткое отношение на запишется в виде

.

В случае, когда X = Y, т.е. X и Y совпадают, нечеткое отношение называется нечетким отношением на множестве X.

Примеры

1) Пусть X = {x1, x2, x3}, Y = {y1, y2, y3}, M = [0,1]. Нечеткое отношение R = XRY может быть задано, к примеру, табл. 1.3.

Таблица 1.3 Задание нечеткого отношения

y1

y2

y3

y4

x1

x2

x3

0

0

1

0

0,8

0,5

0,1

1

0,6

0,3

0,7

1

2) Пусть X = Y = (-∞, ∞) т. е. множество всех действительных чисел. Отношение x >> y(х много больше у) можно задать функцией принадлежности:

3) Отношение R, для которого , при достаточно больших k можно интерпретировать так: «х и у близкие друг к другу числа».

1.4.1. Операции над нечеткими отношениями

Объединение двух отношений R1 и R2. Объединение двух отношений обозначается и определяется выражением

.

Пересечение двух отношений. Пересечение двух отношений R1 и R2 обозначается и определяется выражением

.

Алгебраическое произведение двух отношений. Алгебраическое произведение двух отношений R1 и R2 обозначается R1R2 и определяется выражением

.

Алгебраическая сумма двух отношений. Алгебраическая сумма двух отношений R1 и R2 обозначается и определяется выражением

.

Для введенных операций справедливы следующие свойства дистрибутивности:

,

,

,

,

,

.

Дополнение отношения. Дополнение отношения R обозначается и определяется функцией принадлежности:

.

Дизъюнктивная сумма двух отношений. Дизъюнктивная сумма двух отношений R1 и R2 обозначается и определяется выражением

.

Обычное отношение, ближайшее к нечеткому. Пусть R – нечеткое отношение с функцией принадлежности Обычное отношение, ближайшее к нечеткому, обозначается R и определяется выражением

По договоренности принимают µR(x, y) = 0 при µR(x, y) = 0,5.

Композиция (свертка) двух нечетких отношений. Пусть R1 – нечеткое отношение между X и Y, и R2 – нечеткое отношение между Y и Z. Нечеткое отношение между X и Z, обозначаемое определенное через R1 и R2 выражением

,

называется (max-min)-композицией ((max-min)-сверткой) отношений R1 и R2.

Пример. Пусть

R1

y1

y2

y3

x1

x2

0,1

1

0,7

0,5

0,4

0

R2

z1

z2

z3

z4

y1

y2

y3

0,9

0,3

0,1

0

0,6

1

1

0

0

0,2

0,9

0,5

Тогда

z1

z2

z3

z4

x1

x2

0,3

0,9

0,6

0,5

0,1

1

0,7

0,5

При этом

;

;

……………………..

Замечание. В данном примере вначале использован «аналитический» способ композиции отношений R1 и R2, т.е. iстрока R1 «умножается» на j-й столбец R2 с использованием операции , полученный результат «свертывается» с использованием операции в µ(xi, zj).

Свойства (max-min)-композиции. Операция (max-min)-композиции ассоциативна, т.е.

дистрибутивна относительно объединения, но недистрибутивна относительно пересечения:

,

.

Кроме того, для (max-min)-композиции выполняется следующее важное свойство: если , то .

max-композиция. В выражении

для (max-min)-композиции отношений R1 и R2 операцию можно заменить любой другой, для которой выполняются те же ограничения, что и для ассоциативность и монотонность (в смысле неубывания) по каждому аргументу. Тогда

В частности, операция может быть заменена алгебраическим умножением, тогда говорят о (max-prod)-композиции.

1.5. Нечеткие выводы

Используемый в различного рода экспертных и управляющих системах механизм нечетких выводов в своей основе имеет базу знаний, формируемую специалистами предметной области в виде совокупности нечетких предикатных правил вида:

П1: если х есть A1, тогда у есть B1,

П2: если х есть А2, тогда у есть В2,

……………………………………….

Пп: если х есть Ап, тогда у есть Вп,

где х – входная переменная (имя для известных значений данных), у – переменная вывода (имя для значения данных, которое будет вычислено); А и В – функции принадлежности, определенные соответственно на x и у.

Пример подобного правила

Если х – низко, то у – высоко.

Приведем более детальное пояснение. Знание эксперта отражает нечеткое причинное отношение предпосылки и заключения, поэтому его можно назвать нечетким отношением и обозначить через R:

,

где «« называют нечеткой импликацией.

Отношение R можно рассматривать как нечеткое подмножество прямого произведения полного множества предпосылок X и заключений Y. Таким образом, процесс получения (нечеткого) результата вывода В' с использованием данного наблюдения А' и знания можно представить в виде формулы

,

где «« – введенная выше операция свертки.

Как операцию композиции, так и операцию импликации в алгебре нечетких множеств можно реализовывать по-разному (при этом, естественно, будет разниться и итоговый получаемый результат), но в любом случае общий логический вывод осуществляется за следующие четыре этапа.

Нечеткость (введение нечеткости, фазификация, fuzziflcation). Функции принадлежности, определенные на входных переменных применяются к их фактическим значениям для определения степени истинности каждой предпосылки каждого правила.

Логический вывод. Вычисленное значение истинности для предпосылок каждого правила применяется к заключениям каждого правила. Это приводит к одному нечеткому подмножеству, которое будет назначено каждой переменной вывода для каждого правила. В качестве правил логического вывода обычно используются только операции min (МИНИМУМ) или prod (УМНОЖЕНИЕ). В логическом выводе МИНИМУМА функция принадлежности вывода «отсекается» по высоте, соответствующей вычисленной степени истинности предпосылки правила (нечеткая логика «И»). В логическом выводе УМНОЖЕНИЯ функция принадлежности вывода масштабируется при помощи вычисленной степени истинности предпосылки правила.

Композиция. Все нечеткие подмножества, назначенные к каждой переменной вывода (во всех правилах), объединяются вместе, чтобы формировать одно нечеткое подмножество для каждой переменной вывода. При подобном объединении обычно используются операции max (МАКСИМУМ) или sum (СУММА). При композиции МАКСИМУМА комбинированный вывод нечеткого подмножества конструируется как поточечный максимум по всем нечетким подмножествам (нечеткая логика «ИЛИ»). При композиции СУММЫ комбинированный вывод нечеткого подмножества конструируется как поточечная сумма по всем нечетким подмножествам, назначенным переменной вывода правилами логического вывода.

4. В заключение (дополнительно) – приведение к четкости (дефазификация, defuzziflcation), которое используется, когда полезно преобразовать нечеткий набор выводов в четкое число. Имеется большое количество методов приведения к четкости, некоторые из которых рассмотрены ниже.

Пример. Пусть некоторая система описывается следующими нечеткими правилами:

П1: если х есть А, тогда w есть D,

П2: если у есть В, тогда w есть Е,

П3: если z есть С, тогда w есть F,

где х, у и z – имена входных переменных, w – имя переменной вывода, а А, В, С, D, E, F – заданные функции принадлежности (треугольной формы).

Процедура получения логического вывода иллюстрируется рис. 1.9.

Предполагается, что входные переменные приняли некоторые конкретные (четкие) значения – x0, y0 и z0.

В соответствии с приведенными этапами, на этапе 1 для данных значений и исходя из функций принадлежности А, В, С, находятся степени истинности α(x0), α(y0) и α(z0) для предпосылок каждого из трех приведенных правил (см. рис. 1.9).

На этапе 2 происходит «отсекание» функций принадлежности заключений правил (т.е. D, E, F) на уровнях α(x0), α(y0) и α(z0).

На этапе 3 рассматриваются усеченные на втором этапе функции принадлежности и производится их объединение с использованием операции max, в результате чего получается комбинированное нечеткое подмножество, описываемое функцией принадлежности µΣ(w) и соответствующее логическому выводу для выходной переменной w.

Наконец, на 4-м этапе – при необходимости – находится четкое значение выходной переменной, например, с применением центроидного метода: четкое значение выходной переменной определяется как центр тяжести для кривой µΣ(w) т. е.

.

Рассмотрим следующие наиболее часто используемые модификации алгоритма нечеткого вывода, полагая, для простоты, что базу знаний организуют два нечетких правила вида:

П1: если х есть A1 и у есть B1, тогда z есть C1,

П2: если х есть А2 и у есть В2, тогда z есть С2,

где х и у – имена входных переменных, z – имя переменной вывода, A1, A2, B1, B2, C1, С2 – некоторые заданные функции принадлежности, при этом четкое значение z0 необходимо определить на основе приведенной информации и четких значений x0 и у0.

1.5.1. Алгоритм Mamdani. Данный алгоритм соответствует рассмотренному примеру и рис. 1.9. В рассматриваемой ситуации он математически может быть описан следующим образом.

Нечеткость: находятся степени истинности для предпосылок каждого правила: A1(x0), А2(x0), B1(y0), В2(у0).

Нечеткий вывод: находятся уровни «отсечения» для предпосылок каждого из правил (с использованием операции МИНИМУМ)

,

,

где через «« обозначена операция логического минимума (min), затем находятся «усеченные» функции принадлежности

,

.

3. Композиция: с использование операции МАКСИМУМ (max, далее обозначаемой как ««) производится объединение найденных усеченных функций, что приводит к получению итогового нечеткого подмножества для переменной выхода с функцией принадлежности

.

4. Наконец, приведение к четкости (для нахождения z0) проводится, например, центроидным методом.

1.5.2. Алгоритм Tsukamoto. Исходные посылки – как у предыдущего алгоритма, но в данном случае предполагается, что функции C1(z), C2(z) являются монотонными.

Первый этап – такой же, как в алгоритме Mamdani.

На втором этапе сначала находятся (как в алгоритме Mamdani) уровни «отсечения» α1 и α2, а затем – посредством решения уравнений

α1 = С1(z),    α2 = С2(z)

– четкие значения (z1 и z2) для каждого из исходных правил.

3. Определяется четкое значение переменной вывода (как взвешенное среднее z1 и z2):

;

в общем случае (дискретный вариант центроидного метода)

.

Пример. Пусть имеем A1(x0) = 0,7, А2(x0) = 0,6, B1(y0) = 0,3, B2(y0) = 0,8, соответствующие уровни отсечения

α1 = min (A1(x0), B1(y0)) = min (0,7; 0,3) = 0,3,

α2 = min (A2(x0), B2(y0)) = min (0,6; 0,8) = 0,6

и значения z1 = 8 и z2 = 4, найденные в результате решения уравнений

C1(z1)=0,3,  C2(z2)=0,6.

При этом четкое значение переменной вывода (см. рис. 1.10)

z0 = (8∙0,3 + 4∙0,6)/(0,3 + 0,6) = 6.

1.5.3. Алгоритм Sugeno. Sugeno и Takagi использовали набор правил в следующей форме (как и раньше, приводим пример двух правил):

П1: если х есть A1 и у есть B1, тогда z1 = а1х + b1y,

П2: если х есть А2 и у есть В2, тогда z2 = а2х + b2у.

Представление алгоритма

1. Первый этап – как в алгоритме Mamdani.

2. На втором этапе находятся , и индивидуальные выходы правил:

z*1 = a1x0 + b1y0,

z*2 = a2x0 + b2y0.

3. На третьем этапе определяется четкое значение переменной вывода:

.

Иллюстрирует алгоритм рис. 1.11.

1.5.4. Алгоритм Larsen. В алгоритме Larsen нечеткая импликация моделируется с использованием оператора умножения.

Описание алгоритма

Первый этап – как в алгоритме Mamdani.

На втором этапе, как в алгоритме Mamdani вначале находятся значения

,

,

а затем – частные нечеткие подмножества

α1C1(z), α2C2(z).

3. Находится итоговое нечеткое подмножество с функцией принадлежности

(в общем случае п правил .

4. При необходимости производится приведение к четкости (как в ранее рассмотренных алгоритмах).

Алгоритм Larsen иллюстрируется рис. 1.12.

1.5.5. Упрощенный алгоритм нечеткого вывода. Исходные правила в данном случае задаются в виде:

П1: если х есть A1 и у есть B1, тогда z1 = с1,

П2: если х есть А2 и у есть В2, тогда z2 = с2,

где с1 и с2 – некоторые обычные (четкие) числа.

Описание алгоритма

1. Первый этап – как в алгоритме Mamdani.

2. На втором этапе находятся числа , .

3. На третьем этапе находится четкое значение выходной переменной по формуле

или – в общем случае наличия п правил – по формуле

.

Иллюстрация алгоритма приведена на рис. 1.13.

1.5.6. Методы приведения к четкости

1. Выше уже был рассмотрен один из данных методов – центроидный. Приведем соответствующие формулы еще раз. Для непрерывного варианта:

;

для дискретного варианта:

.

2. Первый максимум (First-of-Maxima). Четкая величина переменной вывода находится как наименьшее значение, при котором

достигается максимум итогового нечеткого множества, т.е. (см. рис. 1.14 а)

.

3. Средний максимум (Middle-of-Maxima). Четкое значение находится по формуле

,

где G – подмножество элементов, максимизирующих С (см. рис. 1.14 б).

Дискретный вариант (если С – дискретно):

.

4. Критерий максимума (Max-Criterion). Четкое значение выбирается произвольно среди множества элементов, доставляющих максимум С, т. е.

.

5. Высотная дефазификация (Height defuzziflcation). Элементы области определения Ω, для которых значения функции принадлежности меньше, чем некоторый уровень α в расчет не принимаются, и четкое значение рассчитывается по формуле

,

где Cα – нечеткое множество α-уровня (см. выше).

1.5.7. Нисходящие нечеткие выводы. Рассмотренные до сих пор нечеткие выводы представляют собой восходящие выводы от предпосылок к заключению. В последние годы в диагностических нечетких системах начинают применяться нисходящие выводы. Рассмотрим механизм подобного вывода на примере.

Возьмем упрощенную модель диагностики неисправности автомобиля с именами переменных:

х1 – неисправность аккумулятора;

х2 – отработка машинного масла;

y1 – затруднения при запуске;

y2 – ухудшение цвета выхлопных газов;

y3 – недостаток мощности.

Между xi и yj существуют нечеткие причинные отношения , которые можно представить в виде некоторой матрицы R с элементами Конкретные входы (предпосылки) и выходы (заключения) можно рассматривать как нечеткие множества А и В на пространствах X и Y. Отношения этих множеств можно обозначить как

,

где, как и раньше, знак «« обозначает правило композиции не-четких выводов.

В данном случае направление выводов является обратным к направлению выводов для правил, т.е. в случае диагностики имеется (задана) матрица R (знания эксперта), наблюдаются выходы В (или симптомы) и определяются входы А (или факторы).

Пусть знания эксперта-автомеханика имеют вид

,

а в результате осмотра автомобиля его состояние можно оценить как

B = 0,9/y1 + 0,1/y2 +0,2/y3.

Требуется определить причину такого состояния:

A = a1/x1 + a2/x2.

Отношение введенных нечетких множеств можно представить в виде

,

либо, транспонируя, в виде нечетких векторов-столбцов:

.

При использовании (max-min)-композиции последнеесоотношение преобразуется к виду

,

,

.

При решении данной системы заметим прежде всего, что в первом уравнении второй член правой части не влияет на правую часть, поэтому

, a1 ≥ 0,9.

Из второго уравнения получим:

, a2 ≤ 0,1.

Полученное решение удовлетворяет третьему уравнению, таким образом имеем:

0,9 ≤ a1 ≤ 1,0, 0 ≤ a2 ≤ 0,1,

т.е. лучше заменить аккумулятор (a1 – параметр неисправности аккумулятора, а2 – параметр отработки машинного масла).

На практике в задачах, подобных рассмотренной, количество переменных может быть существенным, могут одновременно использоваться различные композиции нечетких выводов, сама схема выводов может быть многокаскадной. Общих методов решения подобных задач в настоящее время, по-видимому, не существует.

1.6. Пример: нечеткий регулятор

Приведем еще один пример использования аппарата нечеткой логики, на этот раз – в задаче управления. Рассмотрим замкнутую систему регулирования, представленную на рис. 1.15, где через О обозначен объект управления, через Р – регулятор, а через и, у, е, х – соответственно, входной сигнал системы, ее выходной сигнал, сигнал ошибки (рассогласования), поступающий на вход регулятора, и выходной сигнал регулятора.

В рассматриваемой системе регулятор вырабатывает управляющий сигнал х в соответствии с выбранным алгоритмом регулирования, например, пропорционально сигналу ошибки, либо ее

интегралу и т. п. Покажем, что в данном случае для выработки такого сигнала применимы рассмотренные выше методы аппарата нечеткой логики.

Предположим, что функции регулятора выполняет микроконтроллер, при этом аналоговый сигнал е ограничен диапазоном [-1, 1] и преобразуется в цифровую форму аналого-цифровым преобразователем (АЦП) с дискретностью 0,25, а выходной сигнал регулятора х формируется с помощью цифроаналогового преобразователя и имеет всего 5 уровней: -1, -0,5, 0, 0,5, 1.

Принимая во внимание данные уровни, введем лингвистические переменные:

A1: большой положительный,

А2: малый положительный,

А3: нулевой,

А4: малый отрицательный,

А5: большой отрицательный,

и на дискретном множестве возможных значений сигнала рассогласования е определим функции принадлежности так, как это приведено в табл. 1.4.

Предположим, далее, что функционирование регулятора определяется следующими правилами (надо сказать, типичными для задач управления):

П1: если е = А3 и Δе = А3, то х = 0,

П2: если е = А2 и Δе = А2, то х = -0,5,

П3: если е = А4 и Δе = А4, то х = 1,

П4: если е = А1 и Δе = А1, то х = -1,

где Δе – первая разность сигнала ошибки в текущий дискретный момент времени.

Таблица 1.4. Значения функций принадлежности

-1

-0,75

-0,5

-0,25

0

0,25

0,5

0,75

1

А1(е)

А2(е)

А3(е)

А4(е)

А5(е)

0

0

0

0,3

1

0

0

0

0,7

0,7

0

0

0,3

1

0,3

0

0

0,7

0,7

0

0

0,3

1

0,3

0

0

0,7

0,7

0

0

0,3

1

0,3

0

0

0,7

0,7

0

0

0

1

0,3

0

0

0

Заметим, что набор правил может быть, вообще говоря, и каким-то другим. Если, например, используется упрощенный алгоритм нечеткого вывода, то при значениях, скажем, е = 0,25 и Δе = 0,5 имеем:

α1 = min (0,7; 0,3) = 0,3 и x1 = 0,

α2 = min (0,7; 1) = 0,7 и x2 = -0,5,

α3 = min (0; 0) = 0  и x3 = 1,

α4 = min (0; 0,3) = 0,3 и x4 = -1,

и выход регулятора

.

Аналогичным образом значения выходного сигнала регулятора рассчитываются при других значениях е и Δе.

Отметим, что при проектировании подобных («нечетких») регуляторов основным (и не формализуемым) этапом является задание набора нечетких правил. Другие аспекты: выбор формы функций принадлежности, алгоритма приведения к четкости и т. п. представляются задачами более простыми.

1.7. Эффективность систем принятия решений, использующих методы нечеткой логики

Возможность использования аппарата нечеткой логики базируется на следующих результатах.

1. В 1992 г. Wang показал, что нечеткая система, использующая набор правил

П1: если xi есть Аi и уi есть Вi, тогда zi есть Сi, i = 1, 2, ..., n, при:

1)  гауссовских функциях принадлежности

, ,

;

2) композиции в виде произведения

(Ai (x) and Bi (y)) = Ai (x) Bi (y);

3) импликации в форме (Larsen)

(Ai (x) and Bi (y)) → Ci (z) = Ai (x) Bi (y) Ci (z);

4) центроидном методе приведения к четкости

,

где αi – центры Сi; является универсальным аппроксиматором, т.е. может аппроксимировать любую непрерывную функцию на компакте U с произвольной точностью (естественно, при n→∞).

Иначе говоря, Wang доказал теорему: для каждой вещественной непрерывной функции g, заданной на компакте U, и для произвольного ε > 0 существует нечеткая экспертная система, формирующая выходную функцию f(x) такую, что

,

где || ∙ || – символ принятого расстояния между функциями.

2. В 1995 г. Castro показал, что логический контроллер Маm-dani при:

1)  симметричных треугольных функциях принадлежности:

2) композиции с использованием операции min:

(Ai (x) and Bi (y)) = min (Ai (x) Bi (y));

3) импликации в форме Mamdani и центроидного метода приведения к четкости:

,

где ci – центры Сi; также является универсальным аппроксиматором.

Вообще говоря, системы с нечеткой логикой целесообразно применять для сложных процессов, когда нет простой математической модели; если экспертные знания об объекте или о процессе можно сформулировать только в лингвистической форме.

Данные системы применять нецелесообразно, когда требуемый результат может быть получен каким-либо другим (стандартным) путем, или когда для объекта или процесса уже найдена адекватная и легко исследуемая математическая модель.

Отметим, что основные недостатки систем с нечеткой логикой связаны с тем, что:

исходный набор постулируемых нечетких правил формулируется экспертом-человеком и может оказаться неполным или противоречивым;

вид и параметры функций принадлежности, описывающих входные и выходные переменные системы, выбираются субъективно и могут оказаться не вполне отражающими реальную действительность.


3.1. Морфологическое описание НС

Под нейронными сетями (НС) подразумеваются вычислительные структуры, которые моделируют простые биологические процессы, обычно ассоциируемые с процессами человеческого мозга. Адаптируемые и обучаемые, они представляют собой распараллеленные системы, способные к обучению путем анализа положительных и отрицательных воздействий. Элементарным преобразователем в данных сетях является искусственный нейрон или просто нейрон, названный так по аналогии с биологическим прототипом.

К настоящему времени предложено и изучено большое количество моделей нейроподобных элементов и нейронных сетей, ряд из которых рассмотрен в настоящей главе.

Термин «нейронные сети» сформировался в 40-х годах XX века в среде исследователей, изучавших принципы организации и функционирования биологических нейронных сетей. Основные результаты, полученные в этой области, связаны с именами американских исследователей У.Маккалоха, Д.Хебба, Ф.Розенблатта, М. Минского, Дж.Хопфилда и др.

Представим некоторые проблемы, решаемые в контексте НС и представляющие интерес для пользователей.

Классификация образов. Задача состоит в указании принадлежности входного образа (например, речевого сигнала или рукописного символа), представленного вектором признаков, одному или нескольким предварительно определенным классам. К известным приложениям относятся распознавание букв, распознавание речи, классификация сигнала электрокардиограммы, классификация клеток крови.

Кластеризация/категоризация. При решении задачи кластеризации, которая известна также как классификация образов «без учителя», отсутствует обучающая выборка с метками классов. Алгоритм кластеризации основан на подобии образов и размещает близкие образы в один кластер. Известны случаи применения кластеризации для извлечения знаний, сжатия данных и исследования свойств данных.

Аппроксимация функций. Предположим, что имеется обучающая выборка ((x1, y1), (x2, y2), …, (xN, yN)) (пары данных вход-выход), которая генерируется неизвестной функцией F(x), искаженной шумом. Задача аппроксимации состоит в нахождении оценки неизвестной функции F(x). Аппроксимация функций необходима при решении многочисленных инженерных и научных задач моделирования.

Предсказание/прогноз. Пусть заданы п дискретных отсчетов {y (t1), y (t2), …, y (tk)} в последовательные моменты времени t1, t2, …, tk. Задача состоит в предсказании значения y(tk+1) в некоторый будущий момент времени tk+1. Предсказание/прогноз имеет значительное влияние на принятие решений в бизнесе, науке и технике. Предсказание цен на фондовой бирже и прогноз погоды являются типичными приложениями техники предсказания/прогноза.

Оптимизация. Многочисленные проблемы в математике, статистике, технике, науке, медицине и экономике могут рассматриваться как проблемы оптимизации. Задачей алгоритма оптимизации является нахождение такого решения, которое удовлетворяет системе ограничений и максимизирует или минимизирует целевую функцию. Известная задача коммивояжера является классическим примером задачи оптимизации.

Память, адресуемая по содержанию. В модели вычислений фон Неймана обращение к памяти доступно только посредством адреса, который не зависит от содержания памяти. Более того, если допущена ошибка в вычислении адреса, то может быть найдена совершенно иная информация. Ассоциативная память, или память, адресуемая по содержанию, доступна по указанию заданного содержания. Содержимое памяти может быть вызвано даже по частичному входу или искаженному содержанию. Ассоциативная память чрезвычайно желательна при создании мультимедийных информационных баз данных.

Управление. Рассмотрим динамическую систему, заданную совокупностью {u (t), y (t)}, где u (t) является входным управляющим воздействием, a y(t) – выходом системы в момент времени t. В системах управления с эталонной моделью целью управления является расчет такого входного воздействия u (t), при котором система следует по желаемой траектории, диктуемой эталонной моделью. Примером является оптимальное управление двигателем.

3.1. Биологический нейрон

Нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Все процессы передачи раздражений от нашей кожи, ушей и глаз к мозгу, процессы мышления и управления действиями – все это реализовано в живом организме как передача электрических импульсов между нейронами.

Нейрон (нервная клетка) является особой биологической клеткой, которая обрабатывает информацию (рис. 2.1). Он состоит из тела и отростков нервных волокон двух типов – дендритов, по

которым принимаются импульсы, и единственного аксона, по которому нейрон может передавать импульс. Тело нейрона включает ядро, которое содержит информацию о наследственных свойствах, и плазму, обладающую молекулярными средствами для производства необходимых нейрону материалов. Нейрон получает сигналы (импульсы) от аксонов других нейронов через дендриты (приемники) и передает сигналы, сгенерированные телом клетки, вдоль своего аксона (передатчик), который в конце разветвляется на волокна. На окончаниях этих волокон находятся специальные образования – синапсы, которые влияют на силу импульса.

Синапс является элементарной структурой и функциональным узлом между двумя нейронами (волокно аксона одного нейрона и дендрит другого). Когда импульс достигает синаптического окончания, высвобождаются определенные химические вещества, называемые нейротрансмиттерами. Нейротрансмиттеры диффундируют через синаптическую щель, возбуждая или затормаживая, в зависимости от типа синапса, способность нейрона-приемника генерировать электрические импульсы. Результативность синапса может настраиваться проходящими через него сигналами, так что синапсы могут обучаться в зависимости от активности процессов, в которых они участвуют. Эта зависимость от предыстории действует как память, которая, возможно, ответственна за память человека. Важно отметить, что веса синапсов могут изменяться со временем, что изменяет и поведение соответствующего нейрона.

3.2. Функциональное описание НС

3.3. Нелинейные преобразования в нейронных сетях

Нейрон – это составная часть нейронной сети. На рис. 2.2 показана его структура.

В состав нейрона входят умножители (синапсы), сумматор и нелинейный преобразователь. Синапсы осуществляют связь между нейронами и умножают входной сигнал на число, характеризующее силу связи, – вес синапса.

Сумматор выполняет сложение сигналов, поступающих по синаптическим связям от других нейронов, и внешних входных сигналов. Нелинейный преобразователь реализует нелинейную функцию одного аргумента – выхода сумматора. Эта функция называется «функция активации» или «передаточная функция» нейрона. Нейрон в целом реализует скалярную функцию векторного аргумента. Математическая модель нейрона описывается соотношениями

,

где wi – вес синапса (i = 1, ..., n); b – значение смещения; s – результат суммирования; xi – компонента входного вектора (входной сигнал) (i = 1, ..., n); у – выходной сигнал нейрона; n – число входов нейрона; f – нелинейное преобразование (функция активации или передаточная функция).

Таблица 2.1. Перечень функций активации нейронов

Название

Формула

Область

значений

Пороговая

0, 1

Знаковая

(сигнатурная)

-1, 1

Сигмоидальная

(логистическая)

(0, 1)

Полулинейная

(0, ∞)

Линейная

(-∞, ∞)

Радиальная

базисная (гауссова)

(0, 1)

Полулинейная

с насыщением

(0, 1)

Линейная

с насыщением

(-1, 1)

Гиперболический

тангенс (сигмоидальная)

(-1, 1)

Треугольная

(0, 1)

В общем случае входной сигнал, весовые коэффициенты и значения смещения могут принимать действительные значения. Выход (у) определяется видом функции активации и может быть как действительным, так и целым. Во многих практических задачах входы, веса и смещения могут принимать лишь некоторые фиксированные значения.

Синаптические связи с положительными весами называют возбуждающими, с отрицательными весами – тормозящими.

Таким образом, нейрон полностью описывается своими весами wi и передаточной функцией f(s). Получив набор чисел (вектор) xi в качестве входов, нейрон выдает некоторое число у на выходе.

Описанный вычислительный элемент можно считать упрощенной математической моделью биологических нейронов – клеток, из которых состоит нервная система человека и животных.

Чтобы подчеркнуть различие нейронов биологических и математических, вторые иногда называют нейроноподобными элементами или формальными нейронами.

На входной сигнал (s) нелинейный преобразователь отвечает выходным сигналом f(s), который представляет собой выход нейрона у.

Примеры активационных функций представлены в табл. 2.1 и на рис. 2.3.

Одной из наиболее распространенных является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S-образного вида)

.

При уменьшении а сигмоид становится более пологим, в пределе при a = 0 вырождаясь в горизонтальную линию на уровне 0,5, при увеличении а сигмоид приближается по внешнему виду к функции единичного скачка с порогом θ в точке s = 0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0, 1]. Одно из ценных свойств сигмоидной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем:

f '(s) = a f (s) (1 – f (s)).

Следует отметить, что сигмоидная функция дифференцируема на всей оси абсцисс, что используется в некоторых алгоритмах обучения. Кроме того она обладает свойством усиливать слабые сигналы лучше, чем большие, и предотвращает насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон.

Возвращаясь к общим чертам, присущим всем НС, отметим принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно.

3.2. Классификация и свойства нейронных сетей

Как отмечалось, искусственная нейронная сеть (ИНС, нейро-сеть) – это набор нейронов, соединенных между собой. Как правило, передаточные (активационные) функции всех нейронов в сети фиксированы, а веса являются параметрами сети и могут изменяться. Некоторые входы нейронов помечены как внешние входы сети, а некоторые выходы – как внешние выходы сети. Подавая любые числа на входы сети, мы получаем какой-то набор чисел на выходах сети. Таким образом, работа нейросети состоит в преобразовании входного вектора X в выходной вектор Y, причем это преобразование задается весами сети.

Практически любую задачу можно свести к задаче, решаемой нейросетью. В табл. 2.2 показано, каким образом следует сформулировать в терминах нейросети задачу распознавания рукописных букв.

Поясним, зачем требуется выбирать выход с максимальным уровнем сигнала. Дело в том, что уровень выходного сигнала, как правило, может принимать любые значения из какого-то отрезка.

Однако в данной задаче нас интересует не аналоговый ответ, а всего лишь номер категории (номер буквы в алфавите). Поэтому используется следующий подход – каждой категории сопоставляется свой выход, а ответом сети считается та категория, на чьем выходе уровень сигнала максимален. В определенном смысле уровень сигнала на выходе «А» – это достоверность того, что на вход была подана рукописная буква «А». Задачи, в которых нужно отнести входные данные к одной из известных категорий, называются задачами классификации. Изложенный подход – стандартный способ классификации с помощью нейронных сетей.

Таблица 2.2. Задача распознавания рукописных букв в терминах нейросети

Задача распознавания рукописных букв

Дано: растровое черно-белое

изображение буквы размером

30 х 30 пикселов

Надо: определить, какая это буква (в алфавите 33 буквы)

Формулировка для нейросети

Дано: входной вектор из 900 двоичных символов

(900 = 30 х 30)

Надо: построить нейросеть с 900 выходами и 33 входами, которые помечены буквами. Если на входе сети изображение буквы «А», то максимальное значение выходного сигнала достигается на выходе «А». Аналогично сеть работает для всех 33 букв

Теперь, когда стало ясно, что именно мы хотим построить, мы можем переходить к вопросу «как строить такую сеть». Этот вопрос решается в два этапа.

Выбор типа (архитектуры) сети.

Подбор весов (обучение) сети.

На первом этапе следует выбрать следующее:

какие нейроны мы хотим использовать (число входов, передаточные функции);

каким образом следует соединить их между собой;

что взять в качестве входов и выходов сети.

Эта задача на первый взгляд кажется необозримой, но, к счастью, нам необязательно придумывать нейросеть «с нуля» – существует несколько десятков различных нейросетевых архитектур, причем эффективность многих из них доказана математически. Наиболее популярные и изученные архитектуры – это многослойный персептрон, нейросеть с общей регрессией, сети Кохонена и другие, которые будут рассмотрены ниже.

На втором этапе нам следует «обучить» выбранную сеть, т.е. подобрать такие значения ее весов, чтобы сеть работала нужным образом. Необученная сеть подобна ребенку – ее можно научить чему угодно. В используемых на практике нейросетях количество весов может составлять несколько десятков тысяч, поэтому обучение – действительно сложный процесс. Для многих архитектур разработаны специальные алгоритмы обучения, которые позволяют настроить веса сети определенным образом.

В зависимости от функций, выполняемых нейронами в сети, можно выделить три их типа:

входные нейроны – это нейроны, на которые подается входной вектор, кодирующий входное воздействие или образ внешней среды; в них обычно не осуществляется вычислительных процедур, информация передается с входа на выход нейрона путем изменения его активации;

выходные нейроны – это нейроны, выходные значения которых представляют выход сети;

промежуточные нейроны – это нейроны, составляющие основу искусственных нейронных сетей.

В большинстве нейронных моделей тип нейрона связан с его расположением в сети. Если нейрон имеет только выходные связи, то это входной нейрон, если наоборот – выходной нейрон. Однако может встретиться случай, когда выход топологически внутреннего нейрона рассматривается как часть выхода сети. В процессе функционирования (эволюции состояния) сети осуществляется преобразование входного вектора в выходной, т.е. некоторая переработка информации. Конкретный вид выполняемого сетью преобразования информации обусловливается не только характеристиками нейроподобных элементов (функциями активации и т.п.), но и особенностями ее архитектуры, а именно, той или иной топологией межнейронных связей, выбором определенных подмножеств нейроподобных элементов для ввода и вывода информации, способами обучения сети, наличием или отсутствием конкуренции между нейронами, направлением и способами управления и синхронизации передачи информации между нейронами.

Топология нейронных сетей. С точки зрения топологии, среди нейронных сетей, сформированных на основе нейроподобных элементов, можно выделить три основных типа:

полносвязные сети (рис. 2.4 а);

многослойные или слоистые сети (рис. 2.4 б);

слабосвязные сети (нейронные сети с локальными связями) (рис. 2.4 в).

Полносвязные сети представляют собой ИНС, каждый нейрон которой передает свой выходной сигнал остальным нейронам, в том числе и самому себе. Все входные сигналы подаются всем нейронам.

Выходными сигналами сети могут быть все или некоторые выходные сигналы нейронов после нескольких тактов функционирования сети.

В многослойных сетях нейроны объединяются в слои. Слой содержит совокупность нейронов с едиными входными сигналами. Число нейронов в каждом слое может быть любым и никак заранее не связано с количеством нейронов в других слоях. В общем случае сеть состоит из Q слоев, пронумерованных слева направо. Внешние входные сигналы подаются на входы нейронов первого слоя (входной слой часто нумеруют как нулевой), а выходами сети являются выходные сигналы последнего слоя. Вход нейронной сети можно рассматривать как выход «нулевого слоя» вырожденных нейронов, которые служат лишь в качестве распределительных точек, суммирования и преобразования сигналов здесь не производится. Кроме входного и выходного слоев в многослойной нейронной сети есть один или несколько промежуточных (скрытых) слоев. Связи от выходов нейронов некоторого слоя q к входам нейронов следующего слоя (q+1) называются последовательными.

В свою очередь, среди слоистых сетей выделяют следующие типы.

Монотонные. Это специальный частный случай слоистых сетей с дополнительными условиями на связи и элементы. Каждый слой, кроме последнего (выходного), разбит на два блока: возбуждающий (В) и тормозящий (Т). Связи между блоками тоже разделяются на тормозящие и возбуждающие. Если от блока А к блоку С ведут только возбуждающие связи, то это означает, что любой выходной сигнал блока является монотонной неубывающей функцией любого выходного сигнала блока А. Если же эти связи только тормозящие, то любой выходной сигнал блока С является невозрастающей функцией любого выходного сигнала блока А. Для элементов монотонных сетей необходима монотонная зависимость выходного сигнала элемента от параметров входных сигналов.

Сети без обратных связей. В таких сетях нейроны входного слоя получают входные сигналы, преобразуют их и передают нейронам 1-го скрытого слоя, далее срабатывает 1-й скрытый слой и т.д. до Qo, который выдает выходные сигналы для интерпретатора и пользователя. Если не оговорено противное, то каждый

выходной сигнал i-го слоя подастся на вход всех нейронов (q+l)-го слоя; однако возможен вариант соединения q-го слоя с произвольным (q+р)-м слоем.

Следует отметить, что классическим вариантом слоистых сетей являются сети прямого распространения (рис. 2.5).

3. Сети с обратными связями. Это сети, у которых информация с последующих слоев передается на предыдущие.

В качестве примера сетей с обратными связями на рис. 2.6 представлены так называемые частично-рекуррентные сети Элмана и Жордана.

Известные сети можно разделить по принципу структуры нейронов в них на гомогенные или однородные и гетерогенные. Гомогенные сети состоят из нейронов одного типа с единой функцией

активации. В гетерогенную сеть входят нейроны с различными функциями активации.

Развивая дальше вопрос о возможной классификации НС, важно отметить существование бинарных и аналоговых сетей. Первые из них оперируют с двоичными сигналами, и выход каждого нейрона может принимать только два значения: логический ноль («заторможенное» состояние) и логическая единица («возбужденное» состояние).

Еще одна классификация делит НС на асинхронные и синхронные. В первом случае в каждый момент времени свое состояние меняет лишь один нейрон. Во втором – состояние меняется сразу у целой группы нейронов, как правило, у всего слоя. Алгоритмически ход времени в НС задается итерационным выполнением однотипных действий над нейронами. Далее будут рассматриваться только синхронные НС.

Сети можно классифицировать также по числу слоев.

Теоретически число слоев и число нейронов в каждом слое может быть произвольным, однако фактически оно ограничено ресурсами компьютера или специализированной микросхемы, на которых обычно реализуется ИНС. Чем сложнее ИНС, тем масштабнее задачи, подвластные ей.

Выбор структуры ИНС осуществляется в соответствии с особенностями и сложностью задачи. Для решения некоторых отдельных типов задач уже существуют оптимальные, на сегодняшний день, конфигурации, описанные в приложении. Если же задача не может быть сведена ни к одному из известных типов, разработчику приходится решать сложную проблему синтеза новой конфигурации. При этом он руководствуется несколькими основополагающими принципами:

• возможности сети возрастают с увеличением числа слоев сети и числа нейронов в них;

введение обратных связей наряду с увеличением возможностей сети поднимает вопрос о так называемой динамической устойчивости сети;

сложность алгоритмов функционирования сети (в том числе, например, введение нескольких типов синапсов – возбуждающих, тормозящих и др.) также способствует усилению мощи ИНС.

Вопрос о необходимых и достаточных свойствах сети для решения того или иного рода задач представляет собой целое направление нейрокомпьютерной науки. Так как проблема синтеза ИНС сильно зависит от решаемой задачи, дать общие подробные рекомендации затруднительно. В большинстве случаев оптимальный вариант получается на основе интуитивного подбора, хотя в литературе приведены доказательства того, что для любого алгоритма существует нейронная сеть, которая может его реализовать. Остановимся на этом подробнее.

Многие задачи: распознавания образов (зрительных, речевых и т.д.), выполнения функциональных преобразований при обработке сигналов, управления, прогнозирования, идентификации сложных систем и т.д., сводятся к следующей математической постановке. Необходимо построить отображение X Y такое, чтобы на каждый возможный входной сигнал X формировался правильный выходной сигнал Y. Отображение задается конечным набором пар (‹вход›, ‹известный выход›). Число таких пар (обучающих примеров) существенно меньше общего числа возможных сочетаний значений входных и выходных сигналов. Совокупность всех обучающих примеров носит название обучающей выборки.

В задачах распознавания образов X – некоторое представление образа (изображение, вектор чисел и т. д.), Y – номер класса, к которому принадлежит входной образ.

В задачах управления X – набор контролируемых параметров управляемого объекта, Y – код, определяющий управляющее воздействие, соответствующее текущим значениям контролируемых параметров.

В задачах прогнозирования в качестве входных сигналов используются временные ряды, представляющие значения контролируемых переменных на некотором интервале времени. Выходной сигнал – множество переменных, которое является подмножеством переменных входного сигнала.

При идентификации X и Y представляют входные и выходные сигналы системы соответственно.

Вообще говоря, большая часть прикладных задач может быть сведена к реализации некоторого сложного многомерного функционального преобразования.

В результате построения такого отображения (т.е. X Y) необходимо добиться того, чтобы:

обеспечивалось формирование правильных выходных сигналов в соответствии со всеми примерами обучающей выборки;

обеспечивалось формирование правильных выходных сигналов в соответствии со всеми возможными входными сигналами, которые не вошли в обучающую выборку.

Второе требование в значительной степени усложняет задачу формирования обучающей выборки. В общем виде эта задача в настоящее время еще не решена, однако во всех известных случаях было найдено частное решение. Дальнейшие рассуждения предполагают, что обучающая выборка уже сформирована.

Отметим, что теоретической основой для построения нейронных сетей является следующее

Утверждение. Для любого множества пар входных-выходных векторов произвольной размерности {(Хk, Yk), k = 1...N} существует двухслойная однородная нейронная сеть с последовательными связями, с сигмоидальными передаточными функциями и с конечным числом нейронов, которая для каждого входного вектора Xk формирует соответствующий ему выходной вектор Yk.

Таким образом, для представления многомерных функций многих переменных может быть использована однородная нейронная сеть, имеющая всего один скрытый слой, с сигмоидальными передаточными функциями нейронов.

Для оценки числа нейронов в скрытых слоях однородных нейронных сетей можно воспользоваться формулой для оценки необходимого числа синаптических весов Lw (в многослойной сети с сигмоидальными передаточными функциями):

,

где п – размерность входного сигнала, m – размерность выходного сигнала, N – число элементов обучающей выборки.

Оценив необходимое число весов, можно рассчитать число нейронов в скрытых слоях. Например, число нейронов в двухслойной сети составит:

.

Известны и другие подобные формулы, например, вида

,

.

Точно так же можно рассчитать число нейронов в сетях с большим числом слоев, которые иногда целесообразно использовать: такие многослойные нейронные сети могут иметь меньшие размерности матриц синаптических весов нейронов одного слоя, чем двухслойные сети, реализующие то же самое отображение. К сожалению, строгая методика построения данных сетей пока отсутствует.

Отметим, что отечественному читателю приведенные результаты обычно известны в виде так называемой теоремы о полноте.

Теорема о полноте. Любая непрерывная функция на замкнутом ограниченном множестве может быть равномерно приближена функциями, вычисляемыми нейронными сетями, если функция активации нейрона дважды непрерывно дифференцируема.

Таким образом, нейронные сети являются универсальными аппроксимирующими системами.

Очевидно, что процесс функционирования ИНС, т.е. сущность действий, которые она способна выполнять, зависит от величин синаптических связей, поэтому, задавшись определенной структурой ИНС, отвечающей какой-либо задаче, разработчик сети должен найти оптимальные значения всех переменных весовых коэффициентов (некоторые синаптические связи могут быть постоянными).

Этот этап называется обучением ИНС, и от того, насколько качественно он будет выполнен, зависит способность сети решать поставленные перед ней проблемы во время функционирования.

3.4. Обучение нейронных сетей

Обучить нейросеть – значит, сообщить ей, чего мы от нее добиваемся. Этот процесс очень похож на обучение ребенка алфавиту. Показав ребенку изображение буквы «А», мы спрашиваем его: «Какая это буква?» Если ответ неверен, мы сообщаем ребенку тот ответ, который мы хотели бы от него получить: «Это буква А». Ребенок запоминает этот пример вместе с верным ответом, т.е. в его памяти происходят некоторые изменения в нужном направлении. Мы будем повторять процесс предъявления букв снова и снова до тех пор, когда все буквы будут твердо запомнены. Такой процесс называют «обучение с учителем» (рис. 2.7).

При обучении сети мы действуем совершенно аналогично. У нас имеется некоторая база данных, содержащая примеры (набор рукописных изображений букв). Предъявляя изображение буквы «А» на вход сети, мы получаем от нее некоторый ответ, не обязательно верный.

Нам известен и верный (желаемый) ответ – в данном случае нам хотелось бы, чтобы на выходе с меткой «А» уровень сигнала был максимален. Обычно в качестве желаемого выхода в задаче классификации берут набор (1, 0, 0,...), где 1 стоит на выходе с меткой «А», а 0 – на всех остальных выходах. Вычисляя разность между желаемым ответом и реальным ответом сети, мы получаем (для букв русского алфавита) 33 числа – вектор ошибки. Алгоритм обучения – это набор формул, который позволяет по вектору ошибки вычислить требуемые поправки для весов сети. Одну и ту же букву (а также различные изображения одной и той же буквы) мы можем предъявлять сети много раз. В этом смысле обучение скорее напоминает повторение упражнений в спорте – тренировку.

Оказывается, что после многократного предъявления примеров веса сети стабилизируются, причем сеть дает правильные ответы на все (или почти все) примеры из базы данных. В таком случае говорят, что «сеть выучила все примеры», «сеть обучена», или «сеть натренирована». В программных реализациях можно видеть, что в процессе обучения функция ошибки (например, сумма квадратов ошибок по всем выходам) постепенно уменьшается. Когда функция ошибки достигает нуля или приемлемого малого уровня, тренировку останавливают, а полученную сеть считают натренированной и готовой к применению на новых данных.

Важно отметить, что вся информация, которую сеть имеет о задаче, содержится в наборе примеров. Поэтому качество обучения сети напрямую зависит от количества примеров в обучающей выборке, а также от того, насколько полно эти примеры описывают данную задачу. Так, например, бессмысленно использовать сеть для предсказания финансового кризиса, если в обучающей выборке кризисов не представлено. Считается, что для полноценной тренировки требуется хотя бы несколько десятков (а лучше сотен) примеров.

Математически процесс обучения можно описать следующим образом.

В процессе функционирования нейронная сеть формирует выходной сигнал Y в соответствии с входным сигналом X, реализуя некоторую функцию Y = G(X). Если архитектура сети задана, то вид функции G определяется значениями синаптических весов и смещений сети.

Пусть решением некоторой задачи является функция Y = F(X), заданная парами входных-выходных данных (X1, Y1), (X2, Y2), ..., (XN, YN), для которых Yk = F(Xk) (k = 1, 2, ..., N).

Обучение состоит в поиске (синтезе) функции G, близкой к F в смысле некоторой функции ошибки Е (см. рис. 2.7).

Если выбраны множество обучающих примеров – пар (Xk, Yk) (где k = 1, 2, ..., N) и способ вычисления функции ошибки Е, то обучение нейронной сети превращается в задачу многомерной оптимизации, имеющую очень большую размерность, при этом, поскольку функция Е может иметь произвольный вид, обучение в общем случае – многоэкстремальная невыпуклая задача оптимизации.

Для решения этой задачи могут быть использованы следующие (итерационные) алгоритмы:

алгоритмы локальной оптимизации с вычислением частных производных первого порядка;

алгоритмы локальной оптимизации с вычислением частных производных первого и второго порядка;

стохастические алгоритмы оптимизации;

алгоритмы глобальной оптимизации.

К первой группе относятся: градиентный алгоритм (метод скорейшего спуска); методы с одномерной и двумерной оптимизацией целевой функции в направлении антиградиента; метод сопряженных градиентов; методы, учитывающие направление антиградиента на нескольких шагах алгоритма.

Ко второй группе относятся: метод Ньютона, методы оптимизации с разреженными матрицами Гессе, квазиньютоновские методы, метод Гаусса-Ньютона, метод Левенберга-Марквардта и др.

Стохастическими методами являются: поиск в случайном направлении, имитация отжига, метод Монте-Карло (численный метод статистических испытаний).

Задачи глобальной оптимизации решаются с помощью перебора значений переменных, от которых зависит целевая функция (функция ошибки Е).

3.3.1. Алгоритм обратного распространения. Рассмотрим идею одного из самых распространенных алгоритмов обучения – алгоритм обратного распространения ошибки (back propagation). Это итеративный градиентный алгоритм обучения, который используется с целью минимизации среднеквадратичного отклонения текущего выхода и желаемого выхода многослойных нейронных сетей.

Алгоритм обратного распространения используется для обучения многослойных нейронных сетей с последовательными связями вида рис. 2.5. Как отмечено выше, нейроны в таких сетях делятся на группы с общим входным сигналом – слои, при этом на каждый нейрон первого слоя подаются все элементы внешнего входного сигнала, а все выходы нейронов m-го слоя подаются на каждый нейрон слоя (q + 1). Нейроны выполняют взвешенное (с синаптическими весами) суммирование элементов входных сигналов; к данной сумме прибавляется смещение нейрона. Над полученным результатом выполняется активационной функцией затем нелинейное преобразование. Значение функции активации есть выход нейрона.

В многослойных сетях оптимальные выходные значения нейронов всех слоев, кроме последнего, как правило, неизвестны, и трех- или более слойный персептрон уже невозможно обучить, руководствуясь только величинами ошибок на выходах НС. Наиболее приемлемым вариантом обучения в таких условиях оказался градиентный метод поиска минимума функции ошибки с рассмотрением сигналов ошибки от выходов НС к ее входам, в направлении, обратном прямому распространению сигналов в обычном режиме работы. Этот алгоритм обучения НС получил название процедуры обратного распространения.

В данном алгоритме функция ошибки представляет собой сумму квадратов рассогласования (ошибки) желаемого выхода сети и реального. При вычислении элементов вектора-градиента использован своеобразный вид производных функций активации сигмоидального типа. Алгоритм действует циклически (итеративно), и его циклы принято называть эпохами. На каждой эпохе на вход сети поочередно подаются все обучающие наблюдения, выходные значения сети сравниваются с целевыми значениями и вычисляется ошибка. Значение ошибки, а также градиента поверхности ошибок используется для корректировки весов, после чего все действия повторяются. Начальная конфигурация сети выбирается случайным образом, и процесс обучения прекращается, либо когда пройдено определенное количество эпох, либо когда ошибка достигнет некоторого определенного уровня малости, либо когда ошибка перестанет уменьшаться (пользователь может сам выбрать нужное условие остановки).

Приведем словесное описание алгоритма.

Шаг 1. Весам сети присваиваются небольшие начальные значения.

Шаг 2. Выбирается очередная обучающая пара (X, Y) из обучающего множества; вектор X подается на вход сети.

Шаг 3. Вычисляется выход сети.

Шаг 4. Вычисляется разность между требуемым (целевым, Y) и реальным (вычисленным) выходом сети.

Шаг 5. Веса сети корректируются так, чтобы минимизировать ошибку.

Шаг 6. Шаги со 2-го по 5-й повторяются для каждой пары обучающего множества до тех пор, пока ошибка на всем множестве не достигнет приемлемой величины.

Шаги 2 и 3 подобны тем, которые выполняются в уже обученной сети.

Вычисления в сети выполняются послойно. На шаге 3 каждый из выходов сети вычитается из соответствующей компоненты целевого вектора с целью получения ошибки. Эта ошибка используется на шаге 5 для коррекции весов сети.

Шаги 2 и 3 можно рассматривать как «проход вперед», так как сигнал распространяется по сети от входа к выходу. Шаги 4 и 5 составляют «обратный проход», поскольку здесь вычисляемый сигнал ошибки распространяется обратно по сети и используется для подстройки весов.

Математическое представление алгоритма рассмотрим вначале на примере простейшей нейронной сети, содержащей только один нейрон (условно показанный кружком, см. рис. 2.8).

Будем полагать, что выход (output) сети о = f (net) определяется функцией активации сигмоидного (см. табл. 2.1) типа

,

где хт = (x1, ..., хп) – вектор входных сигналов, wT = (w1, ... ..., wn) – вектор весов сети, «Т» – символ транспонирования.

Предположим, далее, что для обучения сети используется выборка

x1 = (x11, x12, …, x1n)T,  y1,

x2 = (x21, x22, …, x2n)T,  y2,

………………………………………

xN = (xN1, xN2, …, xNn)T,  yN,

где уk – значения желаемого (целевого) выхода.

В качестве функции ошибки для k-го образца (k-го элемента обучающей выборки) примем величину, пропорциональную квадрату разности желаемого выхода и выхода сети:

.

Соответственно, суммарная функция ошибки по всем элементам выборки:

.

Очевидно, как Еk, так и Е являются функциями вектора весов сети w. Задача обучения сети сводится в данном случае к подбору такого вектора w, при котором достигается минимум Е. Данную задачу (оптимизации) будем решать градиентным методом, используя соотношение

w := w - ηE'k(w),

где «:=« – оператор присвоения, E'k(w) – обозначение вектора-градиента, η – некоторая константа.

Представляя данный вектор в развернутом виде и учитывая приведенное выше (в § 2.2) выражение для производной сигмоидной функции, получим:

.

Это дает возможность записать алгоритм коррекции (подстройки) вектора весовых коэффициентов сети в форме

w := w + η (yk - ok) ok (1 - ok) xk = w+ η δk xk,

где

δk = (yk - ok) ok (1 - ok).

Полученные математические выражения полностью определяют алгоритм обучения рассматриваемой НС, который может быть представлен теперь в следующем виде.

Задаются некоторые η (0 < η < 1), Emax и некоторые малые случайные веса wi сети.

Задаются k = 1 и Е = 0.

Вводится очередная обучающая пара (xk, уk). Производятся обозначения

х := xk, у := уk

и вычисляется величина выхода сети:

.

4. Обновляются (корректируются) веса:

w := w + η (y - o) o (1 - o) x .

5. Корректируется (наращивается) значение функции ошибки:

.

Если k < N, тогда k := k + 1 и переход к шагу 3, в противоположном случае – переход на шаг 7.

Завершение цикла обучения. Если Е < Еmах, то окончание всей процедуры обучения. Если Е Еmах, тогда начинается новый цикл обучения переходом к шагу 2.

Рассмотрим теперь более общий случай, полагая, что двухслойная НС содержит несколько (L) скрытых нейронов и один выходной (рис. 2.9).

В данном случае функция ошибки зависит от векторов весов скрытого слоя и вектора весов, связанных с выходным нейроном.

Выход сети описывается выражением

,

где W – вектор весов выходного нейрона, ok – вектор выходов нейронов скрытого слоя с элементами

,

wi- обозначает вектор весов, связанных с i-м скрытым нейроном, i = 1, 2, ..., L.

Правило корректировки весов в рассматриваемой НС также основано на минимизации квадратичной функции ошибки градиентным методом на основе выражений:

,

,

где η = const – коэффициент скорости обучения (0 < η < 1), i=1, 2, ..., L.

Используя правило дифференцирования сложной функции и выражение для производной сигмоидной функции активации, получим:

,

откуда следует

W := W + η (ykOk) Ok (1 – Ok) ok = W + η δk ok,

или в скалярной форме

Wi := Wi + η δk oki, i = 1, 2, …, L,

где

δk = (yk – Ok) Ok (1 – Ok).

Поступая аналогично, найдем

,

откуда получаем

wi := wi + η δk Wi oki (1 - oki) xk ,

или (в скалярной форме)

wij := wij + η δk Wi oki (1 - oki) xkj , i = 1, 2, …, L, j = 1, 2, …, n.

Алгоритм обучения может быть теперь представлен в виде следующих шагов.

Задаются некоторые (0 < η < 1), Emax и некоторые малые случайные веса wi сети.

Задаются k = 1 и Е = 0.

Вводится очередная обучающая пара (xk, yk). Производятся обозначения

х := xk, у := уk

и вычисляется величина выхода сети:

,

где W – вектор весов выходного нейрона, оk – вектор выходов нейронов скрытого слоя с элементами

,

wi – обозначает вектор весов, связанных с i-м скрытым нейроном, i= 1, 2, ..., L.

4. Производится корректировка весов выходного нейрона:

W := W + η δ o,

где δ = (yO) O (1 – O).

5. Корректируются веса нейронов скрытого слоя:

wi := wi + η δ Wi oi (1 - oi) x , i= 1, 2, ..., L.

6. Корректируется (наращивается) значение функции ошибки:

.

Если k < N, тогда k := k + 1 и переход к шагу 3, в противоположном случае переход на шаг 8.

7. Завершение цикла обучения. Если Е < Еmах, то окончание всей процедуры обучения. Если Е Еmах, тогда начинается новый цикл обучения переходом к шагу 2.

Рассмотренная процедура может быть легко обобщена на случай сети с произвольным количеством слоев и нейронов в каждом слое. Обратим внимание, что в данной процедуре сначала происходит коррекция весов для выходного нейрона, а затем – для нейронов скрытого слоя, т.е. от конца сети к ее началу. Отсюда и название – обратное распространение ошибки. Ввиду использования для обозначений греческой буквы δ, эту процедуру обучения называют еще иногда обобщенным дельта-правилом.

Дадим изложенному геометрическую интерпретацию.

В алгоритме обратного распространения вычисляется вектор градиента поверхности ошибок. Этот вектор указывает направление кратчайшего спуска по поверхности из данной точки, поэтому, если мы «немного» продвинемся по нему, ошибка уменьшится. Последовательность таких шагов (замедляющаяся по мере приближения к дну) в конце концов приведет к минимуму того или иного типа. Определенную трудность здесь представляет вопрос о том, какую нужно брать длину шагов (что определяется величиной коэффициента скорости обучения η).

При большой длине шага сходимость будет более быстрой, но имеется опасность перепрыгнуть через решение или (если поверхность ошибок имеет особо вычурную форму) уйти в неправильном направлении. Классическим примером такого явления при обучении нейронной сети является ситуация, когда алгоритм очень медленно продвигается по узкому оврагу с крутыми склонами, прыгая с одной его стороны на другую. Напротив, при маленьком шаге, вероятно, будет схвачено верное направление, однако при этом потребуется очень много итераций. На практике величина шага берется пропорциональной крутизне склона (так что алгоритм замедляет ход вблизи минимума) с некоторой константой (η), которая, как отмечалось, называется коэффициентом скорости обучения. Правильный выбор скорости обучения зависит от конкретной задачи и обычно осуществляется опытным путем; эта константа может также зависеть от времени, уменьшаясь по мере продвижения алгоритма.

Обычно этот алгоритм видоизменяется таким образом, чтобы включать слагаемое импульса (или инерции). Этот член способствует продвижению в фиксированном направлении, поэтому если было сделано несколько шагов в одном и том же направлении, то алгоритм «увеличивает скорость», что (иногда) позволяет избежать локального минимума, а также быстрее проходить плоские участки.

Таким образом, алгоритм действует итеративно, и его шаги принято называть эпохами. На каждой эпохе на вход сети поочередно подаются все обучающие наблюдения, выходные значения сети сравниваются с целевыми значениями и вычисляется ошибка. Значение ошибки, а также градиента поверхности ошибок используется для корректировки весов, после чего все действия повторяются. Начальная конфигурация сети выбирается случайным образом, и процесс обучения прекращается, либо когда пройдено определенное количество эпох, либо когда ошибка достигнет некоторого определенного уровня малости, либо когда ошибка перестанет уменьшаться (пользователь может сам выбрать нужное условие остановки).

Классический метод обратного распространения относится к алгоритмам с линейной сходимостью и известными недостатками его являются: невысокая скорость сходимости (большое число требуемых итераций для достижения минимума функции ошибки), возможность сходиться не к глобальному, а к локальным решениям (локальным минимумам отмеченной функции), возможность паралича сети (при котором большинство нейронов функционирует при очень больших значениях аргумента функций активации, т.е. на ее пологом участке; поскольку ошибка пропорциональна производной, которая на данных участках мала, то процесс обучения практически замирает).

Для устранения этих недостатков были предложены многочисленные модификации алгоритма обратного распространения, которые связаны с использованием различных функций ошибки, различных процедур определения направления и величины шага и т. п.

Переобучение и обобщение. Одна из наиболее серьезных трудностей изложенного подхода заключается в том, что таким образом мы минимизируем не ту ошибку, которую на самом деле нужно минимизировать, – ошибку, которую можно ожидать от сети, когда ей будут подаваться совершенно новые наблюдения.

Иначе говоря, мы хотели бы, чтобы нейронная сеть обладала способностью обобщать результат на новые наблюдения. В действительности сеть обучается минимизировать ошибку на обучающем множестве, и в отсутствие идеального и бесконечно большого обучающего множества это совсем не то же самое, что минимизировать «настоящую» ошибку на поверхности ошибок в заранее неизвестной модели явления.

Сильнее всего это различие проявляется в проблеме переобучения, или слишком близкой подгонки. Это явление проще будет продемонстрировать не для нейронной сети, а на примере аппроксимации посредством полиномов, – при этом суть явления абсолютно та же.

Полином (или многочлен) – это выражение, содержащее только константы и целые степени независимой переменной. Примеры:

y = 2 x + 3, y = 3 x2 +4 x + 1.

Графики полиномов могут иметь различную форму, причем чем выше степень многочлена (и, тем самым, чем больше членов в него входит), тем более сложной может быть эта форма. Если у нас есть некоторые данные, мы можем поставить цель подогнать к ним полиномиальную кривую (модель) и получить таким образом объяснение для имеющейся зависимости. Наши данные могут быть зашумлены, поэтому нельзя считать, что самая лучшая модель задается кривой, которая в точности проходит через все имеющиеся точки. Полином низкого порядка может быть недостаточно гибким средством для аппроксимации данных, в то время как полином высокого порядка может оказаться чересчур гибким, и будет точно следовать данным, принимая при этом замысловатую форму, не имеющую никакого отношения к форме настоящей зависимости.

Нейронная сеть сталкивается с точно такой же трудностью. Сети с большим числом весов моделируют более сложные функции и, следовательно, склонны к переобучению. Сеть же с небольшим числом весов может оказаться недостаточно гибкой, чтобы смоделировать имеющуюся зависимость.

Как же выбрать «правильную» степень сложности для сети? Почти всегда более сложная сеть дает меньшую ошибку, но это может свидетельствовать не о хорошем качестве модели, а о переобучении.

Ответ состоит в том, чтобы использовать механизм контрольной кросс-проверки, при котором часть обучающих наблюдений резервируется и в обучении по алгоритму обратного распространения не используется. Вместо этого, по мере работы алгоритма, она используется для независимого контроля результата. В самом начале работы ошибки сети на обучающем и контрольном множествах будут одинаковыми (если они существенно отличаются, то, вероятно, разбиение всех наблюдений на два множества было неоднородно). По мере того как сеть обучается, ошибка обучения, естественно, убывает, и, пока обучение уменьшает действительную функцию ошибок, ошибка на контрольном множестве также будет убывать. Если же контрольная ошибка перестала убывать или даже стала расти, это указывает на то, что сеть начала слишком близко аппроксимировать данные и обучение следует остановить. Это явление чересчур точной аппроксимации в процессе обучения и называется переобучением. Если такое случилось, то обычно советуют уменьшить число скрытых элементов и/или слоев, ибо сеть является слишком мощной для данной задачи. Если же сеть, наоборот, была взята недостаточно богатой для того, чтобы моделировать имеющуюся зависимость, то переобучения, скорее всего, не произойдет, и обе ошибки – обучения и проверки – не достигнут достаточного уровня малости.

Описанные проблемы с локальными минимумами и выбором размера сети приводят к тому, что при практической работе с нейронными сетями, как правило, приходится экспериментировать с большим числом различных сетей, порой обучая каждую из них по несколько раз (чтобы не быть введенным в заблуждение локальными минимумами) и сравнивая полученные результаты. Главным показателем качества результата является здесь контрольная ошибка. При этом в соответствии с общенаучным принципом, согласно которому при прочих равных следует предпочесть более простую модель, из двух сетей с приблизительно равными ошибками контроля имеет смысл выбрать ту, которая меньше.

Классический метод обратного распространения относится к алгоритмам с линейной сходимостью. Для увеличения скорости сходимости необходимо использовать матрицы вторых производных функции ошибки.

Были предложены многочисленные модификации алгоритма обратного распространения, которые связаны с использованием различных функций ошибки, различных процедур определения направления и величины шага.

1. Функции ошибки:

интегральные функций ошибки по всей совокупности обучающих примеров;

функции ошибки целых и дробных степеней.

2. Процедуры определения величины шага на каждой итерации:

дихотомия;

инерционные соотношения;

отжиг.

3. Процедуры определения направления шага:

с использованием матрицы производных второго порядка (метод Ньютона и др.);

с использованием направлений на нескольких шагах (партан метод и др.).

3.3.2. Обучение без учителя. Рассмотренный алгоритм обучения нейронной сети с помощью процедуры обратного распространения подразумевает наличие некоего внешнего звена, предоставляющего сети кроме входных также и целевые выходные образы.

Алгоритмы, пользующиеся подобной концепцией, называются алгоритмами обучения с учителем. Для их успешного функционирования необходимо наличие экспертов, создающих на предварительном этапе для каждого входного образа эталонный выходной. Так как создание искусственного интеллекта движется по пути копирования природных прообразов, ученые не прекращают спор на тему, можно ли считать алгоритмы обучения с учителем натуральными или же они полностью искусственны. Например, обучение человеческого мозга, на первый взгляд, происходит без учителя: на зрительные, слуховые, тактильные и прочие рецепторы поступает информация извне, и внутри нервной системы происходит некая самоорганизация. Однако нельзя отрицать и того, что в жизни человека не мало учителей – и в буквальном, и в переносном смысле, – которые координируют внешние воздействия. Вместе с тем, чем бы ни закончился спор приверженцев этих двух концепций обучения – с учителем и без учителя, они обе имеют право на существование.

Главная черта, делающая обучение без учителя привлекательным, – это его «самостоятельность». Процесс обучения, как и в случае обучения с учителем, заключается в подстраивании весов сети. Некоторые алгоритмы, правда, изменяют и структуру сети, т.е. количество нейронов и их взаимосвязи, но такие преобразования правильнее назвать более широким термином – самоорганизацией, и здесь они рассматриваться не будут. Очевидно, что подстройка весов может проводиться только на основании информации, доступной в нейроне, т. е. его состояния и уже имеющихся весовых коэффициентов. Исходя из этого соображения и, что более важно, по аналогии с известными принципами самоорганизации нервных клеток, построены алгоритмы обучения Хебба.

Сигнальный метод обучения Хебба заключается в изменении весов по следующему правилу:

wij := wij + η oj(q-1) oi(q),

где oj(q-1) – выходное значение jo нейрона слоя (q-1), oi(q) выходное значение i-го нейрона слоя q; wij – весовой коэффициент синапса, соединяющего эти нейроны, η – коэффициент скорости обучения. Здесь и далее, для общности, под q подразумевается произвольный слой сети. При обучении по данному методу усиливаются связи между возбужденными нейронами.

Полный алгоритм обучения с применением вышеприведенной формулы будет выглядеть так:

1. На стадии инициализации всем весовым коэффициентам присваиваются небольшие случайные значения.

На входы сети подается входной образ, и сигналы возбуждения распространяются по всем слоям согласно принципам классических сетей прямого распространения (feedforward), т.е. для каждого нейрона рассчитывается взвешенная сумма его входов, к которой затем применяется активационная (передаточная) функция нейрона, в результате чего получается его выходное значение.

На основании полученных выходных значений нейронов по приведенной формуле производится изменение весовых коэффициентов.

Цикл с шага 2, пока выходные значения сети не застабилизируются с заданной точностью. Применение этого нового способа определения завершения обучения, отличного от использовавшегося для сети обратного распространения, обусловлено тем, что подстраиваемые значения синапсов фактически не ограничены.

На втором шаге цикла попеременно предъявляются все образы из входного набора.

Следует отметить, что вид откликов на каждый класс входных образов неизвестен заранее и будет представлять собой произвольное сочетание состояний нейронов выходного слоя, обусловленное случайным распределением весов на стадии инициализации. Вместе с тем, сеть способна обобщать схожие образы, относя их к одному классу. Тестирование обученной сети позволяет определить топологию классов в выходном слое.

Для приведения откликов обученной сети к удобному представлению можно дополнить сеть одним слоем, который, например, по алгоритму обучения однослойного персептрона необходимо заставить отображать выходные реакции сети в требуемые образы.

Другой алгоритм обучения без учителя – алгоритм Кохонена (Kohonen) – предусматривает самообучение по правилу «победитель забирает все». Структура сети, реализующей данное правило, представлена на рис. 2.10.

Критерий подстройки весов сети (все векторы весов должны быть нормализованы, т.е. иметь единичную длину: ||wi|| = 1, i = 1, 2, ..., m) выглядит следующим образом:

,

где индекс r обозначает нейрон-победитель, соответствующий вектору весов wr, который ближе всех расположен к (текущему) входному вектору.

Поскольку (с учетом того, что wiT wi = ||wi||2 = 1)

||х - wi||2 = (х - wi) T (х - wi) = хTх - 2 wiTх + wiTwi = хTх - 2 wiTх + 1,

процедура нахождения wr эквивалентна решению оптимизационной задачи

,

чему можно дать следующую геометрическую интерпретацию (см. рис. 2.11).

Так как скалярное произведение с учетом ||wi|| = 1 представляет собой просто проекцию вектора х на направление вектора wi, то нейрон-победитель определяется по тому вектору весов, чье направление ближе всего к направлению х (на рис. 2.11 таким является вектор w2).

После выявления нейрона-победителя его выход устанавливается равным единице (у остальных нейронов устанавливаются нулевые выходы), а веса корректируются так, чтобы уменьшить квадрат величины рассогласования ||х – wr||2. При использовании градиентного подхода это приводит к следующей математической формулировке:

,

где, как и раньше, η – константа, определяющая скорость обучения.

Найдем производную в правой части последнего выражения:

.

При этом wr := wr + η (x - wr).

Заметим, что коррекции весов у других нейронов не производится.

Алгоритм обучения (без учителя) Кохонена может быть теперь описан следующим образом.

Задаются случайные нормализованные по длине векторы wi.

Начало цикла обучения; ввод очередного вектора входов х.

Определение нейрона-победителя, корректировка вектора его весов и задание единичного выхода:

wr := wr + η (x - wr), or := 1.

4. Нормализация найденного вектора:

.

5. Задание значений для остальных нейронов:

wi := wi, oi := 0,  ir.

6. Проверка выполнения правила останова (в качестве такого правила можно принять, например, стабилизацию векторов весов на каких-то значениях); если оно не выполнено – продолжение цикла обучения (переходом к шагу 2), в противоположном случае – переход к шагу 7.

7. Конец процедуры обучения.

Заметим, что выражение для коррекции вектора весовых коэффициентов нейрона-победителя может быть представлено в форме

wr := wr + η (x - wr) = (1 – η) wr + η x,

т.е. новое (скорректированное) значение данного вектора является взвешенной суммой старого значения (до коррекции) и предъявленного вектора входов, чему соответствует геометрическая иллюстрация рис. 2.12.

Нетрудно показать, что итоговым результатом подобных коррекций (в условиях рассматриваемого примера для двумерного случая) являются векторы весов, показывающие на центры кластеров (центры группирования) входных образов (рис. 2.13).

Иначе говоря, алгоритм обучения Кохонена обеспечивает решение задачи автоматической классификации, т.е. отнесения предъявленного вектора входов к одному из классов (на рис. 2.13 таких классов 3). Правда, такая классификация возможна только в случае, когда кластеры являются линейно разделимыми (гиперплоскостями) относительно начала координат в пространстве входов НС.

Отметим, что число нейронов НС для успешного решения указанной задачи должно быть не меньше, чем число кластеров; поскольку точное число кластеров может быть заранее неизвестно, количество нейронов задают с определенным запасом.

«Лишние» нейроны, у которых в процессе обучения сети веса изменяются хаотически по завершении данного процесса могут быть удалены.

3.4. Применение нейросети

После того как сеть обучена, мы можем применять ее для решения различных задач (рис. 2.14).

Важнейшая особенность человеческого мозга состоит в том, что, однажды обучившись определенному процессу, он может верно

действовать и в тех ситуациях, в которых он не бывал в процессе обучения. Например, мы можем читать почти любой почерк, даже если видим его первый раз в жизни. Так же и нейросеть, грамотным образом обученная, может с большой вероятностью правильно реагировать на новые, не предъявленные ей ранее данные. Например, мы можем нарисовать букву «А» другим почерком, а затем предложить нашей сети классифицировать новое изображение.

Веса обученной сети хранят достаточно много информации о сходстве и различиях букв, поэтому можно рассчитывать на правильный ответ и для нового варианта изображения.

Области применения нейросетей: классификация. Отметим, что задачи классификации (типа распознавания букв) очень плохо алгоритмизуются. Если в случае распознавания букв верный ответ очевиден для нас заранее, то в более сложных практических задачах обученная нейросеть выступает как эксперт, обладающий большим опытом и способный дать ответ на трудный вопрос.

Примером такой задачи служит медицинская диагностика, где сеть может учитывать большое количество числовых параметров (энцефалограмма, давление, вес и т.д.). Конечно, «мнение» сети в этом случае нельзя считать окончательным. Классификация предприятий по степени их перспективности – это уже привычный способ использования нейросетей в практике западных компаний (деление компаний на перспективные и убыточные). При этом сеть также использует множество экономических показателей, сложным образом связанных между собой.

Нейросетевой подход особенно эффективен в задачах экспертной оценки по той причине, что он сочетает в себе способность компьютера к обработке чисел и способность мозга к обобщению и распознаванию. Говорят, что у хорошего врача способность к распознаванию в своей области столь велика, что он может провести приблизительную диагностику уже по внешнему виду пациента. Можно согласиться также, что опытный трейдер чувствует направление движения рынка по виду графика. Однако в первом случае все факторы наглядны, т.е. характеристики пациента мгновенно воспринимаются мозгом как «бледное лицо», «блеск в глазах» и т.д. Во втором же случае учитывается только один фактор, показанный на графике, – курс за определенный период времени. Нейросеть позволяет обрабатывать огромное количество факторов (до нескольких тысяч), независимо от их наглядности, – это универсальный «хороший врач», который может поставить свой диагноз в любой области.

Кластеризация и поиск зависимостей. Помимо задач классификации, нейросети широко используются для поиска зависимостей в данных и кластеризации.

Например, нейросеть на основе методики МГУА (метод группового учета аргументов) позволяет на основе обучающей выборки построить зависимость одного параметра от других в виде полинома. Такая сеть может не только мгновенно выучить таблицу умножения, но и найти сложные скрытые зависимости в данных (например, финансовых), которые не обнаруживаются стандартными статистическими методами.

Кластеризация – это разбиение набора примеров на несколько компактных областей (кластеров), причем число кластеров заранее неизвестно. Кластеризация позволяет представить неоднородные данные в более наглядном виде и использовать далее для исследования каждого кластера различные методы. Например, таким образом можно быстро выявить фальсифицированные страховые случаи или недобросовестные предприятия.

Прогнозирование. Задачи прогнозирования особенно важны для практики, в частности, для финансовых приложений, поэтому поясним способы применения нейросетей в этой области более подробно.

Рассмотрим практическую задачу, ответ в которой неочевиден, – задачу прогнозирования курса акций на 1 день вперед.

Пусть у нас имеется база данных, содержащая значения курса за последние 300 дней. Простейший вариант в данном случае – попытаться построить прогноз завтрашней цены на основе курсов за последние несколько дней. Понятно, что прогнозирующая сеть должна иметь всего один выход и столько входов, сколько предыдущих значений мы хотим использовать для прогноза – например, 4 последних значения. Составить обучающий пример очень просто: входными значениями будут курсы за 4 последовательных дня, а желаемым выходом – известный нам курс в следующий день за этими четырьмя, т.е. каждая строка таблицы с обучающей последовательностью (выборкой) представляет собой обучающий пример, где первые 4 числа – входные значения сети, а пятое число – желаемое значение выхода.

Заметим, что объем обучающей выборки зависит от выбранного количества входов. Если сделать 299 входов, то такая сеть потенциально могла бы строить лучший прогноз, чем сеть с 4 входами, однако в этом случае мы имеем дело с огромным массивом данных, что делает обучение и использование сети практически невозможным. При выборе числа входов следует учитывать это, выбирая разумный компромисс между глубиной предсказания (число входов) и качеством обучения (объем тренировочного набора).

Вообще говоря, в зависимости от типа решаемой задачи, целесообразно применять нейронную сеть наиболее подходящей для такой задачи структуры. Рассмотрим некоторые, наиболее употребительные виды НС.

3.4.1. Персептроны. В качестве научного предмета искусственные нейронные сети впервые заявили о себе в 40-е годы. Стремясь воспроизвести функции человеческого мозга, исследователи создали простые аппаратные (а позже программные) модели биологического нейрона и системы его соединений. Когда нейрофизиологи достигли более глубокого понимания нервной системы человека, эти ранние попытки стали восприниматься как весьма грубые аппроксимации. Тем не менее на этом пути были достигнуты впечатляющие результаты, стимулировавшие дальнейшие исследования, приведшие к созданию более изощренных сетей.

Первое систематическое изучение искусственных нейронных сетей было предпринято Маккалохом и Питтсом в 1943 г. Позднее они исследовали сетевые парадигмы для распознавания изображений, подвергаемых сдвигам и поворотам, используя при этом простую нейронную модель, показанную на рис. 2.15. Элемент Σ умножает каждый вход xi на вес wi и суммирует взвешенные входы.

Если эта сумма больше заданного порогового значения, выход равен единице, в противном случае – нулю. Эти системы (и множество им подобных) получили название персептронов. Они состоят из одного слоя искусственных нейронов, соединенных с помощью весовых коэффициентов с множеством входов (см. рис. 2.16), хотя в принципе описываются и более сложные системы.

В 60-е годы персептроны вызвали большой интерес и оптимизм. Розенблатт доказал замечательные теоремы об обучении персептронов, приводимые ниже. Уидроу дал ряд убедительных демонстраций систем персептронного типа, и исследователи во всем мире стремились изучить возможности этих систем. Первоначальная эйфория сменилась разочарованием, когда оказалось, что персептроны не способны обучиться решению ряда простых задач. Минский строго проанализировал эту проблему и показал, что имеются жесткие ограничения на то, что могут выполнять однослойные персептроны, и, следовательно, на то, чему они могут обучаться. Так как в то время методы обучения многослойных сетей не были известны, исследователи перешли в более многообещающие области, и исследования в области нейронных сетей пришли в упадок.

Недавнее открытие методов обучения многослойных сетей в большей степени, чем какой-либо иной фактор, повлияло на возрождение интереса и исследовательских усилий.

Работа Минского возможно и охладила пыл энтузиастов персептрона, но обеспечила время для необходимой консолидации и развития лежащей в основе теории. Важно отметить, что анализ Минского не был опровергнут. Он остается важным исследованием и должен изучаться, чтобы ошибки 60-х годов не повторились.

Несмотря на свои ограничения, персептроны широко изучались (хотя не слишком широко использовались). Теория персептронов является основой для многих других типов искусственных нейронных сетей, в силу чего они являются логической исходной точкой для изучения искусственных нейронных сетей.

Рассмотрим в качестве примера трехнейронный персептрон (рис. 2.16), нейроны которого имеют активационную функцию в виде единичного скачка.

На п входов поступают входные сигналы, проходящие по синапсам, на три нейрона, образующие единственный слой этой сети и выдающие три выходных сигнала:

, j = 1, …, 3.

Очевидно, что все весовые коэффициенты синапсов одного слоя нейронов можно свести в матрицу W, в которой каждый элемент wij задает величину i-й синаптической связи jo нейрона. Таким образом, процесс, происходящий в нейронной сети, может быть записан в матричной форме:

Y = f (XY),

где X и Y – соответственно входной и выходной сигнальные векторы (здесь и далее под вектором понимается вектор-строка), f(S) – активационная функция, применяемая поэлементно к компонентам вектора S.

На рис. 2.17 представлен двухслойный персептрон, полученный из персептрона с рис. 2.16 путем добавления второго слоя, состоящего из двух нейронов.

Здесь уместно отметить важную роль нелинейности активационной функции, так как, если бы она не обладала данным свойством

или не входила в алгоритм работы каждого нейрона, результат функционирования любой Q-слойной нейронной сети с весовыми матрицами W(q) для каждого слоя q = 1, ..., Q сводился бы к перемножению входного вектора сигналов X на матрицу:

W(Σ) = W(1)W(q)W(Q).

Фактически такая Q-слойная нейронная сеть эквивалентна сети с одним скрытым слоем и с весовой матрицей единственного слоя W(Σ):

Y = XY(Σ).

Работа персептрона сводится к классификации (обобщению) входных сигналов, принадлежащих n-мерному гиперпространству, по некоторому числу классов. С математической точки зрения это происходит путем разбиения гиперпространства гиперплоскостями. Для случая однослойного персептрона

, j = 1, 2, …, m.

Каждая полученная область является областью определения отдельного класса. Число таких классов для персептрона не превышает 2n, где n – число его входов. Однако не все из классов могут быть разделимы данной нейронной сетью. Например, однослойный персептрон, состоящий из одного нейрона с двумя входами, не может реализовать логическую функцию ИСКЛЮЧАЮЩЕЕ ИЛИ, т.е. не способен разделить плоскость (двумерное гиперпространство) на две полуплоскости так, чтобы осуществить классификацию входных сигналов по классам А и В (см. табл. 2.3).

Уравнение сети для этого случая

x1w1 + x2w2 = θ

является уравнением прямой (одномерной гиперплоскости), которая ни при каких условиях не может разделить плоскость так, чтобы точки из множества входных сигналов, принадлежащие разным классам, оказались по разные стороны от прямой (рис. 2.18). Невозможность реализации однослойным персептроном этой функции получила название проблемы ИСКЛЮЧАЮЩЕГО ИЛИ.

Отметим, что функции, которые не реализуются однослойным персептроном, называются линейно неразделимыми. Решение задач, подпадающих под это ограничение, заключается в применении двух- и более слойных сетей или сетей с нелинейными синапсами, однако и тогда существует вероятность, что корректное разделение некоторых входных сигналов на классы невозможно.

Обучение персептрона сводится к формированию весов связей между первым и вторым (см. рис. 2.17) слоями в соответствии со следующим алгоритмом.

Шаг 1. Проинициализировать элементы весовой матрицы (обычно небольшими случайными значениями).

Шаг 2. Подать на входы один из входных векторов, которые сеть должна научиться различать, и вычислить ее выход.

Шаг 3. Если выход правильный, перейти на шаг 4.

Иначе – вычислить разницу между идеальным d и полученным Y значениями выхода:

δ = dY.

Модифицировать веса в соответствии с формулой

wij (t + 1) = wij (t) + ηδxi,

где t и (t + 1) – номера соответственно текущей и следующей итераций; η – коэффициент скорости обучения, 0 < η < 1; i – номер входа; j – номер нейрона в слое.

Очевидно, что если d > Y, то весовые коэффициенты будут увеличены и, тем самым, уменьшат ошибку. В противном случае они будут уменьшены, и Y тоже уменьшится, приближаясь к d.

Шаг 4. Цикл с шага 2, пока сеть не перестанет ошибаться.

На втором шаге на разных итерациях поочередно в случайном порядке предъявляются все возможные входные векторы. К сожалению, нельзя заранее определить число итераций, которые потребуется выполнить, а в некоторых случаях и гарантировать полный успех.

Сходимость рассмотренной процедуры устанавливается теоремами, утверждающими, что для любой классификации обучающей последовательности можно подобрать такой набор (из бесконечного набора) элементарных нейронов, в котором будет осуществлено разделение обучающей последовательности при помощи линейного решающего правила, и что, если относительно задуманной классификации можно найти набор элементов, в котором существует решение, то в рамках этого набора оно будет достигнуто в конечный промежуток времени.

3.4.2. Нейронные сети встречного распространения. Объединение разнотипных нейронных структур в единой архитектуре зачастую приводит к свойствам, которых нет у них по отдельности. Причем именно каскадные соединения нейронных структур, специализирующихся на решении различных задач, позволяют решить проблему комплексно.

Нейронные сети встречного распространения, состоящие из входного слоя нейронов и так называемых слоев нейронов Кохо-нена и Гроссберга, по своим характеристикам существенно превосходят возможности сетей с одним скрытым слоем нейронов. Так, время их обучения задачам распознавания и кластеризации более, чем в сто раз меньше времени обучения аналогичным задачам сетей с обратным распространением. Это может быть полезно в тех приложениях, где долгая обучающая процедура невозможна.

Одними из определяющих характеристик сети встречного распространения являются ее хорошие способности к обобщению, позволяющие получать правильный выход даже при неполным или зашумленном входном векторе. Это позволяет эффективно использовать данную сеть для распознавания и восстановления образов, а также для усиления сигналов.

В процессе обучения сети встречного распространения входные векторы ассоциируются с соответствующими выходными векторами. Эти векторы могут быть двоичными или непрерывными. После обучения сеть формирует выходные сигналы, соответствующие входным сигналам. Обобщающая способность сети дает возможность получать правильный выход, когда входной вектор неполон или искажен.

Сеть встречного распространения имеет два слоя с последовательными связями. Первый слой – слой Кохонена, второй – слой Гроссберга. Каждый элемент входного сигнала подается на все нейроны слоя Кохонена. Каждый нейрон слоя Кохонена соединен со всеми нейронами слоя Гроссберга. Отличие сети встречного распространения от других многослойных сетей с последовательными связями состоит в операциях, выполняемых нейронами Кохонена и Гроссберга.

В режиме функционирования сети предъявляется входной сигнал X и формируется выходной сигнал Y. В режиме обучения на вход сети подается входной сигнал и веса корректируются, чтобы сеть выдавала требуемый выходной сигнал.

Функционирование сети

Слой Кохонена. В своей простейшей форме слой Кохонена функционирует по правилу «победитель получает все». Для данного входного вектора один и только один нейрон Кохонена выдает логическую единицу, все остальные выдают ноль. Выход каждого нейрона Кохонена является просто суммой взвешенных элементов входных сигналов:

,

где Sj – выход jo нейрона Кохонена, Wj = (w1j, w2j,..., wnj) – вектор весов jo нейрона Кохонена, X = (x1, х2, ..., хп) – вектор входного сигнала, или в векторно-матричной форме:

s = xw,

где S – вектор выходов слоя Кохонена.

Нейрон Кохонена с максимальным значением sj является «победителем». Его выход равен единице, у остальных он равен нулю.

Слой Гроссберга. Слой Гроссберга функционирует в сходной манере. Его выход является взвешенной суммой выходов слоя Кохонена (т.е. он является слоем нейронов с линейными актива-ционными функциями).

Если слой Кохонена функционирует таким образом, что лишь один выход равен единице, а остальные равны нулю, то каждый нейрон слоя Гроссберга выдает величину веса, который связывает этот нейрон с единственным нейроном Кохонена, чей выход отличен от нуля.

Предварительная обработка входных сигналов. Рассматриваемая НС требует предварительной обработки входных векторов путем их нормализации. Такая нормализация выполняется путем деления каждой компоненты входного вектора на длину вектора (квадратный корень из суммы квадратов компонент вектора). Это превращает входной вектор в единичный вектор с тем же направлением, т. е. в вектор единичной длины в n-мерном пространстве.

Обучение слоя Кохонена. Слой Кохонена классифицирует входные векторы в группы схожих. Это достигается с помощью такой подстройки весов слоя Кохонена, что близкие входные векторы активируют один и тот же нейрон данного слоя (затем задачей слоя Гроссберга является получение требуемых выходов).

Слой Кохонена обучается без учителя (самообучается). В результате обучения слой приобретает способность разделять несхожие входные векторы. Какой именно нейрон будет активироваться при предъявлении конкретного входного сигнала, заранее трудно предсказать.

При обучении слоя Кохонена на вход подается входной вектор и вычисляются его скалярные произведения с векторами весов всех нейронов. Скалярное произведение является мерой сходства между входным вектором и вектором весов. Нейрон с максимальным значением скалярного произведения объявляется «победителем» и его веса подстраиваются (весовой вектор приближается к входному).

Уравнение, описывающее процесс обучения, имеет вид

wн = wc + η (xwc),

где wн – новое значение веса, соединяющего входную компоненту х с выигравшим нейроном, wc – предыдущее значение этого веса, η – коэффициент скорости обучения.

Каждый вес, связанный с выигравшим нейроном Кохонена, изменяется пропорционально разности между его величиной и величиной входа, к которому он присоединен. Направление изменения минимизирует разность между весом и соответствующим элементом входного сигнала.

Коэффициент скорости обучения η вначале обычно полагается равным 0,7 и может затем постепенно уменьшаться в процессе обучения. Это позволяет делать большие начальные шаги для быстрого грубого обучения и меньшие шаги при подходе к окончательной величине.

Если бы с каждым нейроном Кохонена ассоциировался один входной вектор, то слой Кохонена мог бы быть обучен с помощью одного вычисления на вес (η = 1). Как правило, обучающее множество включает много сходных между собой входных векторов, и сеть должна быть обучена активировать один и тот же нейрон Кохонена для каждого из них. Веса этого нейрона должны получаться усреднением входных векторов, которые должны его активировать.

Обучение слоя Гроссберга. Выходы слоя Кохонена подаются на входы нейронов слоя Гроссберга. Выходы нейронов вычисляются, как при обычном функционировании. Далее каждый вес корректируется лишь в том случае, если он соединен с нейроном Кохонена, имеющим ненулевой выход. Величина коррекции веса пропорциональна разности между весом и требуемым выходом нейрона Гроссберга.

Обучение слоя Гроссберга – это обучение с учителем, алгоритм использует заданные желаемые выходы.

В полной модели сети встречного распространения имеется возможность получать выходные сигналы по входным и наоборот. Этим двум действиям соответствуют прямое и обратное распространение сигналов.

Области применения: распознавание образов, восстановление образов (ассоциативная память), сжатие данных (с потерями).

Недостатки. Сеть не дает возможности строить точные аппроксимации (точные отображения). В этом сеть значительно уступает сетям с обратным распространением ошибки.

К недостаткам модели также следует отнести слабую теоретическую проработку модификаций сети встречного распространения.

Преимущества. Сеть встречного распространения проста. Она дает возможность извлекать статистические свойства из множеств входных сигналов. Кохоненом показано, что для полностью обученной сети вероятность того, что случайно выбранный входной вектор (в соответствии с функцией плотности вероятности входного множества) будет ближайшим к любому заданному весовому вектору, равна 1/р, р – число нейронов Кохонена.

Сеть быстро обучается. Время обучения по сравнению с обратным распространением может быть в 100 раз меньше. По своим возможностям строить отображения сеть встречного распространения значительно превосходит однослойные персептроны.

Сеть полезна для приложений, в которых требуется быстрая начальная аппроксимация.

Сеть дает возможность строить функцию и обратную к ней, что находит применение при решении практических задач.

Модификации. Сети встречного распространения могут различаться способами определения начальных значений синаптических весов. Так, кроме традиционных случайных значений из заданного диапазона, могут быть использованы значения в соответствии с известным методом выпуклой комбинации.

Для повышения эффективности обучения применяется добавление шума к входным векторам.

Еще один метод повышения эффективности обучения – наделение каждого нейрона «чувством справедливости». Если нейрон становится победителем чаще, чем 1/р (р – число нейронов Кохонена), то ему временно увеличивают порог, давая тем самым обучаться и другим нейронам.

Кроме «метода аккредитации», при котором для каждого входного вектора активируется лишь один нейрон Кохонена, может быть использован «метод интерполяции», при использовании которого целая группа нейронов Кохонена, имеющих наибольшие выходы, может передавать свои выходные сигналы в слой Грос-сберга. Этот метод повышает точность отображений, реализуемых сетью, и реализован в так называемых самоорганизующихся картах.

3.4.3. Нейронные сети Хопфилда и Хэмминга. Среди различных конфигураций искусственных нейронных сетей (НС) встречаются такие, при классификации которых по принципу обучения, строго говоря, не подходят ни обучение с учителем, ни обучение без учителя. В таких сетях весовые коэффициенты синапсов рассчитываются только однажды перед началом функционирования сети на основе информации об обрабатываемых данных, и все обучение сети сводится именно к этому расчету. С одной стороны, предъявление априорной информации можно расценивать как помощь учителя, но с другой, – сеть фактически просто запоминает образцы до того, как на ее вход поступают реальные данные, и не может изменять свое поведение, поэтому говорить о звене обратной связи с «миром» (учителем) не приходится. Из сетей с подобной логикой работы наиболее известны сеть Хопфилда и сеть Хэмминга (представляющие собой разновидности сетей с обратными связями), которые обычно используются для организации ассоциативной памяти. Далее речь пойдет именно о них. Структурная схема сети Хопфилда приведена на рис. 2.19. Она состоит

из единственного слоя нейронов, число которых является одновременно числом входов и выходов сети. Каждый нейрон связан синапсами со всеми остальными нейронами, а также имеет один

входной синапс, через который осуществляется ввод сигнала. Выходные сигналы, как обычно, образуются на аксонах.

Задача, решаемая данной сетью в качестве ассоциативной памяти, как правило, формулируется следующим образом. Известен некоторый набор двоичных сигналов (изображений, звуковых оцифровок, прочих данных, описывающих некие объекты или характеристики процессов), которые считаются образцовыми. Сеть должна уметь из произвольного неидеального сигнала, поданного на ее вход, выделить («вспомнить» по частичной информации) соответствующий образец (если такой есть) или «дать заключение» о том, что входные данные не соответствуют ни одному из образцов. В общем случае, любой сигнал может быть описан вектором X = {xi : i = 1, 2, …, n}, n – число нейронов в сети и размерность входных и выходных векторов. Каждый элемент xi равен либо +1, либо –1. Обозначим вектор, описывающий kобразец, через Xk, а его компоненты, соответственно, – xik, k = 1, 2, ..., m, где m – в данном случае число образцов. Когда сеть распознает (или «вспомнит») какой-либо образец на основе предъявленных ей данных, ее выходы будут содержать именно его, т.е. Y = Xk, где Y – вектор выходных значений сети: Y = {yi : i = 1, 2, …, n}. В противном случае, выходной вектор не совпадет ни с одним образцовым.

Если, например, сигналы представляют собой некие изображения, то, отобразив в графическом виде данные с выхода сети, можно будет увидеть картинку, полностью совпадающую с одной из образцовых (в случае успеха), или же «вольную импровизацию» сети (в случае неудачи).

На стадии инициализации сети весовые коэффициенты синапсов устанавливаются следующим образом:

Здесь i и j – индексы, соответственно, предсинаптического и постсинаптического нейронов; xik, xjk i-й и jэлементы вектора k-го образца.

Алгоритм функционирования сети следующий (t – номер итерации):

1. На входы сети подается неизвестный сигнал. Фактически его ввод осуществляется непосредственной установкой значений аксонов:

yi(0) = xi, i = 1, 2, …, n,

поэтому обозначение на схеме сети входных синапсов в явном виде носит чисто условный характер. Ноль в скобке справа от yi означает нулевую итерацию в цикле работы сети.

2. Рассчитывается новое состояние нейронов

, j = 1, 2, …, n,

и новые значения аксонов

yi(t + 1) = f [sj(t + 1)],

где f – пороговая активационная функция с порогом θ = 0 (см. табл. 2.1).

3. Проверка, изменились ли выходные значения аксонов за последнюю итерацию. Если да – переход к пункту 2, иначе (если выходы застабилизировались) – конец. При этом выходной вектор представляет собой образец, наилучшим образом сочетающийся с входными данными.

Таким образом, когда подается новый вектор, сеть переходит из вершины в вершину, пока не стабилизируется. Устойчивая вершина определяется сетевыми весами и текущими входами. Если входной вектор частично неправилен или неполон, сеть стабилизируется в вершине, ближайшей к желаемой.

Показано, что достаточным условием устойчивой работы такой сети является выполнение условий

wij = wji, wii = 0.

Как говорилось выше, иногда сеть не может провести распознавание и выдает на выходе несуществующий образ. Это связано с проблемой ограниченности возможностей сети. Для сети Хопфилда число запоминаемых образов N не должно превышать величины, примерно равной 0,15n. Кроме того, если два образа А и В сильно похожи, они, возможно, будут вызывать у сети перекрестные ассоциации, т.е. предъявление на входы сети вектора А приведет к появлению на ее выходах вектора В и наоборот.

Когда нет необходимости, чтобы сеть в явном виде выдавала образец, т.е. достаточно, скажем, получать номер образца, ассоциативную память успешно реализует сеть Хэмминга. Данная сеть характеризуется, по сравнению с сетью Хопфилда, меньшими затратами на память и объемом вычислений, что становится очевидным из ее структуры (рис. 2.20).

Сеть состоит из двух слоев. Первый и второй слои имеют по m нейронов, где m – число образцов. Нейроны первого слоя имеют по п синапсов, соединенных с входами сети (образующими фиктивный нулевой слой). Нейроны второго слоя связаны между собой ингибиторными (отрицательными обратными) синаптическими связями. Единственный синапс с положительной обратной связью для каждого нейрона соединен с его же аксоном.

Идея работы сети состоит в нахождении расстояния Хэмминга от тестируемого образа до всех образцов (расстоянием Хэмминга называется число отличающихся битов в двух бинарных векторах). Сеть должна выбрать образец с минимальным расстоянием

Хэмминга до неизвестного входного сигнала, в результате чего будет активизирован только один выход сети, соответствующий этому образцу.

На стадии инициализации весовым коэффициентам первого слоя и порогу активационной функции присваиваются следующие значения:

, , i = 1, 2, …, n,  k = 1, 2, …, m.

Здесь xiki-й элемент k-го образца.

Весовые коэффициенты тормозящих синапсов во втором слое берут равными некоторой величине 0<ε<1/m. Синапс нейрона, связанный с его же аксоном, имеет вес +1.

Алгоритм функционирования сети Хэмминга следующий:

1. На входы сети подается неизвестный вектор X = {xi : i = 1, …, n}, исходя из которого рассчитываются состояния нейронов первого слоя (верхний индекс в скобках указывает номер слоя):

,  j = 1, 2, …, m.

После этого полученными значениями инициализируются значения аксонов второго слоя:

, j = 1, 2, …, m.

2. Вычисляются новые состояния нейронов второго слоя:

, kj, j = 1, 2, …, m,

и значения их аксонов:

, j = 1, 2, …, m.

3. Проверяется, изменились ли выходы нейронов второго слоя за последнюю итерацию. Если да – перейди к шагу 2. Иначе – конец.

Из оценки алгоритма видно, что роль первого слоя весьма условна: воспользовавшись один раз на шаге 1 значениями его весовых коэффициентов, сеть больше не обращается к нему, поэтому первый слой может быть вообще исключен из сети (заменен на матрицу весовых коэффициентов).

В заключение можно сделать следующее обобщение. Сети Хопфилда и Хэмминга позволяют просто и эффективно разрешить задачу воссоздания образов по неполной и искаженной информации. Невысокая емкость сетей (число запоминаемых образов) объясняется тем, что сети не просто запоминают образы, а позволяют проводить их обобщение, например, с помощью сети Хэмминга возможна классификация по критерию максимального правдоподобия. Вместе с тем, легкость построения программных и аппаратных моделей делают эти сети привлекательными для многих применений.

3.4.4. Сеть с радиальными базисными элементами (RBF). В общем случае под термином Radial Basis Function Network (сеть RBF) понимается двухслойная сеть без обратных связей, которая содержит скрытый слой радиально симметричных скрытых нейронов (шаблонный слой). Для того чтобы шаблонный слой был радиально-симметричным, необходимо выполнение следующих условий:

наличие центра, представленного в виде вектора во входном пространстве; обычно этот вектор сохраняется в пространстве весов от входного слоя к слою шаблонов;

наличие способа измерения расстояния входного вектора от центра; обычно это стандартное евклидово расстояние;

наличие специальной функции прохождения от одного аргумента, которая определяет выходной сигнал нейрона путем отображения функции расстояния; обычно используется функция Гаусса

.

Другими словами, выходной сигнал шаблонного нейрона – это функция только от расстояния между входным вектором X и сохраненным центром С:

.

Выходной слой сети является линейным, так что выходы сети определяются выражением

, j = 1, 2, …, m,

где Сi – центры, σi- – отклонения радиальных элементов.

Обучение RBF-сети происходит в несколько этапов. Сначала определяются центры и отклонения для радиальных элементов; после этого оптимизируются параметры wij линейного выходного слоя.

Расположение центров должно соответствовать кластерам, реально присутствующим в исходных данных. Рассмотрим два наиболее часто используемых метода.

Выборка из выборки. В качестве центров радиальных элементов берутся несколько случайно выбранных точек обучающего множества. В силу случайности выбора они «представляют» распределение обучающих данных в статистическом смысле. Однако, если число радиальных элементов невелико, такое представление может быть неудовлетворительным.

Алгоритм K-средних. Этот алгоритм стремится выбрать оптимальное множество точек, являющихся центроидами кластеров в обучающих данных. При К радиальных элементах их центры располагаются таким образом, чтобы:

каждая обучающая точка «относилась» к одному центру кластера и лежала к нему ближе, чем к любому другому центру;

каждый центр кластера был центроидом множества обучающих точек, относящихся к этому кластеру.

После того как определено расположение центров, нужно найти отклонения. Величина отклонения (ее также называют сглаживающим фактором) определяет, насколько «острой» будет гауссова функция. Если эти функции выбраны слишком острыми, сеть не будет интерполировать данные между известными точками и потеряет способность к обобщению. Если же гауссовы функции взяты чересчур широкими, сеть не будет воспринимать мелкие детали (на самом деле сказанное – еще одна форма проявления дилеммы пере/недообучения). Как правило, отклонения выбираются таким образом, чтобы «колпак» каждой гауссовой функций захватывал несколько соседних центров. Для этого имеется несколько методов:

Явный. Отклонения задаются пользователем.

Изотропный. Отклонение берется одинаковым для всех элементов и определяется эвристически с учетом количества радиальных элементов и объема покрываемого пространства.

К ближайших соседей. Отклонение каждого элемента устанавливается (индивидуально) равным среднему расстоянию до его К ближайших соседей. Тем самым отклонения будут меньше в тех частях пространства, где точки расположены густо, – здесь будут хорошо учитываться детали, – а там, где точек мало, отклонения будут большими (и будет производиться интерполяция).

После того как выбраны центры и отклонения, параметры выходного слоя оптимизируются с помощью стандартного метода линейной оптимизации – алгоритма псевдообратных матриц (сингулярного разложения).

Могут быть построены различные гибридные разновидности сетей с радиальными базисными функциями. Например, выходной слой может иметь нелинейные функции активации, и тогда для его обучения используется какой-либо из алгоритмов обучения многослойных сетей, например метод обратного распространения. Можно также обучать радиальный (скрытый) слой с помощью алгоритма обучения сети Кохонена – это еще один способ разместить центры так, чтобы они отражали расположение данных.

Сети RBF имеют ряд преимуществ перед рассмотренными многослойными сетями прямого распространения (хотя их структура и соответствует приведенной на рис. 2.5). Во-первых, они моделируют произвольную нелинейную функцию с помощью всего одного промежуточного слоя, тем самым избавляя нас от необходимости решать вопрос о числе слоев. Во-вторых, параметры линейной комбинации в выходном слое можно полностью оптимизировать с помощью хорошо известных методов линейной оптимизации, которые работают быстро и не испытывают трудностей с локальными минимумами, так мешающими при обучении с использованием алгоритма обратного распространения ошибки. Поэтому сеть RBF обучается очень быстро (на порядок быстрее, чем с использованием алгоритма обратного распространения).

Недостатки сетей RBF: данные сети обладают плохими экстраполирующими свойствами и получаются весьма громоздкими при большой размерности вектора входов.

3.4.5. Вероятностная нейронная сеть (PNN). Задача оценки плотности вероятности по имеющимся данным имеет давнюю историю в математической статистике.

Обычно при этом предполагается, что плотность имеет некоторый определенный вид (чаще всего, – что она имеет нормальное распределение). После этого оцениваются параметры модели. Нормальное распределение часто используется потому, что тогда параметры модели (среднее и стандартное отклонение) можно оценить аналитически.

Заметим, что предположение о нормальности далеко не всегда оправдано.

Другой подход к оценке плотности вероятности основан на так называемых ядерных оценках. Можно рассуждать так: тот факт, что наблюдение расположено в данной точке пространства, свидетельствует о том, что в этой точке имеется некоторая плотность вероятности. Кластеры из близко лежащих точек указывают на то, что в этом месте плотность вероятности большая. Вблизи наблюдения имеется большее доверие к уровню плотности, а по мере отдаления от него доверие убывает и стремится к нулю. В методе ядерных оценок в точке, соответствующей каждому наблюдению, помещается некоторая простая функция, затем все они складываются и в результате получается оценка для общей плотности вероятности. Чаще всего в качестве ядерных функций берутся гауссовы функции (с формой колокола). Если обучающих примеров достаточное количество, то такой метод дает достаточно хорошее приближение к истинной плотности вероятности.

Метод аппроксимации плотности вероятности с помощью ядерных функций во многом похож на метод радиальных базисных функций, и таким образом мы естественно приходим к понятиям вероятностной нейронной сети (PNN) и обобщенно-регрессионной нейронной сети (GRNN). PNN-сети предназначены для задач классификации, a GRNN – для задач регрессии. Сети этих двух типов представляют собой реализацию методов ядерной аппроксимации, оформленных в виде нейронной сети.

Сеть PNN имеет по меньшей мере три слоя: входной, радиальный и выходной. Радиальные элементы берутся по одному на каждое обучающее наблюдение. Каждый из них представляет гауссову функцию с центром в этом наблюдении. Каждому классу соответствует один выходной элемент. Каждый такой элемент соединен со всеми радиальными элементами, относящимися к его классу, а со всеми остальными радиальными элементами он имеет нулевое соединение. Таким образом, выходной элемент просто складывает отклики всех элементов, принадлежащих к его классу. Значения выходных сигналов получаются пропорциональными ядерным оценкам вероятности принадлежности соответствующим классам, и, пронормировав их на единицу, мы получаем окончательные оценки вероятности принадлежности классам.

Выход рассматриваемой сети, соответствующий какому-либо классу, описывается выражением

,

где п – размерность входного вектора, N – объем обучающей выборки, Xk – элемент (вектор) этой выборки, соответствующий отмеченному классу.

Базовая модель PNN-сети может иметь две модификации.

Вероятностная нейронная сеть имеет единственный управляющий параметр обучения, значение которого должно выбираться пользователем, – отклонение гауссовой функции σ (параметр сглаживания). Как и в случае RBF-сетей, этот параметр выбирается из тех соображений, чтобы «шапки» определенное число раз перекрывались: выбор слишком маленьких отклонений приведет к «острым» аппроксимирующим функциям и неспособности сети к обобщению, а при слишком больших отклонениях будут теряться детали. Требуемое значение несложно найти опытным путем, подбирая его так, чтобы контрольная ошибка была как можно меньше. К счастью, PNN-сети не очень чувствительны к выбору параметра сглаживания.

Наиболее важные преимущества PNN-сетей состоят в том, что выходное значение имеет вероятностный смысл (и поэтому его легче интерпретировать), и в том, что сеть быстро обучается. При обучении такой сети время тратится практически только на то, чтобы подавать ей на вход обучающие наблюдения, и сеть работает настолько быстро, насколько это вообще возможно.

Существенным недостатком таких сетей является их объем. PNN-сеть фактически вмещает в себя все обучающие данные, поэтому она требует много памяти и может медленно работать.

PNN-сети особенно полезны при пробных экспериментах (например, когда нужно решить, какие из входных переменных использовать), так как благодаря короткому времени обучения можно быстро проделать большое количество пробных тестов.

3.4.6. Обобщенно-регрессионная нейронная сеть (GRNN). Данная сеть устроена аналогично вероятностной нейронной сети (PNN), но она предназначена для решения задач регрессии, а не классификации. Как и в случае PNN-сети, в точку расположения каждого обучающего наблюдения помещается гауссова ядерная функция. Мы считаем, что каждое наблюдение свидетельствует о некоторой нашей уверенности в том, что поверхность отклика в данной точке имеет определенную высоту, и эта уверенность убывает при отходе в сторону от точки. GRNN-сеть копирует внутрь себя все обучающие наблюдения и использует их для оценки отклика в произвольной точке. Окончательная выходная оценка сети получается как взвешенное среднее выходов по всем обучающим наблюдениям:

,

где Xk, yk – точки обучающей выборки.

Первый промежуточный слой сети GRNN состоит из радиальных элементов. Второй промежуточный слой содержит элементы, которые помогают оценить взвешенное среднее. Каждый выход имеет в этом слое свой элемент, формирующий для него взвешенную сумму. Чтобы получить из взвешенной суммы взвешенное среднее, эту сумму нужно поделить на сумму весовых коэффициентов. Последнюю сумму вычисляет специальный элемент второго слоя. После этого в выходном слое производится собственно деление (с помощью специальных элементов «деления»). Таким образом, число элементов во втором промежуточном слое на единицу больше, чем в выходном слое. Как правило, в задачах регрессии требуется оценить одно выходное значение, и, соответственно, второй промежуточный слой содержит два элемента.

Можно модифицировать GRNN-сеть таким образом, чтобы радиальные элементы соответствовали не отдельным обучающим случаям, а их кластерам. Это уменьшает размеры сети и увеличивает скорость обучения. Центры для таких элементов можно выбирать с помощью любого предназначенного для этой цели алгоритма (выборки из выборки, K-средних или Кохонена).

Достоинства и недостатки у сетей GRNN в основном такие же, как и у сетей PNN, – единственное различие в том, что GRNN используются в задачах регрессии, a PNN – в задачах классификации. GRNN-сеть обучается почти мгновенно, но может получиться большой и медленной (хотя здесь, в отличие от PNN, не обязательно иметь по одному радиальному элементу на каждый обучающий пример, их число все равно будет большим). Как и сеть RBF, сеть GRNN не обладает способностью экстраполировать данные.

3.4.7. Линейные НС. Согласно общепринятому в науке принципу, если более сложная модель не дает лучших результатов, чем более простая, то из них следует предпочесть вторую. В терминах аппроксимации отображений самой простой моделью будет линейная, в которой аппроксимирующая (подгоночная) функция определяется гиперплоскостью. В задаче классификации гиперплоскость размещается таким образом, чтобы она разделяла собой два класса (линейная дискриминантная функция); в задаче регрессии гиперплоскость должна проходить через заданные точки. Линейная модель обычно задается уравнением

Y = XW + B,

где W – матрица весов сети, В – вектор смещений.

На языке нейронных сетей линейная модель представляется сетью без промежуточных слоев, которая в выходном слое содержит только линейные элементы (т.е. элементы с линейной функцией активацией). Веса соответствуют элементам матрицы, а пороги – компонентам вектора смещения. Во время работы сеть фактически умножает вектор входов на матрицу весов, а затем к полученному вектору прибавляет вектор смещения.

3.5. Эффективность нейронных сетей

Эффективность нейронных сетей устанавливается рядом так называемых теорем о полноте. Ранее в нестрогой формулировке была приведена одна из них. Рассмотрим еще одну подобную теорему.

В 1989 г. Funahashi показал, что бесконечно большая нейронная сеть с единственным скрытым слоем способна аппроксимировать любую непрерывную функцию, сформулировав данное утверждение в форме следующей теоремы.

Теорема. Пусть  непостоянная, ограниченная и монотонно возрастающая непрерывная функция. Пусть, далее ограниченное множество и

f : UR

вещественная непрерывная функция, определенная на U.

Тогда для произвольного ε > 0 существует целое L и вещественные константы wi, wij, такие, что аппроксимация

удовлетворяет неравенству

.

Другими словами, любое непрерывное отображение может быть аппроксимировано в смысле однородной топологии на U двухслойной

нейронной сетью с активационными функциями  для нейронов скрытого слоя и линейными активационными функциями для нейронов выходного слоя. На рис. 2.21 представлена НС Funahashi для аппроксимации скалярной функции векторного аргумента.

Отметим еще раз, что приведенная теорема о полноте является далеко не единственной из известных.

Основными недостатками аппарата нейронных сетей являются:

отсутствие строгой теории по выбору структуры НС;

практическая невозможность извлечения приобретенных знаний из обученной НС (нейронная сеть практически всегда – «вещь в себе», черный ящик для исследователя).

3.3. Моделирование НС

4.3.1. Представление знаний и моделирование рассуждений.

Представление знаний (knowledge representation) - одно из наиболее сформировавшихся направлений искусственного интеллекта. Традиционно к нему относилась разработка формальных языков и программных средств для отображения и описания так называемых когнитивных структур. Сегодня к представлению знаний причисляют также исследования по дескриптивной логике, логикам пространства и времени, онтологиям

Пространственные логики позволяют описывать конфигурацию пространственных областей, объектов в пространстве; изучаются также семейства пространственных отношений. В последнее время эта область, из-за тесной связи с прикладными задачами, становится доминирующей в исследованиях по представлению знаний. Например, для задач роботики важно уметь по изображению некоторой сцены восстановить ее вербальное (формальное) описание, с тем чтобы далее это описание использовать, например, для планирования действий робота.

Объектами дескриптивной логики являются так называемые концепты, (базовые структуры для описания объектов в экспертных системах) и связанные в единое целое множества концептов (агрегированные объекты). Дескриптивная логика вырабатывает методы работы с такими сложными концептами, рассуждений об их свойствах и выводимости на них. Дескриптивная логика может быть использована, кроме того, для построения объяснительной компоненты базы знаний.

Наконец, онтологические исследования посвящены способам концептуализации знаний и методологическим соображениям о разработке инструментальных средств для анализа знаний.

Различные способы представления знаний лежат в основе моделирования рассуждений, куда входят: моделирование рассуждений на основе прецедентов (case-based reasoning, CBR), аргументации или ограничений, моделирование рассуждений с неопределенностью, рассуждения о действиях и изменениях, немонотонные модели рассуждений, и др. Остановимся на некоторых из них.

CBR

Здесь главные проблемы – поиск алгоритмов адаптации, «фокусировка поиска» на использовании прошлого опыта, вывод, основанный на оценке сходства и технологии визуализации.

Пусть заданы прецеденты как множество пар <СЛУЧАЙ, РЕШЕНИЕ>, множество зависимостей между различными атрибутами СЛУЧАЕВ и РЕШЕНИЙ, а также целевая проблема ЦЕЛЬ. Для возникающей новой ситуации («нового случая») требуется найти пару <НОВЫЙ СЛУЧАЙ, ИСКОМОЕ РЕШЕНИЕ>, которая решает целевую проблему.

Алгоритмы для таких задач основаны обычно на сравнении прецедентов с новым случаем (в какой-либо метрике), с использованием зависимостей между атрибутами случаев и атрибутами решения. Такие зависимости могут задаваться человеком при построении базы случаев, или обнаруживаться в базе случаев автоматически. При поиске решения для целевой проблемы выполняется адаптация уже имеющегося в базе прецедентов решения. Для этой адаптации и используются означенные зависимости.

Важной проблемой CBR является проблема выбора подходящего прецедента. Естественно искать подходящий прецедент в той области пространства поиска, где находятся решения сходных проблем. Но как определить, какие именно решения надо считать сходными?

Существуют гипотезы, что сходство проблем налагает ограничения на сходство соответствующих гипотез в форме слабой связи между ними. Это обстоятельство и используется для ограничения области поиска решений.

Пусть, например, речь идет о некотором клиенте, который (с супругой) желает две недели провести на Канарах и хочет заплатить за это не более полутора тысяч долларов.

Первый вариант диалога с системой не обладающей способностями к рассуждениям ( и на основе прецедентов тоже):

Клиент: здравствуйте, я бы хотел слетать в отпуск на две недели в июле на Канарские острова. Я бы хотел поехать со своей женой, но не могу заплатить более полутора тысяч долларов.

Система: извините, но такой возможности у нас нет.

Клиент: хорошо, но может быть у вас найдется что-нибудь похожее в близком регионе.

Система: не могли бы Вы уточнить, что Вы имеете ввиду, говоря о близком регионе.

Клиент: я имею ввиду побережье Испании.

Система: извините, но это не близкий регион. Это более тысячи километров от Канарских островов!

Клиент: но климат там похожий…

Система: извините, что Вы имеете ввиду, говоря о климате...

Скорее всего, клиент обратится в другое турагентство

Второй вариант диалога:

Клиент: здравствуйте, я бы хотел слетать в отпуск на две недели в июле на Канарские острова. Я бы хотел поехать со своей женой, но не могу заплатить более полутора тысяч долларов.

Система: извините, такой возможности сейчас нет. Но может быть, Вас устроит побережье Испании?

Клиент: а как насчет климата, он похож на Канарский?

Система: да и, кроме того, билеты дешевле!

Клиент: отлично, забронируйте, пожалуйста.

Из этого, может быть, не очень серьезного примера видно, что, а) во втором случае клиент имеет дело с системой, которая понимает, что хоть регион и не близок Канарам, но более близок клиенту, во всяком случае, билет дешевле и б) так как клиент хочет поехать в июле, видимо, его интересуют морские купания и пляжи, а это есть как на Канарах, так и на побережье Испании. Из этого система делает вывод о сходстве ситуаций (описанной клиентом и имеющейся вакансии в ее базе) и на основании этого полагает, что решение «отдых в Испании» является близким решению «отдых на Канарах».

Методы CBR уже применяются в множестве прикладных задач – в медицине, управлении проектами, для анализа и реорганизации среды, для разработки товаров массового спроса с учетом предпочтений разных групп потребителей, и т.д. Следует ожидать приложений методов CBR для задач интеллектуального поиска информации, электронной коммерции (предложение товаров, создание виртуальных торговых агентств), планирования поведения в динамических средах, компоновки, конструирования, синтеза программ.

Моделирование рассуждений на основе ограничений

Наиболее интересны здесь задачи моделирования рассуждений, основанных на процедурных динамических ограничениях. Они мотивированы сложными актуальными задачами – например, планированием в реальной обстановке.

Под задачей удовлетворения ограничений понимается четверка множеств: множество переменных, множество соответствующих областей переменных, множество ограничений на переменные и множество отношений над областями. Решением проблемы удовлетворения ограничений называется набор значений переменных, удовлетворяющих ограничениям на переменные, такой, что при этом области, которым принадлежат эти значения, удовлетворяют отношениям над областями.

Задача удовлетворения динамических ограничений есть последовательность задач удовлетворения ограничений, в которой каждая последующая задача есть ограничение предыдущей. Эти задачи по смыслу близки задачам динамического программирования. Они связаны также с интервальной алгеброй.

Немонотонные модели рассуждений

Сюда относятся исследования по логике умолчаний (default logic), по логике «отменяемых» (Defeasible) рассуждений, логике программ, теоретико - аргументационой характеризации логик с отменами, характеризации логик с отношениями предпочтения, построению эквивалентных множеств формул для логик с очерчиванием (circumscription) и некоторые другие. Такого рода модели возникают при реализации индуктивных рассуждений, например, по примерам; связаны они также с задачами машинного обучения и некоторыми иными задачами. В частности, в задачах моделирования рассуждений на основе индукции источником первоначальных гипотез служат примеры. Если некоторая гипотеза Н возникла на основе N положительных примеров (например, экспериментального характера), то никто не может дать гарантии, что в базе данных или в поле зрения алгоритма не окажется N+1 - й пример, опровергающий гипотезу (или меняющий степень ее истинности). Это означает, что ревизии должны быть подвержены и все следствия гипотезы H.

Рассуждения о действиях и изменениях

Большая часть работ в этой области посвящена применениям ситуационного исчисления - формализма, предложенного Джоном Маккарти в 1968 году для описания действий, рассуждений о них и эффектов действий. Для преобразования плана поведения робота в исполняемую программу, достигающую с некоторой вероятностью фиксированной цели, вводится специальное логическое исчисление, основанное на ситуационной логике. Для этой логики предложены варианты реализации на языке pGOLOG - версии языка GOLOG, содержащей средства для введения вероятностей.

Активно исследуются логики действий, применение модальных логик для рассуждений о знаниях и действиях.

Рассуждения с неопределенностью

Сюда относится использование байесовского формализма в системах правил и сетевых моделях. Байесовские сети – это статистический метод обнаружения закономерностей в данных. Для этого используется первичная информация, содержащаяся либо в сетевых структурах либо в базах данных. Под сетевыми структурами понимается в этом случае множество вершин и отношений на них, задаваемое с помощью ребер. Содержательно, ребра интерпретируются как причинные связи. Всякое множество вершин Z, представляющее все пути между некоторыми двуми иными вершинами X и Y соответствует условной зависимости между этими двуми последними вершинами.

Далее задается некоторое распределение вероятностей на множестве переменных, соответствующих вершинам этого графа и полученная, но минимизированная (в некотором смысле) сеть называется байсовской сетью.

На такой сети можно использовать, так называемый байесовский вывод, т.е. для вычисления вероятностей следствий событий можно использовать (с некоторой натяжкой) формулы теории вероятностей.

Иногда рассматриваются так называемые гибридные байесовские сети, с вершинами которых связаны как дискретные, так и непрерывные переменные. Байесовские сети часто применяются для моделирования технических систем.

4.3.2. Приобретение знаний, машинное обучение и автоматическое порождение гипотез.

Работы в области приобретения знаний интеллектуальными системами были и остаются важнейшим направлением теории и практики искусственного интеллекта. Целью этих работ является создание методологий, технологий и программных средств переноса знаний (или, как иногда говорят, компетентности), в базу знаний системы. При этом в качестве источников знаний выступают эксперты (т.е. высококвалифицированные специалисты предметных областей), тексты и данные, например, хранимые в базах данных.

Соответственно, развиваются различные методы приобретения знаний

Машинному обучению в мире уделяется большое внимание. Существует множество алгоритмов машинного обучения, среди самых распространенных – алгоритмы класса C4. Один из алгоритмов этого класса С4.5, является, по существу, алгоритмом декомпозиции и строит дерево решений. Исходной информацией для построения этого дерева является множество примеров. С каждой вершиной дерева ассоциируется наиболее (на текущем шаге) частотный класс примеров. На следующем шаге этот принцип рекурсивно применяется к текущей вершине, т.е. множество примеров, связанных с текущей вершиной также разбивается на подклассы. Алгоритм завершает свою работу либо при удовлетворении некоторого критерия либо при исчерпании подклассов (если они заданы).

Активно исследуются методы обучения причинам действий. Иногда говорят о так называемой теории действий, имея в виду ситуационное исчисление в духе Джона МакКарти. В этой теории причины действий и сами действия описываются в виде клаузальных структур (один из видов таких структур представляет собой импликацию, левая часть которой есть конъюнкция атомарных формул, а правая состоит из одной атомарной формулы).

Далее, методы индуктивного логического программирования модифицируются таким образом, чтобы быть применимыми к поиску таких структур. Когда такие структуры найдены, их можно использовать в языках логического программирования для рассуждений о действиях и их причинах.

Многие работы этого направления посвящены «нейронной парадигме». Нейросетевой подход используется в огромном количестве задач - для кластеризации информации из Интернета, автоматической генерации локальных каталогов, представления образов (в рекурсивных нейронных сетях). Среди активно изучаемых в последнее время тем - неоднородные нейронные модели с отношениями сходства. (Heterogeneous Neural Networks with similarity relation).

Это отношение сходства определяется на множестве входов и множестве состояний сети, а мерой сходства является скалярное произведение векторов либо эвклидово расстояние (где один вектор-вектор входов, а другой распределение весов нейронов, описывающих текущую ситуацию).

Работы по автоматическому порождению гипотез связаны, главным образом, с формализацией правдоподобных рассуждений, поиском зависимостей причинно-следственного типа между некоторыми сущностями. В качестве примеров можно привести порождение гипотез о свойствах химических соединений (прогноз биологических активностей), о возможных причинах дефектов (диагностика) и т.п.

4.3.3. Интеллектуальный анализ данных и обработка образной информации.

Это сравнительно новое направление, основу которого составляют две процедуры: обнаружение закономерностей в исходной информации и использование обнаруженных закономерностей для предсказания (прогнозирования). Сюда относят задачи выбора информативных данных из большой их совокупности, выбора информативных характеристик некоторого объекта из более широкого множества его характеристик, задачи построения модели, позволяющие вычислять значения выбранных информативных характеристик по значениям других характеристик, и т.п.

Значительную часть этого направления составляют исследования по различным аспектам распознавания изображений, в частности, с помощью нейросетей (включая псевдооптические нейросети). Изучаются методы распознавания последовательностей видеообразов на основе декларативного подхода и извлечения семантически значимой информации. К этому же направлению принадлежат исследования по графической технологии программирования в Интернете.

4.3.4. Многоагентные системы, динамические интеллектуальные системы и планирование.

Это новое (впрочем, в теоретических, поведенческих аспектах – скорее хорошо забытое старое) направление, изучающее интеллектуальные программные агенты и их коллективы

Интеллектуальный агент - это программная система, обладающая

-автономностью: агенты действуют без непосредственного участия человека и могут в некоторых пределах сами управлять своими действиями;

-социальными чертами: агенты взаимодействуют с другими агентами (и, возможно, человеком) посредством некоторого языка коммуникации;

-реактивностью: агенты воспринимают окружающую среду, которая может быть физическим миром, множеством других агентов, сетью Интернет или комбинацией всего этого, и реагируют на ее изменения;

-активностью: агенты могут демонстрировать целенаправленное поведение, проявляя при этом инициативу.

Основные задачи в этой области таковы: реализация переговоров интеллектуальных агентов и разработка языков для этой цели, координация поведения агентов, разработка архитектуры языка программирования агентов.

Планирование поведения, или ИИ - планирование – это способность интеллектуальной системы синтезировать последовательность действий для достижения желаемого целевого состояния. Работы по созданию эффективных методов такого синтеза востребованы и активно ведутся уже около 30 лет. Планирование является основой интеллектуального управления, т. е. автоматического управления автономным целенаправленным поведением программно-технических систем.

Среди методов ИИ–планирования сегодня выделяют классическое планирование, т.е. планирование в условиях статической среды, динамическое планирование, т.е. планирование в условиях изменения среды и, главное, учета такого изменения, иерархическое планирование, т.е.. когда действия абстрактного плана высокого уровня конкретизируются более детальными планами нижнего уровня, частично - упорядоченное (или монотонное ) планирование, когда план строится на основе частично упорядоченного множества подпланов. При этом, общий план (элементами которого являются подпланы), обязан быть монотонным, а каждый из подпланов может быть немонотонным. Добавлю, что монотонность это такое свойство плана, когда каждое его действие уменьшает различия между текущим состоянием и целью поведения. Например, если план движения робота к цели таков, что каждый его шаг приближает к цели, то план монотонен, но если он наткнулся при этом на препятствие и требуется его обойти, то монотонность плана нарушится. Однако,