74502

Технологии искусственного интеллекта

Лекция

Информатика, кибернетика и программирование

Основные области применения ИИ: Доказательства теорем; Игры; Распознавание образов; Принятие решений; Адаптивное программирование; Сочинение машинной музыки; Обработка данных на естественном языке; Обучающиеся сети нейросети В экономике в настоящее время получают широкое распространение принятие решений и нейросети. Отметим что в настоящее время используются такие модели представления знаний как продукционная модель основанная на построении правил ЕСЛИ ТО; фреймовая модель в которой описывается один концептуальный объект а...

Русский

2014-12-31

231.5 KB

14 чел.

Компьютерные информационные технологии (КИТ)

Лекция 10

Технологии искусственного интеллекта

10.1 Основные понятия искусственного интеллекта

Искусственный интеллект (ИИ) - это наука о концепциях, позволяющих компьютерам выполнять задачи которые у людей выглядят разумными. В общем случае дать определение интеллекта в обычном смысле этого слова невозможно, потому что интеллект - это сплав многих навыков в области обработки и представления информации.

Центральные задачи ИИ состоят в том, что бы сделать компьютер более полезными и чтобы понять принципы, лежащие в основе интеллекта. Для этого необходимо знать, каким образом ИИ может помочь специалистам в различных предметных областях в разрешение трудных проблем.

Термин искусственный интеллект  (ИИ , AIartificial intelligence) был предложен   в 1956 году на семинаре в Дартмутском колледже (США). Семинар был посвящен разработке методов решения логических задач (не вычислительных) с помощью вычислительных машин.  Следует отметить, что был сделан неудачный перевод английского понятия artificial intelligence на русский язык, и поэтому в русском языке это понятие носит несколько фантастический оттенок. На самом деле artificial intelligence означает «умение рассуждать разумно».

Основные области применения ИИ:

  •  Доказательства теорем;
    •  Игры;
    •  Распознавание образов;
    •  Принятие решений;
    •  Адаптивное программирование;
    •  Сочинение машинной музыки;
    •  Обработка данных на естественном языке;
    •  Обучающиеся сети (нейросети)

В экономике в настоящее время получают широкое распространение принятие решений и нейросети.

В общем случае функциональная структура использования ИИ состоит из трех компонент (комплексов):

  •  Исполнительная система
  •  Интеллектуальный интерфейс пользователя
  •  База знаний

Первый комплекс представляет собой совокупность средств, выполняющих программы (исполнительную систему), спроектированных с позиций эффективного решения задач, имеет в ряде случаев проблемную ориентацию. Исполнительная система (ИС) объединяет всю совокупность средств, обеспечивающих выполнение сформированной программы.

Второй комплекс - совокупность средств интеллектуального интерфейса, имеющих гибкую структуру, которая обеспечивает возможность адаптации в широком спектре интересов конечных пользователей. Интеллектуальный интерфейс – это система программных и аппаратных средств, обеспечивающих для конечного пользователя использование компьютера для решения задач, которые возникают в среде его профессиональной деятельности либо без посредников либо с незначительной их помощью.

Третьим комплексом средств, с помощью которых организуется взаимодействие первых двух, является база знаний, обеспечивающая использование вычислительными средствами первых двух комплексов целостной и независимой от обрабатывающих программ системы знаний о проблемной среде. База знаний (БЗ) - занимает центральное положение по отношению к остальным компонентам вычислительной системы в целом, через БЗ осуществляется интеграция средств ИС, участвующих в решении задач.

Базы знаний, представляют собой некий аналог обычных баз данных, но содержат информацию не в виде таблиц или записей с полями, а в виде утверждений о чем-либо, например "туристическая фирма предоставляет услуги населению" или "студенты являются наиболее активной частью населения". Доступ к этой информации осуществляется не через команды поиска, а с помощью формулируемых на естественном языке вопросов, например "может ли туристическая фирма предоставлять услуги студентам?".

Отметим , что в настоящее время используются такие модели представления знаний, как продукционная модель, основанная на построении правил «ЕСЛИ - ТО»; фреймовая модель, в которой описывается один концептуальный объект, а его конкретные  свойства в структурных элементах этого фрейма; семантические сети, где узлы сети соответствуют понятиям и объектам, а дуги – отношениям между этими объектами

10.2 Экспертные системы

В повседневной жизни мы постоянно сталкиваемся с экспертами в самых различных областях человеческой деятельности- врачи, преподаватели, референты и т.д. Имея огромный багаж знаний, касающихся предметной области, они умеют точно сформулировать и правильно решить задачу.

В течение последних десятилетий многочисленные попытки исследователей были направлены на создание систем, способных заменить специалиста в конкретной предметной области, т.е. решать задачи в отсутствии людей- экспертов.

Эти системы получили название экспертных систем.

В ходе исследований выяснилось, что среди задач, решаемых экспертами, формализованные задачи составляют лишь малую часть, в то время как основная их масса относится к числу неформализованных.

В настоящее время существует несколько определений экспертных систем (их иногда называют также «инженерия знаний» или «системы, основанные на знаниях»).

Одним из наиболее популярных определений экспертной системы является следующее:

Под экспертной системой понимается система, объединяющая возможности компьютера со знаниями и опытом эксперта в такой форме, что система может предложить разумный совет или осуществить разумное решение поставленной задачи. Дополнительно желаемой характеристикой такой системы является способность системы пояснять по требованию ход своих рассуждений в понятной для спрашивающего форме.

Приведенное определение, позволяют выделить ряд базовых структурных элементов экспертной системы.

Как и любая система, основанная на знаниях, экспертная система обязательно содержит в своем составе базу знаний и механизм логических выводов. Зачастую для представления фактический знаний используется отдельный механизм - база данных, а в базе знаний остаются лишь процедурные знания. Кроме того, для ведения базы знаний и дополнения ее при необходимости знаниями, полученными от эксперта, требуется отдельный модуль приобретения знаний.

Другим важным компонентом экспертной системы является пользовательский интерфейс, необходимый для правильной передачи ответов пользователю в удобной для него форме. Кроме того, пользовательский интерфейс необходим и эксперту для осуществления манипуляций со знаниями.


И наконец, в экспертной системе должен присутствовать модуль, который способен при помощи механизма логического вывода, "предложить разумный совет или осуществить разумное решение поставленной задачи", сопровождая его по требованию пользователя различными комментариями, поясняющими ход проведенных рассуждений. Модуль, реализующий эти функции, называется модулем советов и объяснений. Следует отметить, что механизм объяснений играет весьма важную роль, позволяя повысить степень доверия пользователя к полученному результату. Кроме того, он важен не только для пользователя системы, но и для эксперта, который с его помощью определяет, как работает система и как используются предоставленные им знания.

Базовая структура экспертной системы показана на рис.1.

Перечисленные структурные элементы являются наиболее характерными для большинства экспертных систем, хотя в реальных условиях некоторые из них могут отсутствовать.

Важность экспертных систем состоит в следующем:

  •  технология экспертных систем существенно расширяет круг практически значимых задач, решаемых на компьютерах, решение которых приносит значительный экономический эффект;
  •  ЭС будут играть ведущую роль во всех фазах проектирования, разработки, производства, распределения, продажи, поддержки и оказания услуг;
  •  технология ЭС, получившая коммерческое распространение, обеспечит революционный прорыв в создании интеллектуально взаимодействующих модулей.

Использовать ЭС следует только тогда, когда разработка ЭС возможна, оправдана и методы инженерии знаний соответствуют решаемой задаче. Применение ЭС может быть оправдано одним из следующих факторов:

  •  решение задачи принесет значительный эффект, например экономический;
  •   использование человека-эксперта невозможно либо из-за недостаточного количества экспертов, либо из-за необходимости выполнять экспертизу одновременно в различных местах;
  •   использование ЭС целесообразно в тех случаях, когда при передаче информации эксперту происходит недопустимая потеря времени или информации;
  •   использование ЭС целесообразно при необходимости решать задачу в окружении, враждебном для человека.

При разработке реальных экспертных систем в большинстве случаев используют так называемые языки искусственного интеллекта типа ЛИСП и ПРОЛОГ.

10.2 Cистемы поддержки принятия решений

Системы поддержки принятия решений (СППР- DecisionSupportSystem - DSS)– это информационные системы, разработанные для помощи  менеджеру (лицу, принимающему решения –ЛПР) в принятии решений управления, объединяя данные, сложные аналитические модели и удобное для него программное обеспечение в единую ИС.

Существенное отличие СППР от вышеописанных экспертных систем состоит в том, что СППР призвана помочь человеку (ЛПР) в решении стоящей перед ним проблемы, а экспертные системы стараются заменить человека при решении некоторой проблемы.

СППР предоставляют возможность ЛПР оценить (ранжировать) альтернативные варианты решения (далее - альтернативы). Решение о выборе альтернативы принимает человек.

При этом существуют вариант без использования критериев и критериальный вариант.

  1.  Вариант без использования критериев оценки альтернатив.

В этом случае СППР должна решить следующие задачи:

  •  сформировать множество альтернативных вариантов решения,
  •  получить результаты сравнения (например, попарного) альтернатив,
  •  выбрать лучшую альтернативу, имеющую наилучший ранг (место), которая и выдается системой в качестве рекомендации.

Пример1:

Для множества {a,b,c,d,e} считаем, что: c > d > a = e > b.

Тогда результат с номерами рангов

№ ранга

Альтернатива

1

c

2

d

3

a, e

4

b

В итоге мы получили структурированное множество, не используя понятия "критерий".

Пример 2. "Метод строчных сумм".

 

Для реализации метода, прежде всего, нужно построить таблицу парных сравнений. Для вышеприведенного примера она выглядит следующим образом.

 

a

b

c

d

e

a

***

1

0

0

½

1,5

b

0

***

0

0

0

0

c

1

1

***

1

1

4

d

1

1

0

***

3

e

½

1

0

0

***

1,5

Наименования строк и столбцов  соответствуют именам альтернатив. На пересечении строки и столбца ставятся числа по следующим правилам:

  •  ставится 1, если альтернатива с именем строки лучше альтернативы с именем столбца,
  •  ставится 0, если альтернатива с именем строки хуже альтернативы с именем столбца,
  •  ставится 1/2, если альтернатива с именем строки равноценна альтернативе с именем столбца.

Клетки таблицы, у которых имя строки совпадает с именем столбца, не заполняются (в нашем примере в этих клетках проставлены "звездочки"). Затем подсчитываются суммы строк (в примере - числа в крайнем справа столбце). Наконец, строится ранжировка альтернатив следующим способом. Альтернативе,  имеющей максимальную строчную сумму присваивается ранг 1. Альтернативе, имеющей следующую по величине сумму, присваивается ранг 2 и так к далее, пока не будут отранжированы все альтернативы. В итоге, получаем ранжировку:

№ ранга

Альтернатива

1

с

2

d

3

a,e

4

b

  1.  Критериальный вариант оценки альтернатив.

При использовании критериальный варианта СППР необходимо решать задачи :

  •  сформировать множество альтернатив,
  •  сформировать множество критериев оценки альтернатив,
  •  получить оценки альтернатив по критериям,
  •  выбрать лучшую альтернативу, которая и выдается системой в качестве рекомендации.

Реализация этого варианта СППР требует решения некоторых нетривиальных проблем:

  •  Учет различной важности критериев.
  •  Выбор способа построения обобщенного критерия (часто называемого "функция полезности"). Важно отметить, что есть методы выбора лучшей альтернативы и без построения обобщенного критерия.

Критерии иногда удобно группировать в виде дерева (иерархии). Например, в Америке получил большое распространение метод анализа иерархий, предложенный Саати.

В этом случае, исходная модель имеет вид следующей таблицы.

k1

>k2

...

km

a1

x11

x12

...

x1m

a2

x21

x22

...

...

...

...

...

...

...

an

xn1

xn2

...

xnm

Имена строк представляют имена альтернатив, имена столбцов - имена критериев. На пересечении i-й строки и j-го столбца записывается оценка xij альтернативы ai по критерию kj Такую форму представления модели выбора  называют "критериальной таблицей".

Наиболее часто используемый метод упорядочивания таблицы – это линейная свертка. (взвешенная сумма). Сначала некоторым образом выбираются весовые коэффициенты критериев. Обозначим их вектором (w1 , w2 ,... , wm). Затем, для каждой альтернативы (каждой i-ой строки таблицы) рассчитывается следующая величина:

si = å xij wj  (сумма берется для всех j от 1 до m).

Результат: чем больше значение si, тем лучше альтернатива ai.

Наибольшие проблемы возникают  с обоснованием критериев. Прежде всего, не всегда удается обосновать тот набор критериев, который необходим и достаточен для решения задачи принятия решения. Еще сложнее обстоит дело с весами критериев. Можно даже сказать, что веса критериев – самое тонкое место в проблеме критериального упорядочения альтернатив. Чаще всего веса назначают, исходя из интуитивного представления о сравнительной важности критериев.

Отметим, что в таблице могут оказаться альтернативы, которые имеют оценки по всем критериям хуже, чем другие альтернативы. Сразу ясно, что такие альтернативы неконкурентоспособны. Их можно смело вычеркивать из таблицы. После вычеркивания заведомо наихудших альтернатив, в таблице остаются только такие альтернативы, которые хотя бы по одному критерию, не хуже, чем другие. Множество таких альтернатив получило название "множество недоминируемых альтернатив", или "множество Парето".

Ориентация на компьютерные информационные технологии позволяет основные функции СППР реализовать аппаратно-программными средствами. При этом реализация автоматизированных СППР возможна в  как в локальном, так и в сетевом варианте (SQL- технологии, Web-  технологии).

Традиционно в качестве областей применения СППР выделяют: микроэкономику, макроэкономику, офисную деятельность, оценку и распространение технологий, юриспруденцию, медицину и другие приложения.

Прогнозирование и планирование деятельности предприятий (от мелких фирм до крупнейших корпораций) является наиболее перспективной сферой практического применения СППР. Для решения проблем в этой сфере в состав СППР включают большой набор методов и моделей, в том числе математическое программирование, статистический анализ, теорию статистических решений и принятия решений при неопределенности, эвристические методы, включающие адаптивность и обучение при решении слабоструктурированных задач, методы теории игр и многие другие подходы.

В последнее время в качестве базы данных СППР все чаще используют хранилище данных (Data Warehous), основанное на многомерных моделях баз данных. (см \\с\study\ТОХОД).

На практических занятиях курса КиТ изучается СППР Assistant Choice.

10.3 Нейронные сети

Нейронные сети- это раздел технологий искусственного интеллекта, в котором для обработки информации используются явления, аналогичные происходящих в нейронах живого существа. Первая модель нейронной сети была разработана в 1943 г.

Нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Все процессы передачи раздражений от нашей кожи, ушей и глаз к мозгу, процессы мышления и управления действиями - все это реализовано в живом организме как передача электрических импульсов между нейронами.
Рассмотрим строение биологического нейрона. Каждый нейрон имеет отростки нервных волокон двух типов
- дендриты, по которым принимаются импульсы, и единственный аксон, по которому нейрон может передавать импульс. Аксон контактирует с дендритами других нейронов через специальные образования - синапсы, которые влияют на силу импульса.

Рис.2. Биологическое строение нейрона

Можно считать, что при прохождении синапса сила импульса меняется в определенное число раз, которое можно считать весом синапса. Импульсы, поступившие к нейрону одновременно по нескольким дендритам, суммируются. Если суммарный импульс превышает некоторый порог, нейрон возбуждается, формирует собственный импульс и передает его далее по аксону. Важно отметить, что веса синапсов могут изменяться со временем, а значит, меняется и поведение соответствующего нейрона.

Нетрудно построить математическую модель описанного процесса.

На рисунке 3 изображена модель нейрона с тремя входами (дендритами), причем синапсы этих дендритов имеют веса w1, w2, w3. Пусть к синапсам поступают импульсы силы x1, x2, x3 соответственно, тогда после прохождения синапсов и дендритов к нейрону поступают импульсы w1x1, w2x2, w3x3. Нейрон преобразует полученный суммарный импульс:

x=w1x1+ w2x2+ w3x3

в соответствии с некоторой передаточной функцией f(x).

Рис 3. Математическая модель нейрона

Сила выходного импульса равна:

y=f(x)=f(w1x1+ w2x2+ w3x3).


Таким образом, нейрон полностью описывается своими весами w
k и передаточной функцией f(x). В зависимости от вида функции f (x) и способа определения весов w i известны такие модели нейронов как модель персептрона (модель МакКаллока- Питса), нейрон сигмоидального типа, нейрон адаптивного типа, нейрон Гроссберга , нейрон Хебба и т.д. 

Получив набор чисел (вектор) xk в качестве входов, нейрон выдает некоторое число y на выходе. 

 

Искусственная нейронная сеть (ИНС, нейросеть) - это набор нейронов, соединенных между собой. Как правило, передаточные функции f (x) всех нейронов в сети фиксированы, а веса w i являются параметрами сети и могут изменяться.

В общем случае архитектуру нейронной сети можно разделить на  однослойную и многослойную модель ( Рис.4).  

 а)       б)

Рис.4 Однослойная (а) и многослойна (б) нейронная сеть

Основной смысл работы нейронной сети заключается в возможности классифицировать (распознавать)  вектор входных сигналов X по заранее обученным образцам этого вектора. Процесс обучения происходит за счет изменения весовых коэффициентов wi.

 

В самом общем случае это происходит следующим образом. Из базы данных образцов выбирается побразец Xi. На выходе сети анализируется выходной вектор Yi, который должен однозначно соответствовать образцу Xi. Если соответствие не наблюдается, анализируется ошибка между выходным сигналом Yi входным сигналом  Xi. В случае большой ошибки происходит корректировка соответствующих весов wi до тех пор пока ошибка не станет равной допустимой величине, процесс обучения останавливается и сеть считается обученной. Затем из базы данных выбирается другой образец  Xi+1  и процесс обучения повторяется (Рис.5). Следует отметить, что для корректировки весов wi в настоящее время разработано большое количество алгоритмов.

Рис.5 Процесс обучения нейронной сети

Пример:

Пусть имеется некоторая база данных, содержащая примеры (набор рукописных изображений букв – 33 буквы, каждая из которой изображается 900 пикселами). В этом случае нейронная сеть будет иметь 900 входов X и 33 выхода Y. Каждой букве должен соответствовать на определенном выходе Yi уровень равный «1».   

Предъявляя изображение буквы "А" на вход сети, мы получаем от нее некоторый ответ, не обязательно верный. Вычисляя разность между желаемым ответом и реальным ответом сети, мы получаем 33 числа - вектор ошибки. С помощью специальных алгоритмов происходит подстройка весов wi  до тех пор пока вектор ошибки не станет минимальным. Таким же образом происходит обучение для всех остальных букв.

Оказывается, что после многократного предъявления образцов веса сети стабилизируются, причем сеть дает правильные ответы на все (или почти все) образцы букв из базы данных. В таком случае говорят, что "сеть выучила все примеры", " сеть обучена", или "сеть натренирована".

После того, как сеть обучена, она может  применяться для решения полезных задач. Важнейшая особенность человеческого мозга состоит в том, что, однажды обучившись определенному процессу, он может верно действовать и в тех ситуациях, в которых он не бывал в процессе обучения. Например, мы можем читать почти любой почерк, даже если видим его первый раз в жизни. Так же и нейросеть, грамотным образом обученная, может с большой вероятностью правильно реагировать на новые, не предъявленные ей ранее данные. Из приведенного выше примера можем нарисовать букву "А" другим почерком, а затем предложить обученной  сети классифицировать новое изображение. Веса обученной сети хранят достаточно много информации о сходстве и различиях букв, поэтому можно рассчитывать на правильный ответ и для нового варианта изображения.

Таким образом использование нейронной сети состоит из трех основных этапов:

 

  1.  Выбор типа (архитектуры) сети.
  2.  Подбор весов (обучение) сети.
  3.  Использование обученной сети для прикладных задач.

Приведем несколько примеров использования нейронных сетей в экономических задах.

ПРИМЕР

На вход сети при обучении подавать информацию о фирме:

X1 = Работающий капитал . Все активы

X2 = Сохраняемая прибыль . Все активы

X3 = Прибыль до капиталовложений и налога . Все активы

X4 = Рыночная стоимость акции . Общий долг

X5 = Величина продаж . Все активы

В качестве образцов выбираются две группы фирм, одна из которых будет представлять обанкротившиеся фирмы, а другая нет, берутся их показатели для формирования входного сигнала, и обучается сеть давать ответ «банкрот» или «не банкрот».

После этого можно брать любую фирму, предъявлять ее показатели сети и сеть будет оценивать фирму как «банкрот» или «не банкрот». Может быть фирма еще не обанкротилась, но давать кредиты такой фирме опасно. Вероятность правильного ответа может достигать 80%-97%.

ПРИМЕР

Задачу прогнозирования курса акций на 1 день вперед.

Пусть у нас имеется база данных, содержащая значения курса за последние 300 дней. Простейший вариант в данном случае - попытаться построить прогноз завтрашней цены на основе курсов за последние несколько дней.

В этом случае прогнозирующая сеть должна иметь всего один выход и столько входов, сколько предыдущих значений мы хотим использовать для прогноза - например, 4 последних значения.

Образцом для обучения служит известный курс акций на пятый день после любых последовательно взятых 4- дней.

После обучения на вход нейронной сети подаются курсы последних 4- х дней и сеть определяет курс на следующий день. При увеличении количества входов достоверность прогноза будет возрастать.

Отметим, что для использования нейронных сетей  в настоящее время существуют специальные программные продукты  NeuroOffice, NeuroPro, NeuroInterator  и д.р.

10.4 Системы поддержки принятия решения на основе нечетких множеств

ДЛЯ САМОСТОЯТЕЛЬНОЙ ПОДГОТОВКИ !

PAGE  

PAGE  5


 

А также другие работы, которые могут Вас заинтересовать

66002. Золотовалютный резерв РФ 2009-2011 146.67 KB
  Золотовалютные резервы Российской Федерации представляют собой высоколиквидные финансовые активы находящиеся в распоряжении Банка России и Минфина России. Управление резервами Банк России осуществляет в соответствии с действующим...
66003. Организация экономического сотрудничества и развития (ОЭСР) 24.2 KB
  ОЭСР была образована в 1961 году по инициативе США на базе Организации европейского экономического сотрудничества которая координировала американскую и канадскую помощь пострадавшим от Второй мировой войны европейским странам в рамках плана Маршалла.
66005. Европейский банк реконструкции и развития, Европейский инвестиционный банк, Европейский центральный банк, Европейская экономическая комиссия Организации Объединенных Наций, Европейская ассоциация свободной торговли, Европейское экономическое пространство 189.5 KB
  О ЕБРР Европейский банк реконструкции и развития является международной финансовой организацией которая финансирует проекты в 29 странах от Центральной Европы до Центральной Азии. для стран Центральной и Юго-Восточной Европы а также Восточной Европы и Кавказа указав что дальнейшее ухудшение...
66006. Понятие, сущность, возможности СЭЗ 30.02 KB
  Такие зоны создаются для решения внешнеторговых общеэкономических социальных и научно-технических проблем. По оценкам западных специалистов к 2010 году через различные свободные экономические зоны будет проходить до 30 мирового товарооборота.
66007. Бюжетная политика 13.79 KB
  От качества федерального бюджета заложенных в него параметров зависят и уровень социальной защиты граждан и инвестиционные возможности государства и степень влияния России на международной арене и даже предпринимательская активность граждан.
66009. Финансовая система России 31.78 KB
  Государственный и банковский кредит все вышеозначенные институты относят к централизованным финансам которые используются для регулирования экономики и социальных отношений на макроуровне; Финансы хозяйствующих субъектов и отраслей относящиеся к децентрализованным финансам...
66010. Государственные предприятия, государственные корпорации, объединения предприятий, дочерние и зависимые общества 59 KB
  Все они направлены на использование преимуществ крупного капитала но отличаются друг от друга: Конкретными стратегическими целями и текущими задачами которые ставятся объединением ; Структурой участников; Установленными имущественными и правовыми отношениями; Понятие и сущность...