14562

ЕКСПЕРТНІ СИСТЕМИ

Конспект

Информатика, кибернетика и программирование

Опорний конспект з курсу Експертні СИСТЕМИ Вступ В середині 90х років минулого сторіччя відбулася зустріч Роберта Меткалфа винахідника Ethernet і знаменитого професора з штучного інтелекту Едварда Фейгенбаума. У дискусії що відбулася двох учених були порушені ...

Русский

2013-06-06

227.5 KB

13 чел.

Опорний конспект

з курсу

"Експертні СИСТЕМИ"

Вступ

В середині 90-х років минулого сторіччя відбулася зустріч Роберта Меткалфа, винахідника Ethernet, і знаменитого професора з штучного інтелекту Едварда Фейгенбаума. У дискусії, що відбулася двох учених були порушені питання, пов'язані зі станом справ в області штучного інтелекту. Скептично налаштований Меткалф говорив: "Незважаючи на всі кошти, витрачені з 1969 року (року повального захоплення проблемами штучного інтелекту) на роботи по штучному  інтелекту, комп'ютер досі не може розібрати примітивного усного мовлення і прочитати навіть великі букви моєї рукопису ". Професор Фейгенбаум визнав, що "протягом довгого часу від штучного інтелекту очікувалася велика віддача, ніж він міг дати, і компанії втратили масу грошей, безуспішно намагаючись використовувати його в бізнесі". Однак, продовжував він, "останнім часом, як він переконаний, штучний інтелект прекрасно окупує вкладені кошти, в основному у вигляді так званих експертних систем і баз знань, здатних приймати і аргументувати логічні рішення".
Так, в "класичному" або "традиційному" штучному інтелекті, як зараз називають його символьний напрямок, успішно створюються і розвиваються експертні системи або системи, засновані на знаннях, для широкого кола предметних областей.

Едварда Фейгенбаума називають "батьком експертних систем", як це значиться на обкладинці однієї з його книг "Становлення експертної компанії". Він дійсно стояв біля витоків експертної індустрії і створив першу експертну систему DENDRAL в області ідентифікації органічних сполук за допомогою аналізу мас-спектрограм. Далі Фейгенбаум разом з Шортліфом і Букхененом спроектували першу медичну експертную систему MYCIN, при цьому вони зробили відкриття, якому було призначено істотно розширити сферу створення та використання експертних систем. Коли вони видалили з системи MYCIN базу знань (конкретну медичну інформацію), то залишилася частина, так звана "машина логічного висновку". Було показано, що базу знань можна змінювати і заміняти повністю, не порушуючи цілісності системи. Так виникла EMYCIN (Empty MYCIN - порожній MYCIN) або перша експертна оболонка – інструментальне середовище для побудови експертних систем різного призначення. З тих пір (з середини 70-х років XX сторіччя) з'явилася велика кількість подібних інструментальних систем MicroExpert, GURU, G2, JESS, CLIPS  та ін


Лекція 1.

Тема 2. Моделі представлення знань та системи, засновані на знаннях.

2.1. Знання і дані

Якщо у вас є проблема чи завдання, яке можна вирішити самостійно - ви звертаєтеся до знаючих людей, або до експертів, до тих, хто володіє  ЗНАННЯМИ. Термін "системи, засновані на знаннях" (knowledge-based systems) з'явився в 1976 році одночасно з першими системами, аккумулюючими досвід і знання експертів. Це були експертні системи (expert systems) MYCIN і DENDRAL [Shortliffe, 1976; Shortliffe Feigenbaum, Buchanan, 1978] для медицини і хімії. Вони ставили діагноз при інфекційних захворюваннях крові і розшифровували дані мас-спектрографічних аналізу.

Експертні системи з'явилися в рамках досліджень з штучного інтелекту (ШІ) (artificial intelligence) в той період, коли ця наука переживала серйозна криза, і був потрібний істотний прорив у розвитку практичних додатків. Цей прорив стався, коли на зміну пошукам універсального алгоритму мислення і розв'язання задач дослідникам прийшла ідея моделювати конкретні знання фахівців-експертів. Так в США з'явилися перші комерційні системи, засновані на знаннях чи експертні системи (ЕС). Ці системи по праву стали першими інтелектуальними системами, і досі єдиним критерієм интеллектуальності у яких є наявність механізмів роботи із знаннями.

Так з'явився новий підхід до вирішення завдань штучного інтелекту - представлення знань.

Докладніше про історію штучного інтелекту можна почитати в [Поспєлов, 1986; Джексон, 2001; Гаврилова, Хорошевський, 2001; Ендрю, 1985 |.

При вивченні інтелектуальних систем традиційно виникає питання - що ж таке знання і чим вони відрізняються від звичайних даних, десятиліттями оброблюваних на комп'ютерах. Можна запропонувати кілька робочих визначень, в рамках яких це стає очевидним.

Визначення 1.1

Дані - це інформація, отримана в результаті спостережень або вимірювань окремих властивостей (атрибутів), що характеризують об'єкти, процеси і явища предметної області.

Інакше, дані - це конкретні факти, такі як температура повітря, висота будівлі, прізвище співробітника, адреса сайту і пр.

При обробці на ЕОМ дані трансформуються, умовно проходячи наступні етапи:

 D1 - дані як результат вимірювань і спостережень;

 D2 - дані на матеріальних носіях інформації (таблиці, протоколи, довідники);

 D3 - моделі (структури) даних у вигляді діаграм, графіків, функцій;

 D4 - дані в комп'ютері на мові опису даних;

 D5 - бази даних на машинних носіях інформації.

Знання ж засновані на даних, отриманих емпіричним шляхом. Вони являють собою результат досвіду та розумової діяльності людини, спрямованої на узагальнення цього досвіду, отриманого в результаті практичної діяльності.

ПРИКЛАД:

Так, якщо озброїти людину даними про те, що у нього висока температура (результат спостереження або вимірювання), то цей факт не дозволить йому вирішити завдання одужання. А якщо досвідчений лікар поділиться знаннями про те, що температуру можна знизити жарознижуючими препаратами і рясним питвом, то це суттєво наблизить рішення задачі одужання, хоча насправді потрібні додаткові дані і більш глибокі знання.

Визначення 1.2

Знання -  це зв'язки і закономірності предметної області (принципи, моделі, закони), отримані в результаті практичної діяльності і професійного досвіду, що дозволяє фахівцям ставити і вирішувати завдання в даній області.

При обробці на ЕОМ знання трансформуються аналогічно даним:

Z1 - знання в пам'яті людини як результат аналізу досвіду і мислення;

   Z2 - матеріальні носії знань (спеціальна література, підручники, методичні посібники);

Z3 - поле знань - умовний опис основних об'єктів предметної області, їх атрибутів і закономірностей, що їх зв'язують;

  Z4 - знання, описані на мовах представлення знань (Продукційні мови, семантичні мережі, фрейми);

Z5 - база знань на машинних носіях інформації. Часто використовується і таке визначення знань:

Знання - це добре структуровані дані, або дані про дані, або метадані.

Ключовим етапом при роботі зі знаннями є формування поля знань (третій етап Z3), ця нетривіальна задача включає виявлення і визначення об'єктів і понять предметної області, їх властивостей і зв'язків між ними, а також подання їх у наочній і інтуїтивно зрозумілій формі. Цей термін вперше був введений при практичній розробці експертної системи з психодіагностики АВТАНТЕСТ [Гаврилова, 1984] і тепер широко використовується розробниками ЕС.

Без ретельного опрацювання поля знань не може бути мови про створення бази знань.

Істотним для розуміння природи знань є способи визначення понять. Один із широко застосовуваних способів заснований на ідеї інтенсіоналу і екстенсіоналу.

Визначення 1.3

Інтенсіонал поняття - це визначення його через співвіднесення з поняттям більш високого рівня абстракції із зазначенням специфічних властивостей.

Наприклад, інтенсіонал поняття "МЕБЛІ": "предмети, призначені для забезпечення комфортного проживання людини і захаращують будинок".

Визначення 1.4

Екстенсіонал поняття - це визначення поняття через перерахування його конкретних прикладів, тобто понять більш низького рівня абстракції.

Екстенсіонал поняття "МЕБЛІ": "Шафа, диван, стіл, стілець і т. д.".

Інтенсіонали формують знання про об'єкти, в той час як екстенсіонал об'єднує дані. Разом вони формують елементи поля знань конкретної предметної області.

Для зберігання даних використовуються бази даних (для них характерні великий обсяг і відносно невелика питома вартості інформації), для зберігання знань - бази знань (невеликого обсягу, але дуже дорогі інформаційні масиви).

База знань - основа будь-якої інтелектуальної системи, де знання описані на деякій мові представлення знань, наближеному до природного.

Знання можна розділити на:

 глибинні;

 поверхневі.

Поверхневі - знання про видимі взаємозв'язки між окремими подіями і фактами в наочній області.

Глибинні - абстракції, аналогії, схеми, що відображають структуру і природу процесів, що протікають в предметної області. Ці знання пояснюють явища і можуть використовуватися для прогнозування поведінки об'єктів.

Поверхневі знання

"Якщо ввести правильний пароль, на екрані комп'ютера з'явиться зображення робочого столу".

Глибинні знання

"Розуміння принципів роботи операційної системи і знання на рівні кваліфікованого системного адміністратора".

Сучасні експертні системи працюють, в основному, з поверхневими знаннями. Це пов'язано з тим, що на даний момент немає універсальних методик, що дозволяють виявляти глибинні структури знань і працювати з ними.

Крім того, в підручниках з ШІ знання традиційно ділять на процедурні та декларативні. Історично первинними були процедурні знання, тобто знання, "розчинені" в алгоритмах. Вони управляли даними. Для їх змін потрібно було змінювати текст програм. Однак з розвитком інформатики і програмного забезпечення все більша частина знань зосереджувалась у структурах даних (таблиці, списки, абстрактні типи даних), тобто збільшувалася роль декларативних знань.

.

Сьогодні знання придбали чисто декларативну форму, тобто знаннями вважаються пропозиції, записані на мовах представлення знань, наближених до природної мови і зрозумілих неспеціалістам.

Один з піонерів  ШІ Алан Ньюелл проілюстрував еволюцію засобів спілкування людини з комп'ютером як перехід від машинних кодів через символьні мови програмування до мов представлення знань (рис. 1.1).

2.2. Моделі представлення знань

В даний час розроблені десятки моделей (або мов) представлення знань для різних предметних областей. Більшість з них може бути зведене до наступних класів:

 продукційні моделі;

 семантичні мережі;

 фрейми;

 формальні логічні моделі.

У свою чергу цю безліч класів можна розбити на дві великі групи (рис. 1.2):

 модульні;

 мережеві.

Модульні мови оперують окремими (не пов'язаними) елементами знань, будь то правила або аксіоми предметної області.

Мережеві мови надають можливість пов'язувати ці елементи або фрагменти знань через відносини в семантичні мережі або мережі фреймів.

Розглянемо докладніше найбільш популярні у розробників мови представлення знань (ЯПЗ).

2.2.1. Продукційна модель 

ЯПЗ, засновані на правилах (rule-based), є найбільш поширеною і більше 80% ЕС використовують саме їх. 

Визначення 1.5 


Продукційна модель або модель, заснована на правилах, дозволяє представити знання у вигляді пропозицій типу "Якщо (умова), то (дія)". 

Під "умовою" (антецедентом) розуміється деяке пропозицію-зразок, за яким здійснюється пошук у базі знань, а під "дією" (консеквентом) - дії, що виконуються при успішному результаті пошуку (вони можуть бути проміжними, виступаючими далі як умови, і термінальними або цільовими, завершальними роботу системи). 
Найчастіше висновок на такій базі знань буває
прямий (від даних до пошуку мети) або зворотний (від мети для її підтвердження - до даних). Дані - це вихідні факти, що зберігаються в базі фактів, на підставі яких  запускається машина виводу або інтерпретатор правил, що перебирає  правила з продукційної бази знань.. 
Продукційна, модель так часто застосовується в промислових експертних системах, оскільки захроплює розробників своєю наочністю, високою модульність, легкістю внесення доповнень і змін і простотою механізму логічного висновку. 
Є велика кількість програмних засобів, що реалізують Продукційний підхід (наприклад, мови високого рівня CLIPS і OPS 5; "оболонки" або "порожні" ЕС - EXSYS Professional і Карра, інструмені системи КЕЕ, ARTS, PIES [Хорошевський, 1993]), а також промислових ЕС на його основі (наприклад, ЕС, створених засобами G2 [Попов, 1996]). Докладніше див [Попов, Фоміних та ін, 1996; Хорошевський, 1993; Гаврилова, Хорошев ¬ ський, 2001; Durkin, 1998]. 

2.2.2. Семантичні мережі

Термін "семантична" означає "смислова", а сама семантика - це наука, що встановлює відносини між символами та об'єктами, які вони позначають, тобто наука, що визначає сенс знаків. Модель на основі семантичних мереж була запропонована американським психологом Куілліа-ном. Основною її перевагою є те, що вона більше інших відповідних сучасним уявленням про організацію довготривалої пам'яті людини [Скрегг, 1983].

Визначення 1.6

Семантична мережа - це орієнтований граф, вершини якого - поняття, а дуги - відносини між ними.

В якості понять зазвичай виступають абстрактні або конкретні об'єкти, а відносини це зв'язки типу: "це" ("АКО - A-Kind-Of"," is "або" елемент класу ")," має частиною "(" has part ")," належить "," любить ".

Можна запропонувати кілька класифікацій семантичних мереж, пов'язаних з типами відношень між поняттями.

-За кількістю типів відносин:

• однорідні (з єдиним типом відносин);

• неоднорідні (з різними типами відносин).

-За типами відносин:

• бінарні (в яких відносини пов'язують два об'єкти);

• N-арні (в яких є спеціальні відносини, що зв'язують більше двох понять).

Найбільш часто в семантичних мережах використовуються наступні відносини:

• елемент класу (троянда це квітка);

• атрибутивні зв'язки / мати властивість (пам'ять має властивість - обсяг);

• значення властивості (колір має значення - жовтий);

• приклад елемента класу (троянда, наприклад - чайна);

• зв'язки типу "частина-ціле" (велосипед включає кермо);

• функціональні зв'язки (які визначаються зазвичай дієсловами "виробляє", "впливає" ...);

• кількісні (більше, менше, дорівнює ...);

• просторові (далеко від, близько від, за, під, над ...);

• тимчасові (раніше, пізніше, протягом ...);

• логічні зв'язки (і, або, не) та ін

Мінімальний склад відносин в семантичній мережі такий:

• елемент класу або АКО;

• атрибутивні зв'язки / мати властивість;

• значення властивості.

Недоліком цієї моделі є складність організації процедури організації виведення на семантичній мережі.

Ця проблема зводиться до нетривіальної задачі пошуку фрагмента мережі, відповідного деякій підмережі, що відбиває поставлений запит до бази.

На рис. 1.3 зображено приклад семантичної мережі. В якості вершин тут виступають поняття "людина", "т. Смирнов", "Audi A4", "автомобіль", "вид транспорту" і "двигун".

Рис. 1.3. Семантическая сеть

Для реалізації семантичних мереж існують спеціальні мережеві мови, наприклад, NET [Цейтін, 1985], мову реалізації систем SIMER + MIR [Осипов, 1997] та ін Широко відомі експертні системи, що використовують семантичні мережі в якості мови представлення знань - PROSPECTOR, CASNET, TORUS [Хейес-Рот та ін, 1987; Durkin, 1998].

2.2.3. Фрейми

Термін фрейм (від англ. Frame - "каркас" або "рамка") був запропонований Марвіном Мінським [Мінський, 1979], одним з піонерів ШІ, в 70-і роки для позначення структури знань для сприйняття просторових сцен. Ця модель, як і семантична мережа, має глибоке психологічне обгрунтування.

Визначення 1.7

Фрейм - це абстрактний образ для представлення стереотипу об'єкта, поняття чи ситуації.

Інтуїтивно зрозуміло, що під абстрактним чином розуміється деяка узагальнена і спрощена модель або структура. Наприклад, проголошення вголос слова "кімната" породжує у слухаючих образ кімнати: "житлове приміщення з чотирма стінами, підлогою, стелею, вікнами та дверима, площею 6-20 м2". З цього опису нічого не можна прибрати (наприклад, прибравши вікна, ми отримаємо вже комору, а не кімнату), але в ньому є "дірки" або "слоти" - це незаповнені значення деяких атрибутів - наприклад, кількість вікон, колір стін, висота стелі , покриття підлоги і ін.

У теорії фреймів такий образ кімнати називається фреймом кімнати. Фреймом також називається і формалізована модель для відображення образу.

Розрізняють фрейми-зразки або прототипи, що зберігаються в базі знань, і фрейми-екземпляри, які створюються для відображення реальних фактичних ситуацій на основі даних, що надходять. Модель фрейма є достатньо універсальною, оскільки дозволяє відобразити все різноманіття знань про світ через:

фрейми-структури, що використовуються для позначення об'єктів і понять (позика, застава, вексель);

фрейми-ролі (менеджер, касир, клієнт);

фрейми-сценарії (банкрутство, збори акціонерів, святкування іменин);

фрейми-ситуації (тривога, аварія, робочий режим пристрою) і ін

Традиційно структура фрейму може бути представлена ​​як список властивостей:

(Ім'я фрейму:

(Ім'я 1-го слота: значення 1-го слота),

(Ім'я 2-го слота: значення 2-го слота),

................

(Ім'я N-гo слота: значення N-го слота)).

Ту ж запис можна представити у вигляді таблиці (див. табл. 1.1), доповнивши її двома стовпцями.

Таблиця 1.1. Структура фрейма

Имя фрейма 

Имя слота 

Значение слота 

Способ получения значения 

Присоединенная процедура 

У таблиці додаткові стовпці (3-й і 4-й) призначені для описування способу отримання слотом його значення і можливого приєднання до того чи іншого слоту спеціальних процедур, що допускається в теорії фреймів. Як значення слота може виступати ім'я іншого фрейма, так утворюються мережі фреймів.

Існує декілька способів отримання слотом значень у фреймі-екземплярі:

• за замовчуванням від фрейму-зразка (Default-значення);

• через успадкування властивостей від фрейму, зазначеного у слоті АКО;

• за формулою, зазначеною у слоті;

• через приєднану процедуру;

• явно з діалогу з користувачем;

• з бази даних.

Найважливішою властивістю теорії фреймів є запозичення з теорії семантичних мереж - так зване спадкування властивостей. І під Фреймах, і в семантичних мережах спадкування відбувається за АКО-зв'язків (A-Kind-Of = це). Слот АКО вказує на фрейм більш високого рівня ієрархії, звідки неявно успадковуються, тобто переносяться, значення аналогічних слотів.

Наприклад, в мережі фреймів на рис. 1.4 поняття "учень" успадковує властивості фреймів "дитина" і "людина", які знаходяться на більш високому рівні ієрархії. На запитання "чи люблять учні солодке?" слід відповідь "так", оскільки цим властивістю володіють всі діти, що зазначено у фреймі "дитина". Спадкування властивостей може бути частковим: вік для учнів не Наслідується з фрейма "дитина", оскільки вказаний явно в своєму власному фреймі.

Рис. 1.4. Сеть фреймов

Основною перевагою фреймів як моделі подання знань является те, що вона відображає концептуальну основу організації пам'яті людини [Шенк, Хантер, 1987], а також її гнучкість і наочність.

Спеціальні мови представлення знань в мережах фреймів FRL (Frame Representation Language) [Байдун, Бунін, 1990], KRL (Knowledge Representa ¬ tion Language) [Уотермен, 1989], фреймова "оболонка" Kappa [Стрельников, Борисов, 1997] та інші програмні засоби дозволяють ефективно будувати промислові ЕС. Широко відомі такі фрейм-орієнтований ¬ ні експертні системи, як ANALYST, Модісе, TRISTAN, ALTERID [Ковригін, Перфильев, 1988; Ніколов, 1988; Sisodia, Warkentin, 1992].

2.2.4. Формальні логічні моделі

Традиційно в поданні знань виділяють формальні логічні моеіли, засновані на класичному численні предикатів 1-го порядку, коли предметна область або задача описується у вигляді набору аксіом. Реально числення предикатів 1-го порядку в промислових експертних системах практично не використовується. Ця логічна модель застосовна в основному в дослідницьких "іграшкових" системах, т. я. висуває дуже високі вимоги і обмеження до предметної області. У промислових же експертних системах використовуються різні її модифікації і розширення, виклад яких виходить за рамки курсу. Див [Ада-Менкен, Кучуков, 2003].

  1.  А. П. Частиков Т. А. Гаврилова Д. Л.Белов РАЗРАБОТКА ЭКСПЕРТНЫХ СИСТЕМ. СРЕДА CLIPS Санкт-Петербург . «БХВ-Петербург» - 2003


 

А также другие работы, которые могут Вас заинтересовать

17798. Парабола 1021.92 KB
  Лекція 14 Парабола Нехай на площині дано точку F і пряму d яка не проходить через F. Геометричне місце точок площини рівновіддалених від фіксованої точки F та фіксованої прямої d що не проходить через точку F називається параболою. Точка F називається
17800. Поверхні другого порядку 3.67 MB
  Лекція 15. Поверхні другого порядку Загальне рівняння поверхні другого порядку Загальним рівнянням поверхні другого порядку називається рівняння виду 15.1 Розглянемо типи поверхонь які визначаються цим рівнянням. Довільна циліндрична поверх
17801. Обернена матриця 175.61 KB
  Лекція 7. Обернена матриця Матрицею А оберненою до квадратної матриці розміру n х n називається така для якої справедлива рівність 3.32 Наприклад легко перевірити рівність = Таким чином одна із перемножуваних матриць є оберненою від
17802. МІЖНАРОДНА ЕКОНОМІЧНА СИСТЕМА 275.5 KB
  ТЕМА 1. МІЖНАРОДНА ЕКОНОМІЧНА СИСТЕМА Предмет курсу €œміжнародна економіка€. Міжнародна економічна система: сутність та структура. Міжнародні економічні відносини. Міжнародна економічна діяльність. Сукупність національних економік. Класифікація країн за рівнем со
17803. Міжнародна торгівля 1.42 MB
  Міжнародна торгівля Місце міжнародної торгівлі в МЕВ. Світовий ринок товарів і послуг та особливості його розвитку в сучасних умовах. Показники масштабів структури динаміки й результативності міжнародної торгівлі. Еволюція теорій міжнародної торгівлі. Вид
17804. МІЖНАРОДНІ ІНВЕСТИЦІЇ 565.5 KB
  Причини і суть міжнародного руху капіталу. Форми іноземних інвестицій. Транснаціональні корпорації та їх роль в сучасному розвитку міжнародних економічних відносин. Стан та проблеми іноземного інвестування в Україні.
17805. МІЖНАРОДНИЙ КРЕДИТ 170 KB
  Тема 4. МІЖНАРОДНИЙ КРЕДИТ Міжнародний кредит та його роль в міжнародних економічних відносинах. Форми та види міжнародного кредиту. Світовий фінансовий ринок. Міжнародні валютнофінансові організації. Проблема заборгованості та можливі шляхи її розв’язання. 1. М...
17806. МІЖНАРОДНА МІГРАЦІЯ РОБОЧОЇ СИЛИ 336 KB
  Тема 5. Міжнародна міграція робочої сили Міграція населення і міграція робочої сили. Суть і чинники міжнародної міграції робочої сили. Види міжнародної міграції робочої сили. Види міжнародної міграції: кінцева тимчасова сезонна маятникова добровільна примусова ро...