23663

Приобретение и формализация Знаний

Лекция

Информатика, кибернетика и программирование

Одной из них является чтректура получившая название дерево решений. Вместе с тем использование дерева решений может быть эффективно там где знания представляются в виде правил. Структура дерева решений иллюстрирует отношения которые должны быть установлены между правилами в хорошо организованной БЗ. Представление знаний в виде дерева решений Базируясь на знаниях эксперта графически диаграмму всех возможных исходов данной консультации можно представить в виде рис.

Русский

2013-08-05

465 KB

7 чел.

8

© SerP   С.Хабаров  - Лекция по курсу "Информационные технологии " (8 стр.)  стр. 8

3. Приобретение и формализация Знаний

Важным этапом при создании БЗ является этап приобретения знаний. На этом этапе разнообразный набор фактов о некотором предмете должен быть представлен в виде некоторой обобщенной структуры. Одной из них является чтректура, получившая название «дерево решений».

Это один из простейших способов представления фактов и его применение ограниченно. Вместе с тем, использование дерева решений может быть эффективно там, где знания представляются в виде правил.

Данный подход будет рассмотрен с единственной целью: показать, как знания о конкретной предметной области могут быть формализованы до уровня структуры БЗ некоторой экспертной системы.

Структура дерева решений иллюстрирует отношения, которые должны быть установлены между правилами в хорошо организованной БЗ. Данный подход можно реализовать в системе Микроэксперт для IBM PC и многих других, более современных оболочках ЭС.

3.1. Формализация задачи

Представим себе, что мы присутствуем при беседе, когда специалиста в области ботаники по телефону просят определить тип некоторого растения. Так как он не видит конкретный экземпляр, а спрашивающий не является специалистом в области ботаники, то консультирующий задает ряд вопросов, чтобы получить сведения, необходимые для решения задачи.

Один из вариантов такой консультации может быть представлен в графической форме (рис. 3.1).

Рис. 3.1. «Телефонная консультация»


Результатом такой консультации будет вывод: «Основываясь на Вашем ответе, можно предположить, что тип растения – дерево».

Однако данная диаграмма иллюстрирует только один из возможных вариантов вопросов и ответов (т. е. экспертизы). Аналогичным образом можно представить и все другие варианты ответов, и ход консультации.

Что же позволяет специалисту провести такую консультацию и определить как последовательность вопросов, так и их содержание в зависимости от ответов опрашиваемого? Ответ один: его знания в конкретной предметной области, в которой он является специалистом, (экспертом).

3.2. Представление знаний в виде «дерева решений»

Базируясь на знаниях эксперта графически диаграмму всех возможных исходов данной консультации можно представить в виде рис. 3.2.

Рис. 3.2. Дерево решения задачи

Это графическое представление модели данных называется «деревом решения», которое объединяет все ветви поиска типа неизвестное растение.

Но если консультация ЭС должна быть более глубокой и определять, например, класс растения, то в этом случае для «типа растения – дерево» должно быть построено свое «дерево решений», которое после получения знаний от специалиста можно представить в виде рис. 3.3.

Как видно, новая часть будет «поддеревом» исходного «дерева решений».

Рис. 3.3. «Поддерево-1» решения задачи

Существует несколько причин, по которым все «дерево решений» разбивается на секции:

  •  «дерево решений» быстро становится длинным и труднообозримым;
  •  деление «дерева решений» на секции упрощает запоминание цели, которая преследуется в процессе приобретения знаний.

Когда «поддерево» создано, заключительная его часть может быть скопирована в корень вновь создаваемой ветви «дерева решений», и для нее на основе знаний, получаемых от эксперта, может быть построено свое «поддерево решений» (рис. 3.4) и т. д.

Рис. 3.4. «Поддерево-2» решения задачи

Диаграммы, приведенные на рис. 3.2 – 3.4 - это модель незаконченной ботанической БЗ, которая решает только узкую часть общей задачи.

На основе изложенного можно сделать вывод, что при разработке модели БЗ любой предметной области на основе «дерева решений» необходимо:

  •  общую задачу разбить на ряд подзадач;
  •  для каждой из подзадачи разработать свое «дерево решений» (это упростит создание и отладку БЗ).

  1.  Формирование правил на основе дерева решений

На примере задачи об идентификации типа растения рассмотрим, как «дерево решений» можно представить в виде правил.

Первым этапом формирования правил является перевод «дерева решений» из вопросов-ответов в утверждения-факты. Графически для рис. 3.2 это будет соответствовать представлению в виде рис. 3.5.

Рис. 3.5. Формирование правил

Аналогичные преобразования могут быть выполнены для всех «поддеревьев» «дерева решений».

Общим для них является то, что все утверждения представляются предложениями которые состоят из <атрибута>, <предиката>,<значения>.

Например:

<тип растения> <является>  <дерево>

<стебель>  <является >  <зеленый>

В данной трактовке:

Атрибут - это ключевое слово или фраза, описывающая некоторое качество, о котором мы пытаемся найти информацию.

Значение - это описание, назначенное атрибуту.

Предикат - это элемент, указывающий на отношения между атрибутом и его значением.

Более строго это понятие будет определено в следующих разделах. На этом этапе мы предполагаем, что между атрибутом и его значением существует только одно отношение – являться (принадлежать, быть), которое для кратности будем обозначать IS.

Следует отметить, что в простейших ЭС, в том числе и в Микроэксперт для PC, единственно используемым также является предикат IS.

Тогда все множество фактов для «дерева решений» можно представить набором предложений (таблица 3.1).

Таблица 3.1

Факты

Атрибут

Предикат

Значение

Тип растения

Is

Травянистые

Дерево

Кустарниковые

Лиановые

Стебель

Is

Зеленый

Древесный

Положение стебля

Is

Прямое

Стелется

Основной стебель

Is

Один

Несколько

Непротиворечивое подмножество этих фактов будет составлять БД экспертной системы.

Решение любой задачи на этой БД можно получить с помощью правил, из которых формируется БЗ. Набор правил на основе «дерева решений» формируется исходя из:

  •  каждая ветвь дерева решений от ее начала до конца образует правило;
  •  предложения в дереве решений расположен до стрелки образуют условную часть правила, а после стрелки - заключение правила;
  •  ветвь в которой нет заключения не может быть представлена в виде правила;
  •  каждое предложение условной части правила представляет собой конъюнктивный член, т. е. предложения соединяются логической коннъюнкцией («и»).

Пример:

ЕСЛИ стебель  IS древесный

И положение   IS прямое

И основной стебель IS один

ТО  тип растения  IS дерево

В некоторых языках программирования и оболочках экспертных систем используется более короткая запись правил:

  •  исключается предлог «то»;
  •  вместо логического «и» используется запятая;
  •  предикат записывается в скобочном виде.

В этом случае приведенное выше правило можно записать в виде:

IS (type_of_plant, tree) if IS (stream, woody),

IS (position, upright),

IS (main_treak, one).

  1.  Дополнительная информация, включаемая в БЗ

В состав БЗ могут дополнительно включаться вспомогательные информационные элементы, облегчающие работу пользователя с ЭС и делающие диалог с пользователя с ЭВМ более подробным и осмысленным. Одним из таких элементов могут являться подсказки.

Подсказка - это вопрос, который появляется на экране для получения от пользователя информации о некотором атрибуте, значение которого на текущий момент неизвестно.

Подсказка представляет собой строку символов - каждый атрибут должен иметь только одну подсказку ассоциируемую с ним. Если нет запроса о некотором атрибуте, то он не имеет подсказки.

Пример подсказки в БЗ:

promt положение     Promt <атрибут>

Положение стебля – стоит прямо или стелется ? <строки подсказки>

Правила, записанные в сжатой форме, могут быть непонятны для непрофессионального пользователя. Атрибуты, вводимые в виде коротких фраз, позволяют минимизировать объем памяти, необходимый для хранения правила, и ускорить его ввод и обработку.

Для того чтобы сделать правило более понятным и информативным, каждому атрибуту можно поставить в соответствие его перевод.

Перевод - это строка символов, которая применяется для пояснения атрибута.

Пример:

Предложение: стебель является зеленый   trans <атрибут>

Атрибут - «стебель»     <строки перевода>

Возможные значения - «зеленый», «древесный»

Перевод для атрибута – «стебель растения»

В этом примере при появлении в правиле атрибута «стебель» он будет заменен переводом «стебель растения», после чего для окончания предложения система сама добавит предикат «является» и значение, соответствующее данному атрибуту.

Рассмотренный синтаксис подсказок и правил типичен для системы Микроэксперт. Они вместе с набором правил составляют БЗ Микроэксперта и могут быть помещены в БЗ в любом порядке.


 

А также другие работы, которые могут Вас заинтересовать

42723. Основы языка С# и знакомство с основными элементами управления C# 430 KB
  В C как и в C C нумерация элементов массива идет с нуля. Естественно что в нашем примере у массива 6 =23 элементов k[00] первый k[12] последний.rry Элемент Вид Описание Length Свойство Количество элементов массива по всем размерностям Rnk Свойство Количество размерностей массива BinrySerch Статический метод Двоичный поиск в отсортированном массиве Cler Статический метод Присваивание элементам массива значений по умолчанию Copy Статический метод Копирование заданного диапазона элементов одного массива в другой массив CopyTo...
42724. Исследование электрических величин двухобмоточного однофазного трансформатора 119 KB
  Исследование электрических величин двухобмоточного однофазного трансформатора. Цель работы: изучить конструкцию однофазного трансформатора описать принцип его действия замерить величины в различных режимах работы в масштабе построить характеристики и векторные диаграммы. б Коэффициент трансформации трансформатора зависит . в В режиме холостого хода с увеличением напряжения коэффициент мощности трансформатора .
42725. Методы классификации основанные на сравнении с эталоном 732 KB
  Поэтому обычно возникает необходимость сократить это число посредством выделения информативных признаков которые предполагаются инвариантными или малочувствительными по отношению к изменениям и искажениям. Результаты измерений признаков отображаются в пространство признаков. В этом случае будут установлены границы областей принятия решений для разделения признаков новых фрагментов подлежащих классификации см. Первая задача заключается в выборе подмножества признаков и их упорядочиванию в заданном множестве измерений.
42726. Строки и регулярные выражения 300 KB
  String Работа с функциями класса StringBuilder Работа с регулярными выражениями. В C есть тип string но класс System. Пример использования: String s= qqq ; int k=s. Пример использования: nmespce test { clss Test { public sttic void Min { String s1= rbour s2= ce s3= zote ; System.
42727. Запільна блок-схема 28.5 KB
  Накресліть схему лінійного алгоритму. Накресліть схему розгалуженого алгоритму. Як конструювати схему алгоритму.
42729. Найти минимальную сумму элементов в строках двумерного массива 58 KB
  Для проверки подлинности работы программы необходимо сверить результаты работы программы и результаты ручного тестирования. Если они сойдутся, то программа выполнена правильно. Для упрощения вычислений заполним массив цифрами
42730. ЛИНЕЙНЫЕ МЕТОДЫ КЛАССИФИКАЦИИ 178.5 KB
  В данной лабораторной работе мы будем рассматривать способ построения линейного решающего правила на основе обучения одного формального нейрона. Модель нейрона Нейрон представляет собой формализованную модель биологического нейрона.4 Простейший нейрон В общем виде функционирование нейрона подчиняется следующему выражению: где: вектор входного сигнала весовой вектор T порог f функция активации. Весовой вектор порог и функция активации определяют поведение нейрона то как он реагирует на входные данные.
42731. РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ДЛЯ РАСЧЕТА ПОТРЕБНОСТИ В КОРМАХ НА ПАСТБИЩНЫЙ ПЕРИОД 70 KB
  Исходя из наличия поголовья сельскохозяйственных животных структуры и организации стада структуры суточных рационов и норм кормления рассчитать потребность в кормах по ферме на пастбищный период в кормовых единицах и физическом весе по видам корма и половозрастным группам. Промежуточными данными должны быть: Поголовье по половозрастным группам; Потребность в кормах в сутки на одну голову кормовые единицы и физический...