23660

Нечеткие множества в системах основанных на знаниях

Лекция

Информатика, кибернетика и программирование

Для ее решения вводится два показателя: П АiФ = sup min фu Aiu это возможность что нечеткое множество Ф принадлежит значению Аi атрибута Ã. Рассмотрим геометрическую интерпретацию определения ПА1Ф: min фu A1u – представляет собой треугольник SQR т. sup min фu A1u – это точка Q т. Тогда ПА1Ф = min {max 0 min 1 1 m1 m2 1 2 max 0 min 1 1 m2 m1 2 1 }.

Русский

2013-08-05

462.5 KB

2 чел.

 © SerP   С.Хабаров  - Лекция по курсу "Информационные технологии " (5 стр.) стр. 5

9. нечеткие множества в системах основанных на знаниях

9.1. Основные понятия и определения

При работе с экономическими и статистическими данными как в системах принятия решений, так и в базах данных и знаний, возникают ситуации когда мы не можем точно количественно описать какие-либо объекты или явления. Например, на вопрос «Каков спрос в Санкт-Петербурге на мебель для кухни отечественных производителей?» можно получить лишь качественный ответ - «высокий», «низкий», «ниже, чем на итальянские кухни» т.п. Даже если нам удастся добыть цифру 254 кухни в месяц, то, очевидно, доверие у нас будет довольно низкое, так как это значение может не учитывать ряд мелких производителей, продавцов, сезонность и т.д.

Поэтому для успешного принятия решения мы должны научиться работать с качественными данными и нечетко определенными понятиями. В связи с этим возникают вопросы:

  •  как сложить два качественных описания или найти их среднее (например, спрос на отечественные кухни в Москве и Санкт-Петербурге);
  •  как в базе данных найти все города, где спрос на кухни между «низким» и «очень низким», т.е. как выполнить фильтрацию при таких данных.

Для ответа на подобные вопросы используется специальный математический аппарат называемый теорией нечетких множеств, который, как показали два последних десятилетия, оказался достаточно жизненным, широко и успешно применяемым в самых различных областях. Рассмотрим основные определения и положения теории нечетких множеств.

Нечетким множеством Ã на множестве U называется совокупность пар Ã = <A(u), u>

где A(u) - функция принадлежности нечеткого множества Ã, а u - носитель нечеткого множества Ã.

Рассмотрим пример. Пусть требуется определить нечеткое понятие «Студент учится хорошо». Обозначим это понятие  Ã. При определении этого понятия совершенно очевидно, что если у студента средний балл 4, то его можно назвать хорошо успевающим. Однако если средний балл 4.4 , то студент учится тоже «хорошо», но уже с некоторым сомнением - а может «отлично». При среднем балле 3.7, его тоже можно отнести к категории учащихся на «хорошо», но с еще большим сомнением - а может «удовлетворительно». Наше представление (знание) о понятии «Студент учится хорошо» можно представить  графически (рис. 9.1).

График показывает наше сомнение или уверенность в том, что студента с некоторым средним баллом можно отнести к хорошо успевающий. Здесь средний балл <u> является носителем нечеткого множества.

А степень уверенности в том, как значение <u> принадлежит понятию «хорошо» и есть функция принадлежности. Таким образом, нечеткое множество Ã есть не что иное, как попытка количественно описать качественное выражение «хорошо».

Рис. 9.1 Функция принадлежности

Почему функция принадлежности A(u) [0,1]? Это связано с тем, что нам удобно выражать свое отношение в процентах. Например, на 90% доверяю. А если есть абсолютная  уверенность, то это 100% доверие или 1. Поэтому и область изменения значений функции принадлежности от 0 до 100% или [0, 1].

Рассмотрим теперь понятие лингвистическая переменная. Это переменная, которая может принимать нечеткие значения. Поясним это понятие на примере. Определим лингвистическую переменную Х, характеризующую успеваемость студентов. Эта переменная может принимать одно из четырех возможных нечетких значения

X = {Ã1, Ã2, Ã3, Ã4}

где Ã1 = «неудовлетворительно»; Ã2 = «удовлетворительно»; Ã3 = «хорошо»; Ã4 = «отлично». Для того, чтобы работать с лингвистической переменной Х мы должны количественно определить все нечеткие множества Ãi (рис. 9.2).

Из этого рисунка видно, что графики функций принадлежности пересекаются, что говорит о том, что мы затрудняемся сказать точно, к какому нечеткому значению отнести определенный средний балл. В таких случаях обычно используют максимальное значение Aiu, например, средний балл 2,75 более подходит к значению «удовлетворительно», чем «неудовлетворительно».

Рис. 9.2. Нечеткие множества Ãi

Следует отметить, что в большинстве случаев функции принадлежности строятся субъективно по результатам опроса экспертов, поэтому они являются в некотором смысле «приближенными», т.е. не абсолютно адекватно отражающими явление или объект. Собственно говоря, из субъективности следует, что абсолютной адекватности в принципе и не существует. Поэтому, очевидно, нужно выбирать такую функцию, с которой можно было бы как можно проще вести расчеты. Такими функциями являют-ся трапециевидные (рис. 9.3) функции. Тогда A(u) харак-теризуется четверкой (m, m, , ). Как частный случай при m = m имеем треу-гольную форму функции.

Рис. 9.3. Трапециевидная функция принадлежности

9.2. Арифметические операции над нечеткими переменными

Прежде чем определить простейшие арифметические операции над нечеткими переменными рассмотрим пример. Пусть в рамках составления проекта бюджета рассматриваются различные источники финансирования. Причем некоторые из них характеризуются неточностью оценки денежных сумм на день оценивания, а другие малой надежностью. Кроме того, из бюджета необходимо отдать долги, количество которых также неточно, так как зависит от того, потребует ли кредитор все или только часть в следующем финансовом периоде.

  •  Источник А: финансирование обеспечивается, его сумма может изменяться от 40 до 100 млн. в зависимости от конъюнктуры, но с наибольшей вероятностью можно ожидать поступления в сумме от 50 до 70 млн.
  •  Источник В: источник надежен и разумно полагать, что финансирование будет предоставлено и составит сумму 100 - 110 млн.
  •  Источник С: источник ненадежен, а если и даст, то не более 20 млн.
  •  Долг D: плата за кредиты 50 - 100 млн., но наиболее вероятна выплата 80 млн.

Таким образом, имеем три источника поступлений и один источник расхода. Построим на основе их описаний трапециевидные функции принадлежности для каждой из четырех нечетких переменных (рис. 9.4).

После задания всех нечетких переменных, встает задача определения суммы всего бюджета, которая также будет нечеткой величиной. А для этого надо уметь выполнять простейшие арифметические операции над нечеткими переменными.

Рис. 9.4. Проект бюджета  

Определение этих операции рассмотрим для случая двух нечетких переменных Ã1 и Ã2, которые заданны своими трапециевидными функциями принадлежности вида

Ã1 = ( m1,   m1,  1,  1 ),

Ã2 = ( m2,   m2,  2,  2 ).

Результатом операции будет также нечеткая переменная  А = (m, m, , ), которая также имеет трапециевидную функцию принадлежности, параметры которой определяются в зависимости от вида арифметической операции (табл.9.1)

Таблица 9.1

Тип операции

Зависимости параметров функций принадлежности

A = Ã1 (+) Ã2

m = m1 + m2,   m = m1 + m2, 

= 1 + 2,      = 1 + 2.

A = Ã1 ( - ) Ã2

m = m1 - m2,   m = m1 - m2,

= 1 + 2,      = 1 + 2.

A = Ã1 ( х ) Ã2

m = m1 * m2,   m = m1 * m2, 

= m1 * m2 - (m1 - 1)(m2 - 2),

= ( m1 + 1)*(m2 + 2) - m1 * m2

A = Ã1 ( / ) Ã2

m = m1 /  m2,   m = m1 / m2, 

= ( m1 * 2  + m2 * 1) / (m2² + m2 * 2)

= ( m2 * 1 + m1 * 2 ) / (m2² - m2 * 2 )

На основе приведенных выше описаний арифметических операций можно для рассматриваемого примера определить оценку бюджета без учета долгов (Ф) как сумму трех источников финансирования. Причем результат будет также нечеткой переменной

Ф = А (+) В (+) С = (50+100+0,  70+110+0,  10+0+0,  30+0+20) = (150, 180, 10, 50)

с трапециевидной функцией принадлежности, приведенной на рис. 9.5. Для получения полной оценки предполагаемого бюджета необходимо из полученного результата вычесть предполагаемые платы по кредитам. При этом бюджет с учетом долгов () также будет являться нечеткой переменной (рис. 9.6):

 = Ф (-) D = ( 150 - 80, 180 - 80, 10 + 20, 50 + 30 ) = (70, 100, 30, 80),

функция принадлежности которой также имеет трапециевидный вид и приведена на рис.9.6.

Рис. 9.5. Бюджет без учета долгов  Рис. 9.6. Бюджет с учетом долгов

Таким образом, в бюджете может быть сумма от 40 до 180млн., но с наибольшей степенью уверенности можно говорить о суммах от 70 до 100млн.

9.3. Операции нечеткой фильтрации и выбора

Определение этих операций также начнем с рассмотрения примера. Пусть создается база данных по бюджетам различных фирм или подразделений. При этом любой из бюджетов может быть оценен как «малый» (А1), «средний» (А2) или «большой» (А3). Т.е. мы имеем дело с лингвистической переменной «объем бюджета» (Ã), которая может принимать одно из трех нечетких значений (А1, А2, А3).

Предположим, что функция принадлежности для каждой из переменных были оценены следующим образом

А1 = «малые»     = (0, 50, 0, 50);

А2 = «средние»  = (80, 150, 20, 20);

А3 = «большие» = (200, 250, 20, 20).

Теперь встает задача - к какому из классов бюджетов можно отнести значение бюджета, полученного в предыдущем примере. Т.е. необходимо определить является ли наш бюджет «малым», «средним» или «большим».

Эта задача относится к классу задач нечеткой фильтрации в базах данных или -отбора. Для ее решения вводится два показателя:

  •  П (АiФ) = sup min (ф(u), Ai(u))  - это возможность, что нечеткое множество Ф принадлежит значению Аi атрибута Ã.
  •  N (АiФ) = inf max (1 - ф(u), Ai(u)) - это необходимость, что нечеткое множество Ф принадлежит значению Аi атрибута Ã.

Для всех значений атрибута Ã мы находим пары ( П, N ), а затем по максимальному значению этой пары находим принадлежность нечеткого множества к тому или иному значению атрибута. На рис. 9.7 показана суть этих показателей. Рассмотрим подробнее эти два показателя.

Показатель П(АiФ) характеризует возможность совпадения (мягкое решение или мягкий вывод – отсюда английское soft computing). Фактически, любую функцию принадлежности можно рассматривать как распределение возможностей. Например, из рис. 9.6 видно, что возможность получения суммы 120 млн в бюджете Ф равна 0.75. В отличие от данной возможности, возможность П(АiФ) является условной и вычисляется на основе принципа обобщения Заде (приведенные выше формулы).

Пусть A1(u), A2(u), и A3(u) имеют вид, приведенный на рис. 9.8. На этом же рисунке изображена функция принадлежности для Ф. Рассмотрим геометрическую интерпретацию определения П(А1Ф):

  •  min (ф(u), A1(u)) представляет собой треугольник SQR, т.е. это нечеткое множество с функцией принадлежности ограниченной точками SQR. Мы для каждой точки на оси взяли наименьшее значение из двух ф(u) и A1(u).
  •  sup min (ф(u), A1(u)) – это точка Q, т.е. наибольшее значение МSQR во всех точках U=[0, ). Это примерно 0.75, т.е. П(А1Ф) = 0.75.

Рис. 9.8. Геометрическое определение П(А1Ф)

Значение П(А1Ф) может быть вычислено и аналитически на основе приведенных выше формул принципа обобщения Заде. Пусть

Ф = (m1, m1, 1, 1),

А1  = (m2, m2, 2, 2).

Тогда

П(А1Ф) = min {max ( 0, min (1, 1 + ( m1 - m2 ) / ( 1 + 2))),

max ( 0, min (1, 1 + ( m2 - m1 ) / ( 2 + 1 )))}.

Для рассматриваемого примера имеем:

Ф =(70, 100, 30, 80);

А1  = (0, 50, 0, 80).

Используя вышеприведенное выражение, получим

П(А1Ф) = min{ max ( 0,  min(1, 1 + ( 100- 0 ) / ( 80 +  0 ))),

max ( 0,  min(1, 1 + (  50 -70) / ( 30 + 50 )))} =

= min{ max ( 0,  min(1, 1 + 100 / 80 )),

max ( 0,  min(1, 1  -   20 / 80 ))} =

= min{ max ( 0, 1 ), max ( 0, 1 - 0,25 )} = min{ 1 , 0,75 )} = 0,75 ,

что соответствует графическому расчету. Аналогично можно найти П(А1Ф) для А2 и А3. Даже из рисунка видно, что П(А2Ф) = 1; П(А3Ф) 0.2

Показатель N(АiФ) характеризует необходимость совпадения, т.е. значение бюджета Аi обязательно принадлежат Ф (жестокое принятие решения, даже сверхжесткое). Эта величина используется в двух случаях:

  •  когда П(Аi Ф) = П(АjФ), i  j, т.е. возможности одинаковы и, следственно, неразличимы;
  •  при более жестком отборе.

Рассмотрим суть этого показателя на нашем примере при вычислении N(А2Ф). Как и ранее начнем с геометрической интерпретации определения П(А1Ф):

  •  Сначала найдем 1 - ф(u)
  •  Затем  max (1 - ф(u), А2(u)). Это ломаная ABCDEFG (на рис. 9.9. она обозначена точками).
  •  Вычислим inf max (1 - ф(u), Ai(u)). Это будет нижняя граница ломаной ABCDEFG. Очевидно, что это точка С.
  •  Тогда N(А2 Ф) будет соответствовать точке. Это примерно 0.20.

Выполняя аналогичные действия, из рис. 9.9 можно получить, что N(А1Ф)= 0  и  N(А3Ф) = 0

Рис. 9.9. Геометрическое определение N1Ф)

Используя формулы, вытекающие из принципа обобщения Заде можно провести аналитический расчет показателя необходимости. Если принять, что А2 = (m2, m2, 2,  2), тогда

N(А2Ф) = min {max ( 0, min (1, ( m1 - m2 + 2 ) / ( 1 + 2 ))),

max ( 0, min (1, ( m2 - m1 + 2 ) / ( 1  + 2 )))}.

Для данного примера:

Ф = (70, 100, 30, 80).

А2   = (80, 150, 20, 20).

Тогда

N(А2Ф) = min {max (0, min (1, (70-80+20)/(30+20)),

max (0, min (1,(150-100+20)/(100)) =

= min {max (0, min ( 1, 0,2 ), max (0, min ( 1, 0.7 ) = 0.2,

что соответствует графическим преобразованиям, полученным из рис. 9.9. Таким образом, после проведения всех вычислений мы имеем три значений показателей возможности и необходимости (П, N) для каждого из значений А1, А2, А3 лингвистической переменной «объем бюджета» (Ã):

для А1="малый"   ( 0,75; 0,0 )

для А2="средний"  ( 1,00; 0,2 )

для А3="большой"  ( 0,20; 0,0 )

из которых очевидно, что рассчитанный нами бюджет необходимо отнести к «среднему» с возможностью 1 и необходимостью 0.2


 

А также другие работы, которые могут Вас заинтересовать

39063. Системы автоматизированного проектирования. Программы AutoCAD и P-CAD 67 KB
  Программы utoCD и PCD По целевому назначению программы utoCD и PCD относятся к группе: CD англ. По отраслевому назначению программы utoCD и PCD относятся к группам: ED англ. utodesk rchitecturl Desktop utoCD Revit rchitecture Suite Pirnesi rchiCD. Сравнение utoCD и PCD Характеристика utoCD PCD 1.
39064. Работа с базами данных. Язык SQL 44 KB
  Большинство современных СУБД построено на реляционной модели данных. Для получения информации из отношений таблиц базы данных в качестве языка манипулирования данными в теоретическом плане используются три абстрактных языка: язык реляционной алгебры; язык реляционного исчисления на кортежах; язык реляционного исчисления на доменах. Накопленная информация в современных информационных технологиях хранится и организованна в базах данных.
39065. Программа для бизнес-планирования производства и оказания услуг в бизнесе Project Expert 90.5 KB
  Аналитическая система Project Expert программа позволяющая прожить планируемые инвестиционные решения без потери финансовых средств предоставить необходимую финансовую отчётность потенциальным инвесторам и кредиторам обосновать для них эффективность участия в проекте. Project Expert поможет: Разработать бизнесплан развития предприятия Разработать финансовую модель проекта и компании Определить финансирование проекта. Работу с программой Project Expert можно разделить на 6 этапов: 1.
39066. Язык UML 91 KB
  На UML диаграмме примечание присоединяется к одному или нескольким элементам диаграммы. Внутри прямоугольникапримечания помещаются комментарии или ограничения относящиеся к элементу или нескольким элементам диаграммы. UML диаграммы С помощью комбинации пиктограмм строятся UML диаграммы. Рассмотрим три из них: диаграммы прецедентов диаграммы классов и диаграммы действий.
39067. Характеристика case-средства Rational Rose 138 KB
  Назначение элементов экрана интерфейса Rose: Браузер browser используется для быстрой навигации по модели. C его помощью можно документировать элементы модели Rose. Документация будет выводиться также в отчетах создаваемых в среде Rose.
39068. Работа с объектами информационных систем на платформе 1С:Предприятие 43 KB
  1С:Предприятие является универсальной системой автоматизации деятельности предприятий учреждений. За счет своей универсальности система 1С:Предприятие может быть использована для автоматизации самых разных участков экономической деятельности предприятия: учета товарных и материальных средств взаиморасчетов с контрагентами. Самыми распространенными наверное являются такие конфигурации как Бухгалтерия Бухгалтерия государственного учреждения Зарплата и кадры бюджетного учреждения Зарплата и управление персоналом Управление...
39069. Тестированию программного обеспечения с использованием языка программирования C# и NUnit-тестов 82.5 KB
  Тестовая деятельность предусматривающая эксплуатацию программного продукта носит название динамического тестирования. Статическое и динамическое тестирование дополняют друг друга и каждый из этих типов тестирования реализует собственный подход к выявлению ошибок. К четырем компонентам которые должны быть оптимизированы для целей быстрого тестирования относятся персонал процесс комплексных испытаний статическое тестирование и динамическое тестирование. 1 Для выполнения быстрого тестирования нужны хорошо подготовленные и гибкие...
39070. Использование программных продуктов CRM на российском рынке 304.5 KB
  Системы управления взаимоотношения с клиентами CRM Система управления взаимоотношениями с клиентами CRM CRMсистема сокращение от англ. CRM модель взаимодействия полагающая что центром всей философии бизнеса является клиент а основными направлениями деятельности являются меры по поддержке эффективного маркетинга продаж и обслуживания клиентов. Состав системы CRMсистема может включать в себя: Фронтальную часть обеспечивающую обслуживание клиентов на точках продаж с автономной распределенной или централизованной обработкой...
39071. Универсальный язык моделирования (UML) 128.5 KB
  UML – это набор различных видов диаграмм: диаграмма классов диаграмма объектов диаграмма связей диаграмма вариантов использования текстовый сценарий диаграмма действий диаграмма состояний диаграмма последовательности UML – это не средство разработки программного обеспечения это всего лишь средство понятных иллюстраций разрабатываемого проекта. Варианты использования Сценарий. Диаграмма вариантов использования. Описание вариантов использования.