23660

Нечеткие множества в системах основанных на знаниях

Лекция

Информатика, кибернетика и программирование

Для ее решения вводится два показателя: П АiФ = sup min фu Aiu это возможность что нечеткое множество Ф принадлежит значению Аi атрибута Ã. Рассмотрим геометрическую интерпретацию определения ПА1Ф: min фu A1u представляет собой треугольник SQR т. sup min фu A1u это точка Q т. Тогда ПА1Ф = min {max 0 min 1 1 m1 m2 1 2 max 0 min 1 1 m2 m1 2 1 }.

Русский

2013-08-05

462.5 KB

4 чел.

 © SerP   С.Хабаров  - Лекция по курсу "Информационные технологии " (5 стр.) стр. 5

9. нечеткие множества в системах основанных на знаниях

9.1. Основные понятия и определения

При работе с экономическими и статистическими данными как в системах принятия решений, так и в базах данных и знаний, возникают ситуации когда мы не можем точно количественно описать какие-либо объекты или явления. Например, на вопрос «Каков спрос в Санкт-Петербурге на мебель для кухни отечественных производителей?» можно получить лишь качественный ответ - «высокий», «низкий», «ниже, чем на итальянские кухни» т.п. Даже если нам удастся добыть цифру 254 кухни в месяц, то, очевидно, доверие у нас будет довольно низкое, так как это значение может не учитывать ряд мелких производителей, продавцов, сезонность и т.д.

Поэтому для успешного принятия решения мы должны научиться работать с качественными данными и нечетко определенными понятиями. В связи с этим возникают вопросы:

  •  как сложить два качественных описания или найти их среднее (например, спрос на отечественные кухни в Москве и Санкт-Петербурге);
  •  как в базе данных найти все города, где спрос на кухни между «низким» и «очень низким», т.е. как выполнить фильтрацию при таких данных.

Для ответа на подобные вопросы используется специальный математический аппарат называемый теорией нечетких множеств, который, как показали два последних десятилетия, оказался достаточно жизненным, широко и успешно применяемым в самых различных областях. Рассмотрим основные определения и положения теории нечетких множеств.

Нечетким множеством Ã на множестве U называется совокупность пар Ã = <A(u), u>

где A(u) - функция принадлежности нечеткого множества Ã, а u - носитель нечеткого множества Ã.

Рассмотрим пример. Пусть требуется определить нечеткое понятие «Студент учится хорошо». Обозначим это понятие  Ã. При определении этого понятия совершенно очевидно, что если у студента средний балл 4, то его можно назвать хорошо успевающим. Однако если средний балл 4.4 , то студент учится тоже «хорошо», но уже с некоторым сомнением - а может «отлично». При среднем балле 3.7, его тоже можно отнести к категории учащихся на «хорошо», но с еще большим сомнением - а может «удовлетворительно». Наше представление (знание) о понятии «Студент учится хорошо» можно представить  графически (рис. 9.1).

График показывает наше сомнение или уверенность в том, что студента с некоторым средним баллом можно отнести к хорошо успевающий. Здесь средний балл <u> является носителем нечеткого множества.

А степень уверенности в том, как значение <u> принадлежит понятию «хорошо» и есть функция принадлежности. Таким образом, нечеткое множество Ã есть не что иное, как попытка количественно описать качественное выражение «хорошо».

Рис. 9.1 Функция принадлежности

Почему функция принадлежности A(u) [0,1]? Это связано с тем, что нам удобно выражать свое отношение в процентах. Например, на 90% доверяю. А если есть абсолютная  уверенность, то это 100% доверие или 1. Поэтому и область изменения значений функции принадлежности от 0 до 100% или [0, 1].

Рассмотрим теперь понятие лингвистическая переменная. Это переменная, которая может принимать нечеткие значения. Поясним это понятие на примере. Определим лингвистическую переменную Х, характеризующую успеваемость студентов. Эта переменная может принимать одно из четырех возможных нечетких значения

X = {Ã1, Ã2, Ã3, Ã4}

где Ã1 = «неудовлетворительно»; Ã2 = «удовлетворительно»; Ã3 = «хорошо»; Ã4 = «отлично». Для того, чтобы работать с лингвистической переменной Х мы должны количественно определить все нечеткие множества Ãi (рис. 9.2).

Из этого рисунка видно, что графики функций принадлежности пересекаются, что говорит о том, что мы затрудняемся сказать точно, к какому нечеткому значению отнести определенный средний балл. В таких случаях обычно используют максимальное значение Aiu, например, средний балл 2,75 более подходит к значению «удовлетворительно», чем «неудовлетворительно».

Рис. 9.2. Нечеткие множества Ãi

Следует отметить, что в большинстве случаев функции принадлежности строятся субъективно по результатам опроса экспертов, поэтому они являются в некотором смысле «приближенными», т.е. не абсолютно адекватно отражающими явление или объект. Собственно говоря, из субъективности следует, что абсолютной адекватности в принципе и не существует. Поэтому, очевидно, нужно выбирать такую функцию, с которой можно было бы как можно проще вести расчеты. Такими функциями являют-ся трапециевидные (рис. 9.3) функции. Тогда A(u) харак-теризуется четверкой (m, m, , ). Как частный случай при m = m имеем треу-гольную форму функции.

Рис. 9.3. Трапециевидная функция принадлежности

9.2. Арифметические операции над нечеткими переменными

Прежде чем определить простейшие арифметические операции над нечеткими переменными рассмотрим пример. Пусть в рамках составления проекта бюджета рассматриваются различные источники финансирования. Причем некоторые из них характеризуются неточностью оценки денежных сумм на день оценивания, а другие малой надежностью. Кроме того, из бюджета необходимо отдать долги, количество которых также неточно, так как зависит от того, потребует ли кредитор все или только часть в следующем финансовом периоде.

  •  Источник А: финансирование обеспечивается, его сумма может изменяться от 40 до 100 млн. в зависимости от конъюнктуры, но с наибольшей вероятностью можно ожидать поступления в сумме от 50 до 70 млн.
  •  Источник В: источник надежен и разумно полагать, что финансирование будет предоставлено и составит сумму 100 - 110 млн.
  •  Источник С: источник ненадежен, а если и даст, то не более 20 млн.
  •  Долг D: плата за кредиты 50 - 100 млн., но наиболее вероятна выплата 80 млн.

Таким образом, имеем три источника поступлений и один источник расхода. Построим на основе их описаний трапециевидные функции принадлежности для каждой из четырех нечетких переменных (рис. 9.4).

После задания всех нечетких переменных, встает задача определения суммы всего бюджета, которая также будет нечеткой величиной. А для этого надо уметь выполнять простейшие арифметические операции над нечеткими переменными.

Рис. 9.4. Проект бюджета  

Определение этих операции рассмотрим для случая двух нечетких переменных Ã1 и Ã2, которые заданны своими трапециевидными функциями принадлежности вида

Ã1 = ( m1,   m1,  1,  1 ),

Ã2 = ( m2,   m2,  2,  2 ).

Результатом операции будет также нечеткая переменная  А = (m, m, , ), которая также имеет трапециевидную функцию принадлежности, параметры которой определяются в зависимости от вида арифметической операции (табл.9.1)

Таблица 9.1

Тип операции

Зависимости параметров функций принадлежности

A = Ã1 (+) Ã2

m = m1 + m2,   m = m1 + m2, 

= 1 + 2,      = 1 + 2.

A = Ã1 ( - ) Ã2

m = m1 - m2,   m = m1 - m2,

= 1 + 2,      = 1 + 2.

A = Ã1 ( х ) Ã2

m = m1 * m2,   m = m1 * m2, 

= m1 * m2 - (m1 - 1)(m2 - 2),

= ( m1 + 1)*(m2 + 2) - m1 * m2

A = Ã1 ( / ) Ã2

m = m1 /  m2,   m = m1 / m2, 

= ( m1 * 2  + m2 * 1) / (m2² + m2 * 2)

= ( m2 * 1 + m1 * 2 ) / (m2² - m2 * 2 )

На основе приведенных выше описаний арифметических операций можно для рассматриваемого примера определить оценку бюджета без учета долгов (Ф) как сумму трех источников финансирования. Причем результат будет также нечеткой переменной

Ф = А (+) В (+) С = (50+100+0,  70+110+0,  10+0+0,  30+0+20) = (150, 180, 10, 50)

с трапециевидной функцией принадлежности, приведенной на рис. 9.5. Для получения полной оценки предполагаемого бюджета необходимо из полученного результата вычесть предполагаемые платы по кредитам. При этом бюджет с учетом долгов () также будет являться нечеткой переменной (рис. 9.6):

 = Ф (-) D = ( 150 - 80, 180 - 80, 10 + 20, 50 + 30 ) = (70, 100, 30, 80),

функция принадлежности которой также имеет трапециевидный вид и приведена на рис.9.6.

Рис. 9.5. Бюджет без учета долгов  Рис. 9.6. Бюджет с учетом долгов

Таким образом, в бюджете может быть сумма от 40 до 180млн., но с наибольшей степенью уверенности можно говорить о суммах от 70 до 100млн.

9.3. Операции нечеткой фильтрации и выбора

Определение этих операций также начнем с рассмотрения примера. Пусть создается база данных по бюджетам различных фирм или подразделений. При этом любой из бюджетов может быть оценен как «малый» (А1), «средний» (А2) или «большой» (А3). Т.е. мы имеем дело с лингвистической переменной «объем бюджета» (Ã), которая может принимать одно из трех нечетких значений (А1, А2, А3).

Предположим, что функция принадлежности для каждой из переменных были оценены следующим образом

А1 = «малые»     = (0, 50, 0, 50);

А2 = «средние»  = (80, 150, 20, 20);

А3 = «большие» = (200, 250, 20, 20).

Теперь встает задача - к какому из классов бюджетов можно отнести значение бюджета, полученного в предыдущем примере. Т.е. необходимо определить является ли наш бюджет «малым», «средним» или «большим».

Эта задача относится к классу задач нечеткой фильтрации в базах данных или -отбора. Для ее решения вводится два показателя:

  •  П (АiФ) = sup min (ф(u), Ai(u))  - это возможность, что нечеткое множество Ф принадлежит значению Аi атрибута Ã.
  •  N (АiФ) = inf max (1 - ф(u), Ai(u)) - это необходимость, что нечеткое множество Ф принадлежит значению Аi атрибута Ã.

Для всех значений атрибута Ã мы находим пары ( П, N ), а затем по максимальному значению этой пары находим принадлежность нечеткого множества к тому или иному значению атрибута. На рис. 9.7 показана суть этих показателей. Рассмотрим подробнее эти два показателя.

Показатель П(АiФ) характеризует возможность совпадения (мягкое решение или мягкий вывод – отсюда английское soft computing). Фактически, любую функцию принадлежности можно рассматривать как распределение возможностей. Например, из рис. 9.6 видно, что возможность получения суммы 120 млн в бюджете Ф равна 0.75. В отличие от данной возможности, возможность П(АiФ) является условной и вычисляется на основе принципа обобщения Заде (приведенные выше формулы).

Пусть A1(u), A2(u), и A3(u) имеют вид, приведенный на рис. 9.8. На этом же рисунке изображена функция принадлежности для Ф. Рассмотрим геометрическую интерпретацию определения П(А1Ф):

  •  min (ф(u), A1(u)) представляет собой треугольник SQR, т.е. это нечеткое множество с функцией принадлежности ограниченной точками SQR. Мы для каждой точки на оси взяли наименьшее значение из двух ф(u) и A1(u).
  •  sup min (ф(u), A1(u)) – это точка Q, т.е. наибольшее значение МSQR во всех точках U=[0, ). Это примерно 0.75, т.е. П(А1Ф) = 0.75.

Рис. 9.8. Геометрическое определение П(А1Ф)

Значение П(А1Ф) может быть вычислено и аналитически на основе приведенных выше формул принципа обобщения Заде. Пусть

Ф = (m1, m1, 1, 1),

А1  = (m2, m2, 2, 2).

Тогда

П(А1Ф) = min {max ( 0, min (1, 1 + ( m1 - m2 ) / ( 1 + 2))),

max ( 0, min (1, 1 + ( m2 - m1 ) / ( 2 + 1 )))}.

Для рассматриваемого примера имеем:

Ф =(70, 100, 30, 80);

А1  = (0, 50, 0, 80).

Используя вышеприведенное выражение, получим

П(А1Ф) = min{ max ( 0,  min(1, 1 + ( 100- 0 ) / ( 80 +  0 ))),

max ( 0,  min(1, 1 + (  50 -70) / ( 30 + 50 )))} =

= min{ max ( 0,  min(1, 1 + 100 / 80 )),

max ( 0,  min(1, 1  -   20 / 80 ))} =

= min{ max ( 0, 1 ), max ( 0, 1 - 0,25 )} = min{ 1 , 0,75 )} = 0,75 ,

что соответствует графическому расчету. Аналогично можно найти П(А1Ф) для А2 и А3. Даже из рисунка видно, что П(А2Ф) = 1; П(А3Ф) 0.2

Показатель N(АiФ) характеризует необходимость совпадения, т.е. значение бюджета Аi обязательно принадлежат Ф (жестокое принятие решения, даже сверхжесткое). Эта величина используется в двух случаях:

  •  когда П(Аi Ф) = П(АjФ), i  j, т.е. возможности одинаковы и, следственно, неразличимы;
  •  при более жестком отборе.

Рассмотрим суть этого показателя на нашем примере при вычислении N(А2Ф). Как и ранее начнем с геометрической интерпретации определения П(А1Ф):

  •  Сначала найдем 1 - ф(u)
  •  Затем  max (1 - ф(u), А2(u)). Это ломаная ABCDEFG (на рис. 9.9. она обозначена точками).
  •  Вычислим inf max (1 - ф(u), Ai(u)). Это будет нижняя граница ломаной ABCDEFG. Очевидно, что это точка С.
  •  Тогда N(А2 Ф) будет соответствовать точке. Это примерно 0.20.

Выполняя аналогичные действия, из рис. 9.9 можно получить, что N(А1Ф)= 0  и  N(А3Ф) = 0

Рис. 9.9. Геометрическое определение N1Ф)

Используя формулы, вытекающие из принципа обобщения Заде можно провести аналитический расчет показателя необходимости. Если принять, что А2 = (m2, m2, 2,  2), тогда

N(А2Ф) = min {max ( 0, min (1, ( m1 - m2 + 2 ) / ( 1 + 2 ))),

max ( 0, min (1, ( m2 - m1 + 2 ) / ( 1  + 2 )))}.

Для данного примера:

Ф = (70, 100, 30, 80).

А2   = (80, 150, 20, 20).

Тогда

N(А2Ф) = min {max (0, min (1, (70-80+20)/(30+20)),

max (0, min (1,(150-100+20)/(100)) =

= min {max (0, min ( 1, 0,2 ), max (0, min ( 1, 0.7 ) = 0.2,

что соответствует графическим преобразованиям, полученным из рис. 9.9. Таким образом, после проведения всех вычислений мы имеем три значений показателей возможности и необходимости (П, N) для каждого из значений А1, А2, А3 лингвистической переменной «объем бюджета» (Ã):

для А1="малый"   ( 0,75; 0,0 )

для А2="средний"  ( 1,00; 0,2 )

для А3="большой"  ( 0,20; 0,0 )

из которых очевидно, что рассчитанный нами бюджет необходимо отнести к «среднему» с возможностью 1 и необходимостью 0.2


 

А также другие работы, которые могут Вас заинтересовать

27394. Принципы русской орфографии 35 KB
  Морфологическийединообразие написания морфем все случаи безуд гл оглушеине или озвончение согл традиционное произношение Решение орфогрфической задачи по морфологическому принципу состоит в том чтобы реюбенок зналд образ слова кот искажен фонетически 2. Традиционный Относятся все лсоварные слова правописание жиши чаща чущуИспользовать принципы запоминания 4. Принцип дифференциации значений лексический грамматический смысловой КомпаниякампанияподжегподжогСлова омофоны 5. Принцип аббревиации Практически не изуч в нач школе...
27395. Морфемика – изучает состав слова 96 KB
  Развитие интереса детей к языку через состав слова. Выяснение как сделаны слова в р. Вопрос о причинах ошибок которые допускают дети при разборе слова по составу специально изучали психологи Л.
27396. Методика обучения морфологии в начальных классах 69 KB
  Во II классе вводятся понятия частей речи сообщаются некоторые признаки частей речи в III и IV классах склонение имен существительных прилагательных спряжение глаголов значения форм частей речи вплоть до значений падежей временных и личных форм.; местоимения притяжательные указательные вопросительные возвратное; наречия времени места образа действия. Слова категории состояния при разборе по частям речи квалифицируются как наречия.
27397. Синтаксис – раздел грамматики 59 KB
  Одним из направлений в работе над предложением в начальных классах является формирование умения оформлять предложения в письменной речи употребление прописной буквы в начале предложения постановка знаков препинания в простых предложениях осложненных однородными членами в сложносочиненных сложноподчиненных и бессоюзных предложениях. Изучение синтаксиса способствует развитию речи так как помогает правильно строить предложения выбирать выразительные виды словосочетаний и предложений которые наиболее подходят для нужного в данной ситуации...
27398. Совершенствование речевой деятельности младших школьников 165 KB
  В начальной школе детей обучают чтению письму речи устной и письменной это есть формирование специфических речевых умений и навыков то есть видов речевой деятельности. Совершенствование речевой деятельности школьников предполагает формирование четырех обобщенных умений: а ориентироваться в ситуации общения в том числе осознавать свою коммуникативную задачу; б планировать содержание сообщения; в формулировать собственные мысли и понимать чужие; г осуществлять самоконтроль за речью восприятием ее собеседником а также за пониманием...
27399. Методика проведения изложений 46.5 KB
  Начинать обучение следует с повествовательного текста где легко прослеживается развитие действия есть ясный сюжет действующие лица. Порядок подготовительных ступеней в письменном изложении: Постановка цели выбор типа изложения выбор текста. Чтение текста: учитель 12 раза; учащиеся один раз; если текст хорошо знаком детям учитель читает 1 раз. В наши дни не рекомендуется из опасения что рассказ ребенка как бы он ни был хорош может помешать прямому влиянию на пишущих со стороны подлинного образцового текста.
27400. Методика обучения сочинениям 88.5 KB
  Сочинения устные и письменные. Школьники любят писать сочинения и рассказывать устно эта деятельность связывает учение с жизнью. Напомним что сочинения ради разностороннего развития школьников должны быть разнообразными и по источникам материала и по типам текста стилю и жанрам и по тематике по степени самостоятельности и творческого вклада по применяемым методам и приемам.
27401. Совершенствование у младших школьников культуры речевого поведения 60 KB
  Чтобы это общение протекало успешно не вызывая дискомфорта у коголибо из его участников необходимо соблюдение каждым из них определенных норм принятых в обществе норм речевого поведения. К числу вопросов связанных с культурой речевого поведения можно отнести: 1. Соблюдение правил: а поведения в аудитории в том числе на уроке в общественных местах и т.
27402. Внеклассная работа по русскому языку в начальной школе 46 KB
  Это игры утренники викторины походы и экскурсии выпуск газет и журналов радиопередачи съемка телефильмов конкурсы на лучшее сочинение или стихотворение самостоятельное внеклассное чтение книг журналов газет. Лингвистические языковые игры. Как известно игры широко используются и на уроках в более строгой системе познавательного труда детей но внеклассная внеурочная работа дает в этом отношении намного больший простор. Языковые игры обычно развлекательны но всегда содержат дидактический элемент достигающий подчас...