8132

Байесовские сети

Лекция

Информатика, кибернетика и программирование

Байесовские сети (Конспект) Теорема Байеса: Пусть Ai - полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности Доказательство следует из теоремы умножения и формулы...

Русский

2013-02-04

75.5 KB

28 чел.

Байесовские сети

(Конспект)

Теорема Байеса: Пусть Ai – полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности

Доказательство следует из теоремы умножения и формулы полной вероятности.

Байесовская сеть — ориентированный граф, в котором каждая вершина помечена количественной вероятностной информацией. Полная спецификация такой сети описана ниже.

1. Вершинами сети является множество случайных (дискретных или непрерывных) переменных.

2. Вершины соединяются попарно ориентированными ребрами, или ребрами со стрелками; ребра образуют множество ребер. Если стрелка направлена от вершины X к вершине У, то вершина X называется родительской вершиной вершины У.

3. Каждая вершина Xi характеризуется распределением условных вероятностей P(Xi| Parents {Xi}), которое количественно оценивает влияние родительских вершин на эту вершину.

4. Граф не имеет циклов, состоящих из ориентированных ребер (и поэтому является ориентированным ациклическим графом.

Рассмотрим пример.

Житель пригорода установил в своем доме новую систему охранной сигнализации для обнаружения взлома. Она довольно надежно обнаруживает взлом, но иногда также реагирует на небольшие землетрясения. У этого человека есть два соседа, Иван и Мария, которые обещали звонить ему на работу, услышав тревожный сигнал. Иван всегда звонит, услышав тревожный сигнал, но иногда путает с ним телефонный звонок в доме соседа и в этих случаях также звонит. Мария любит слушать довольно громкую музыку и поэтому иногда вообще пропускает тревожный сигнал. Получив факты о том, кто из этих соседей звонил или не звонил, необходимо оценить вероятность взлома. Байесовская сеть для этой проблемной области приведена на рис. 20.1.

Отвлечемся от распределения условных вероятностей, показанных на рисунке и рассмотрим топологию сети. Топология сети определения взлома показывает, что взлом и землетрясения непосредственно влияют на вероятность появления тревожного сигнала, а звонки Ивана и Марии зависят только от тревожного сигнала. Поэтому сеть подтверждает предположения, что соседи самостоятельно не обнаруживают какие-либо попытки взлома, не замечают незначительных землетрясений и не совещаются друг с другом перед звонками.

Важно, что в этой сети нет вершин, соответствующих тем ситуациям, в которых Мария в настоящее время слушала бы громкую музыку или звонил бы телефон и сбивал с толку Ивана. Эти факторы подытожены в показателях неопределенности, связанных с ребрами, направленными от вершины Alarm к вершинам JohnCalls и MaryCalls. Структура сети экономит усилия в условиях недостатка знаний. Потребовалось бы слишком много работы, чтобы узнать, по какой причине эти факторы могут оказаться более или менее вероятными в каждом конкретном случае. К тому же все равно отсутствует приемлемый способ получения релевантной информации.

Вероятности, показанные на рисунке, фактически подытоживают потенциально бесконечное множество обстоятельств, которые либо могут вызвать нарушения при выработке тревожного сигнала (высокая влажность, отказ сети электропитания, разрядка аккумулятора, обрыв проводов, дохлая мышь, застрявшая внутри звонка, и т.д.), либо станут причиной того, что Иван или Мария не смогут о нем сообщить (из-за того, что выйдут на обед, отправятся в отпуск, на время оглохнут, не расслышат сигнал в шуме пролетающего вертолета и т.д.). Но именно благодаря использованию приближенных оценок агент получает возможность хотя бы приблизительно узнавать, что происходит в мире. Степень приближения к истине может быть повышена по мере введения дополнительной релевантной информации.

Рис. 20.1. Типичная байесовская сеть, на которой показаны и топология, и таблицы условных вероятностей (Conditional Probability Table — СРТ). В таблицах СРТ буквами в, Е, A, j и м обозначены следующие события: Burglary (Взлом), Earthquake (Землетрясение), Alarm (Тревожный сигнал), JohnCalls (Звонки Ивана) и MaryCalls (Звонки Марии)

Рассмотрим распределения условных вероятностей на рис. 20.1. Каждое распределение представлено в виде таблицы условных вероятностей, или сокращенно СРТ (Conditional Probability Table). (Такая форма таблицы может использоваться для дискретных переменных; другие представления, включая те, которые подходят для непрерывных переменных, описаны в разделе 14.2.) Каждая строка в таблице СРТ содержит условную вероятность каждого значения вершины для обусловливающего случая (conditioning case), определяющего условную вероятность.

Обусловливающий случай представляет собой одну из возможных комбинаций значений родительских вершин (в принципе его можно рассматривать как миниатюрное атомарное событие). Каждая строка должна в сумме составлять 1, поскольку элементы этой строки представляют собой исчерпывающее множество случаев для данной переменной. А если речь идет о булевых переменных, то после определения вероятности истинного значения, скажем р, вероятность ложного значения должна быть равна 1-р, поэтому в таблицах СРТ второе число часто не указывают, как и на рис. 14.2. Вообще говоря, любая таблица для булевой переменной с к булевыми родительскими переменными содержит 2к независимо определяемых вероятностей. Таблица для вершины без родительских вершин имеет только одну строку, представляющую априорные вероятности каждого возможного значения соответствующей переменной.

Виды байесовских сетей доверия:

Байесовские сети доверия – Bayesian Belief  Network – используются в тех областях, которые характеризуются наследованной неопределённостью. Эта неопределённость может возникать вследствие:

  1.  неполного понимания предметной области;
  2.  неполных знаний;
  3.  когда задача характеризуется случайностью.

Таким образом, байесовские сети доверия (БСД) применяют для моделирования ситуаций, содержащих неопределённость в некотором смысле. Для байесовских сетей доверия иногда используется ещё одно название причинно-следственная сеть, в которых случайные события соединены причинно-следственными связями.

Причинно-следственные связи позволяют более просто оценивать вероятности событий. В реальном мире оценивание наиболее часто делается в направлении от “наблюдателя” к  “наблюдению”, или от “эффекта” к “следствию”, которое в общем случае более сложно оценить, чем направление  “следствие –> эффект”, то есть в направлении от следствии.

Использование байесовских сетей.

Областью использования байесовских сетей являются экспертные системы, которым необходимо работать с вероятностями. Основными областями применения  являются:

  •  Медицина (PathFinder, MUNIN, Painulim, SWAN)
  •  Космос и армия (Vista)
  •  Компьютеры и системное программное обеспечение (системе Office (знакомая многим пользователям «скрепка»), диагностика проблем работы принтеров и других справочных и wizard-подсистемах, борьба со спамом)
  •  Обработка изображений и видео (восстановлением трехмерных сцен из двумерной динамической информации, синтез статических изображений высокой четкости из видеосигнала)
  •  Финансы и экономика
  •  


Взлом

емле-трясение

Звонок Марии

Звонок Ивана

Сигнал

P(B)=0,001

P(E)=0,002

P(A|BE)=0,95

P(A|B)=0,95

P(A|E)=0,29

P(A|)=0,001

P(J|A)=0,9

P(J|)=0,05

P(M|A)=0,7

P(M|)=0,01


 

А также другие работы, которые могут Вас заинтересовать

46695. Drogensucht 26.5 KB
  Viele Jugendliche sind heutzutage drogen- und alkoholabhängig. Sehr früh beginnen sie zu rauchen und Alkohol zu trinken. Alkohol, Nikotin und Medikamente nennt man weiche Drogen. Grundsätzlich ist diese Unterscheidung irreführend. Alle Drogen sind Stoffe, die unser Bewusstsein verändern. Sie tun dies unterschiedlich stark, aber alle sind schädlich und machen fast immer abhängig
46696. Налогоплательщики и налоги 26.5 KB
  Налоговая база определяется как кадастровая стоимость земельных участков признаваемых объектом налогообложения Налоговым периодом признается календарный год. Налоговые ставки устанавливаются нормативными правовыми актами представительных органов муниципальных образований законами городов федерального значения Москвы и СанктПетербурга и не могут превышать: 1 03 процента в отношении земельных участков: отнесенных к землям сельскохозяйственного назначения или к землям в составе зон сельскохозяйственного использования в поселениях и...
46697. The model of immediate constituents 26.5 KB
  The model of immediate constituents is based on the group-parsing of the sentence which has been developed by traditional grammar together with the sentence-part parsing scheme. It consists in dividing the whole of the sentence into two groups: that of the subject and that of the predicate, which, in their turn, are divided into their sub-group constituents according to the successive subordinative order of the latter
46698. Мовна надмірність і мовна недостатність у різностильових текстах 26.5 KB
  Наприклад у творах художньої літератури або у публіцистиці навіть іноді в розмовному стилі. Але його вживання у науковому чи офіційноділовому стилі є категорично забороненим і зовсім недоречним адже це буде порушувати основні ознаки стилів наприклад лаконічність. Наприклад у реченнях можуть оминатися дієслівні зв'язки Я вже додому а ти ще на роботу . Він може бути механізмом утворення нових лексичних одиниць наприклад пропозиція у значення пропозиція одружитися .
46701. Автоматизированное рабочее место специалиста отдела кадров 266.05 KB
  Охарактеризовать современные требования к организации автоматизированного рабочего места специалиста отдела кадров. Проанализировать организацию автоматизированного рабочего места специалиста отдела кадров на предприятии. Разработать рекомендации по организации автоматизированного рабочего места специалиста отдела кадров предприятия.
46703. Функціональні особливості корпоративного видання (на прикладі газети «Промышленные известия») 347 KB
  Сьогодні до роботи над корпоративними ЗМІ починають залучати професіоналів: журналістів, дизайнерів. Компанії з географічно розосередженими підрозділами потребують ефективної доставки своїх корпоративних видань і змушені звертатися до передових видавничих будинків...