8132

Байесовские сети

Лекция

Информатика, кибернетика и программирование

Байесовские сети (Конспект) Теорема Байеса: Пусть Ai - полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности Доказательство следует из теоремы умножения и формулы...

Русский

2013-02-04

75.5 KB

28 чел.

Байесовские сети

(Конспект)

Теорема Байеса: Пусть Ai – полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности

Доказательство следует из теоремы умножения и формулы полной вероятности.

Байесовская сеть — ориентированный граф, в котором каждая вершина помечена количественной вероятностной информацией. Полная спецификация такой сети описана ниже.

1. Вершинами сети является множество случайных (дискретных или непрерывных) переменных.

2. Вершины соединяются попарно ориентированными ребрами, или ребрами со стрелками; ребра образуют множество ребер. Если стрелка направлена от вершины X к вершине У, то вершина X называется родительской вершиной вершины У.

3. Каждая вершина Xi характеризуется распределением условных вероятностей P(Xi| Parents {Xi}), которое количественно оценивает влияние родительских вершин на эту вершину.

4. Граф не имеет циклов, состоящих из ориентированных ребер (и поэтому является ориентированным ациклическим графом.

Рассмотрим пример.

Житель пригорода установил в своем доме новую систему охранной сигнализации для обнаружения взлома. Она довольно надежно обнаруживает взлом, но иногда также реагирует на небольшие землетрясения. У этого человека есть два соседа, Иван и Мария, которые обещали звонить ему на работу, услышав тревожный сигнал. Иван всегда звонит, услышав тревожный сигнал, но иногда путает с ним телефонный звонок в доме соседа и в этих случаях также звонит. Мария любит слушать довольно громкую музыку и поэтому иногда вообще пропускает тревожный сигнал. Получив факты о том, кто из этих соседей звонил или не звонил, необходимо оценить вероятность взлома. Байесовская сеть для этой проблемной области приведена на рис. 20.1.

Отвлечемся от распределения условных вероятностей, показанных на рисунке и рассмотрим топологию сети. Топология сети определения взлома показывает, что взлом и землетрясения непосредственно влияют на вероятность появления тревожного сигнала, а звонки Ивана и Марии зависят только от тревожного сигнала. Поэтому сеть подтверждает предположения, что соседи самостоятельно не обнаруживают какие-либо попытки взлома, не замечают незначительных землетрясений и не совещаются друг с другом перед звонками.

Важно, что в этой сети нет вершин, соответствующих тем ситуациям, в которых Мария в настоящее время слушала бы громкую музыку или звонил бы телефон и сбивал с толку Ивана. Эти факторы подытожены в показателях неопределенности, связанных с ребрами, направленными от вершины Alarm к вершинам JohnCalls и MaryCalls. Структура сети экономит усилия в условиях недостатка знаний. Потребовалось бы слишком много работы, чтобы узнать, по какой причине эти факторы могут оказаться более или менее вероятными в каждом конкретном случае. К тому же все равно отсутствует приемлемый способ получения релевантной информации.

Вероятности, показанные на рисунке, фактически подытоживают потенциально бесконечное множество обстоятельств, которые либо могут вызвать нарушения при выработке тревожного сигнала (высокая влажность, отказ сети электропитания, разрядка аккумулятора, обрыв проводов, дохлая мышь, застрявшая внутри звонка, и т.д.), либо станут причиной того, что Иван или Мария не смогут о нем сообщить (из-за того, что выйдут на обед, отправятся в отпуск, на время оглохнут, не расслышат сигнал в шуме пролетающего вертолета и т.д.). Но именно благодаря использованию приближенных оценок агент получает возможность хотя бы приблизительно узнавать, что происходит в мире. Степень приближения к истине может быть повышена по мере введения дополнительной релевантной информации.

Рис. 20.1. Типичная байесовская сеть, на которой показаны и топология, и таблицы условных вероятностей (Conditional Probability Table — СРТ). В таблицах СРТ буквами в, Е, A, j и м обозначены следующие события: Burglary (Взлом), Earthquake (Землетрясение), Alarm (Тревожный сигнал), JohnCalls (Звонки Ивана) и MaryCalls (Звонки Марии)

Рассмотрим распределения условных вероятностей на рис. 20.1. Каждое распределение представлено в виде таблицы условных вероятностей, или сокращенно СРТ (Conditional Probability Table). (Такая форма таблицы может использоваться для дискретных переменных; другие представления, включая те, которые подходят для непрерывных переменных, описаны в разделе 14.2.) Каждая строка в таблице СРТ содержит условную вероятность каждого значения вершины для обусловливающего случая (conditioning case), определяющего условную вероятность.

Обусловливающий случай представляет собой одну из возможных комбинаций значений родительских вершин (в принципе его можно рассматривать как миниатюрное атомарное событие). Каждая строка должна в сумме составлять 1, поскольку элементы этой строки представляют собой исчерпывающее множество случаев для данной переменной. А если речь идет о булевых переменных, то после определения вероятности истинного значения, скажем р, вероятность ложного значения должна быть равна 1-р, поэтому в таблицах СРТ второе число часто не указывают, как и на рис. 14.2. Вообще говоря, любая таблица для булевой переменной с к булевыми родительскими переменными содержит 2к независимо определяемых вероятностей. Таблица для вершины без родительских вершин имеет только одну строку, представляющую априорные вероятности каждого возможного значения соответствующей переменной.

Виды байесовских сетей доверия:

Байесовские сети доверия – Bayesian Belief  Network – используются в тех областях, которые характеризуются наследованной неопределённостью. Эта неопределённость может возникать вследствие:

  1.  неполного понимания предметной области;
  2.  неполных знаний;
  3.  когда задача характеризуется случайностью.

Таким образом, байесовские сети доверия (БСД) применяют для моделирования ситуаций, содержащих неопределённость в некотором смысле. Для байесовских сетей доверия иногда используется ещё одно название причинно-следственная сеть, в которых случайные события соединены причинно-следственными связями.

Причинно-следственные связи позволяют более просто оценивать вероятности событий. В реальном мире оценивание наиболее часто делается в направлении от “наблюдателя” к  “наблюдению”, или от “эффекта” к “следствию”, которое в общем случае более сложно оценить, чем направление  “следствие –> эффект”, то есть в направлении от следствии.

Использование байесовских сетей.

Областью использования байесовских сетей являются экспертные системы, которым необходимо работать с вероятностями. Основными областями применения  являются:

  •  Медицина (PathFinder, MUNIN, Painulim, SWAN)
  •  Космос и армия (Vista)
  •  Компьютеры и системное программное обеспечение (системе Office (знакомая многим пользователям «скрепка»), диагностика проблем работы принтеров и других справочных и wizard-подсистемах, борьба со спамом)
  •  Обработка изображений и видео (восстановлением трехмерных сцен из двумерной динамической информации, синтез статических изображений высокой четкости из видеосигнала)
  •  Финансы и экономика
  •  


Взлом

емле-трясение

Звонок Марии

Звонок Ивана

Сигнал

P(B)=0,001

P(E)=0,002

P(A|BE)=0,95

P(A|B)=0,95

P(A|E)=0,29

P(A|)=0,001

P(J|A)=0,9

P(J|)=0,05

P(M|A)=0,7

P(M|)=0,01


 

А также другие работы, которые могут Вас заинтересовать

39023. Понятие индустриального проектирования 231.5 KB
  Ключевые аспекты технологии индустриального проектирования: Реорганизация реинжиниринг бизнеспроцессов; Моделирование предметной проблемной области; Средства автоматизированного проектирования ИС CSEсредства; Возможность применения типовых решений типовое проектирование. Понятие и виды бизнеспроцессов Определение. Под бизнеспроцессом БП будем понимать совокупность взаимосвязанных операций работ по изготовлению готовой продукции или выполнению услуг на основе потребления ресурсов. Основные черты бизнеспроцессов: Все...
39024. Автоматизированное проектирование ИС (CASE-технология) 76 KB
  Изначально CSEсредства были ориентированы на разработку ПО. Сейчас чаще всего под такими средствами подразумевают любые средства проектирования ИС и или моделирования предметной области. CSEсредства охватывают все стадии ЖЦ ИС анализ проектирование разработка сопровождение. Инструментальные средства – CSEсредства.
39025. Типовое проектирование ИС 58 KB
  Сущность: Является одной из разновидностей индустриального проектирования. Содержание: Процесс проектирования ИС состоит из следующих основных этапов: Разбиение проекта информационной системы на отдельные составляющие компоненты. Основная цель применения ТПР – уменьшение трудоемкости и стоимости проектирования и или разработки ИС.
39026. Основные понятия технологии проектирования информационных систем 66 KB
  Основные понятия технологии проектирования информационных систем Понятие и сущность проектирования ИС Определение Проектирование от лат. Обладает возможностью последовательной детализации и конкретизации могут быть выделены стадии этапы проектирования. Предполагает возможность частичной автоматизации Традиционные виды проектирования: архитектурностроительное машиностроительное технологическое. Проектирование информационных систем – сравнительно новый вид проектирования.
39027. Жизненный цикл информационных систем 92 KB
  Поэтому с точки зрения проектирования ИС имеет смысл говорить о модели жизненного цикла. Модель жизненного цикла ИС – это модель создания и использования ИС отражающая ее различные состояния начиная с момента возникновения необходимости в данном комплексе средств и заканчивая моментом его полного выхода из употребления у пользователей. Вопрос к семинарскому занятию: можно ли назвать моделью жизненного цикла такую модель которая бы охватывала не все возможные состояния ИС а только некоторую их часть. Модель жизненного цикла и технология...
39028. Каноническое проектирование информационных систем 126 KB
  В зависимости от сложности объекта автоматизации и набора задач требующих решения при создании конкретной ИС стадии и этапы работ могут иметь различную трудоемкость. Формирование требований к ИС включает в себя следующие этапы: Обследование объекта и обоснование необходимости создания ИС; Формирование требований пользователя к ИС; Оформление отчёта о выполненной работе и заявки на разработку ИС тактикотехнического задания Обследование объекта автоматизации ОА – важнейшая составляющая предпроектной стадии. Обследование объекта...
39029. Проектирование информационного обеспечения ИС 188 KB
  Информационное обеспечение совокупность единой системы классификации и кодирования информации унифицированных систем документации схем информационных потоков циркулирующих в организации а также методология построения баз данных. Понятие и виды информационного обеспечения Информационное обеспечение ИС является средством для решения следующих задач: однозначного и экономичного представления информации в системе на основе кодирования объектов; организации процедур анализа и обработки информации с учетом характера связей между...
39030. Базовые технологии доступа к БД в Borland C++ Builder 159 KB
  Указания к выполнению лабораторной работы Процессор баз данных Borlnd Dtbse Engine – не единственный механизм организации доступа к данным в БДприложениях. Важным примером таких разработок является технология ODBC которая на сегодняшний день стала фактическим отраслевым стандартом работы с базами данных из клиентских приложений. Аббревиатура ODBC расшифровывается как Open DtBse Connectivity что можно перевести как открытая система связи с базами данных. В системе взаимодействия приложений с базами данных посредством ODBC принято...
39031. Базовые технологии доступа к БД в Borland C++ Builder. Лабораторная работа 125.5 KB
  Указания к выполнению лабораторной работы Ранее уже говорилось что наборы данных представляют собой группы записей переданных из базы данных в приложения для просмотра и редактирования. Каждый набор данных инкапсулирован в специальном компоненте доступа к данным. Основные свойства и методы базового класса наборов данных TDtSet уже были рассмотрены нами ранее.