8132

Байесовские сети

Лекция

Информатика, кибернетика и программирование

Байесовские сети (Конспект) Теорема Байеса: Пусть Ai - полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности Доказательство следует из теоремы умножения и формулы...

Русский

2013-02-04

75.5 KB

28 чел.

Байесовские сети

(Конспект)

Теорема Байеса: Пусть Ai – полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности

Доказательство следует из теоремы умножения и формулы полной вероятности.

Байесовская сеть — ориентированный граф, в котором каждая вершина помечена количественной вероятностной информацией. Полная спецификация такой сети описана ниже.

1. Вершинами сети является множество случайных (дискретных или непрерывных) переменных.

2. Вершины соединяются попарно ориентированными ребрами, или ребрами со стрелками; ребра образуют множество ребер. Если стрелка направлена от вершины X к вершине У, то вершина X называется родительской вершиной вершины У.

3. Каждая вершина Xi характеризуется распределением условных вероятностей P(Xi| Parents {Xi}), которое количественно оценивает влияние родительских вершин на эту вершину.

4. Граф не имеет циклов, состоящих из ориентированных ребер (и поэтому является ориентированным ациклическим графом.

Рассмотрим пример.

Житель пригорода установил в своем доме новую систему охранной сигнализации для обнаружения взлома. Она довольно надежно обнаруживает взлом, но иногда также реагирует на небольшие землетрясения. У этого человека есть два соседа, Иван и Мария, которые обещали звонить ему на работу, услышав тревожный сигнал. Иван всегда звонит, услышав тревожный сигнал, но иногда путает с ним телефонный звонок в доме соседа и в этих случаях также звонит. Мария любит слушать довольно громкую музыку и поэтому иногда вообще пропускает тревожный сигнал. Получив факты о том, кто из этих соседей звонил или не звонил, необходимо оценить вероятность взлома. Байесовская сеть для этой проблемной области приведена на рис. 20.1.

Отвлечемся от распределения условных вероятностей, показанных на рисунке и рассмотрим топологию сети. Топология сети определения взлома показывает, что взлом и землетрясения непосредственно влияют на вероятность появления тревожного сигнала, а звонки Ивана и Марии зависят только от тревожного сигнала. Поэтому сеть подтверждает предположения, что соседи самостоятельно не обнаруживают какие-либо попытки взлома, не замечают незначительных землетрясений и не совещаются друг с другом перед звонками.

Важно, что в этой сети нет вершин, соответствующих тем ситуациям, в которых Мария в настоящее время слушала бы громкую музыку или звонил бы телефон и сбивал с толку Ивана. Эти факторы подытожены в показателях неопределенности, связанных с ребрами, направленными от вершины Alarm к вершинам JohnCalls и MaryCalls. Структура сети экономит усилия в условиях недостатка знаний. Потребовалось бы слишком много работы, чтобы узнать, по какой причине эти факторы могут оказаться более или менее вероятными в каждом конкретном случае. К тому же все равно отсутствует приемлемый способ получения релевантной информации.

Вероятности, показанные на рисунке, фактически подытоживают потенциально бесконечное множество обстоятельств, которые либо могут вызвать нарушения при выработке тревожного сигнала (высокая влажность, отказ сети электропитания, разрядка аккумулятора, обрыв проводов, дохлая мышь, застрявшая внутри звонка, и т.д.), либо станут причиной того, что Иван или Мария не смогут о нем сообщить (из-за того, что выйдут на обед, отправятся в отпуск, на время оглохнут, не расслышат сигнал в шуме пролетающего вертолета и т.д.). Но именно благодаря использованию приближенных оценок агент получает возможность хотя бы приблизительно узнавать, что происходит в мире. Степень приближения к истине может быть повышена по мере введения дополнительной релевантной информации.

Рис. 20.1. Типичная байесовская сеть, на которой показаны и топология, и таблицы условных вероятностей (Conditional Probability Table — СРТ). В таблицах СРТ буквами в, Е, A, j и м обозначены следующие события: Burglary (Взлом), Earthquake (Землетрясение), Alarm (Тревожный сигнал), JohnCalls (Звонки Ивана) и MaryCalls (Звонки Марии)

Рассмотрим распределения условных вероятностей на рис. 20.1. Каждое распределение представлено в виде таблицы условных вероятностей, или сокращенно СРТ (Conditional Probability Table). (Такая форма таблицы может использоваться для дискретных переменных; другие представления, включая те, которые подходят для непрерывных переменных, описаны в разделе 14.2.) Каждая строка в таблице СРТ содержит условную вероятность каждого значения вершины для обусловливающего случая (conditioning case), определяющего условную вероятность.

Обусловливающий случай представляет собой одну из возможных комбинаций значений родительских вершин (в принципе его можно рассматривать как миниатюрное атомарное событие). Каждая строка должна в сумме составлять 1, поскольку элементы этой строки представляют собой исчерпывающее множество случаев для данной переменной. А если речь идет о булевых переменных, то после определения вероятности истинного значения, скажем р, вероятность ложного значения должна быть равна 1-р, поэтому в таблицах СРТ второе число часто не указывают, как и на рис. 14.2. Вообще говоря, любая таблица для булевой переменной с к булевыми родительскими переменными содержит 2к независимо определяемых вероятностей. Таблица для вершины без родительских вершин имеет только одну строку, представляющую априорные вероятности каждого возможного значения соответствующей переменной.

Виды байесовских сетей доверия:

Байесовские сети доверия – Bayesian Belief  Network – используются в тех областях, которые характеризуются наследованной неопределённостью. Эта неопределённость может возникать вследствие:

  1.  неполного понимания предметной области;
  2.  неполных знаний;
  3.  когда задача характеризуется случайностью.

Таким образом, байесовские сети доверия (БСД) применяют для моделирования ситуаций, содержащих неопределённость в некотором смысле. Для байесовских сетей доверия иногда используется ещё одно название причинно-следственная сеть, в которых случайные события соединены причинно-следственными связями.

Причинно-следственные связи позволяют более просто оценивать вероятности событий. В реальном мире оценивание наиболее часто делается в направлении от “наблюдателя” к  “наблюдению”, или от “эффекта” к “следствию”, которое в общем случае более сложно оценить, чем направление  “следствие –> эффект”, то есть в направлении от следствии.

Использование байесовских сетей.

Областью использования байесовских сетей являются экспертные системы, которым необходимо работать с вероятностями. Основными областями применения  являются:

  •  Медицина (PathFinder, MUNIN, Painulim, SWAN)
  •  Космос и армия (Vista)
  •  Компьютеры и системное программное обеспечение (системе Office (знакомая многим пользователям «скрепка»), диагностика проблем работы принтеров и других справочных и wizard-подсистемах, борьба со спамом)
  •  Обработка изображений и видео (восстановлением трехмерных сцен из двумерной динамической информации, синтез статических изображений высокой четкости из видеосигнала)
  •  Финансы и экономика
  •  


Взлом

емле-трясение

Звонок Марии

Звонок Ивана

Сигнал

P(B)=0,001

P(E)=0,002

P(A|BE)=0,95

P(A|B)=0,95

P(A|E)=0,29

P(A|)=0,001

P(J|A)=0,9

P(J|)=0,05

P(M|A)=0,7

P(M|)=0,01


 

А также другие работы, которые могут Вас заинтересовать

36584. Стандартные типы данных, операции, выражения 48.5 KB
  Целые числа типа integer это числа диапазона 32768 . Константы типа integer обычные целые числа возможно со знаком. Синтаксическое определение целых чисел имеет вид: целое число ::= [ ] { цифра } В отличие от целых чисел вещественные числа типа rel представляются в памяти компьютера приближенно. Константы типа rel числа возможно с дробной частью отделяемой от целой части точкой.
36585. Структура программ на Паскале 36 KB
  Любая программа на Турбо Паскале имеет одну и ту же общую структуру: [ progrm имя программы ; ] [ раздел описаний ] begin раздел операторов end. Эта структура состоит из заголовка программы необязательного раздела описаний который может в особых случаях отсутствовать и раздела операторов содержащего хотя бы один оператор. Имя программы идентификатор выбираемый программистом. В разделе описаний должны быть описаны все нестандартные имена используемые далее в разделе операторов этой программы.
36586. Автоматизация турфирм 31 KB
  Комплексная автоматизация турфирмы позволяет: Автоматизировать оперативный и бухгалтерский учет в турфирмах Автоматизировать оперативную работу с клиентами Формировать турпакет из услуг поставщиков рассчитывать прайслисты и подготавливать электронный и бумажный каталоги цен. Автоматизация туристической деятельности естественным образом приводит к оптимизации бизнеспроцессов. Автоматизация рабочего места в тур. Автоматизация рабочих мест пользователей позволяет: формировать турпакет из услуг поставщиков рассчитывать прайслисты...
36587. Система бронирования Amadeus 37 KB
  В настоящее время mdeus ведущая компьютерная система бронирования в Европе. системы бронирования System One она активно продвигается и на американский рынок. Партнером mdeus является немецкая система бронирования туруслуг Strt и любой пользователь mdeus автоматически является также пользователем Strt.
36588. Реляционная модель данных 46.5 KB
  Любую таблицу упрощенно можно описать следующим образом: НАЗВАНИЕ ТАБЛИЦЫ Поле1 Поле2 Поле3ПолеN Например: СТУДЕНТЫНомер_зачетки ФИО Факультет. Располагаются столбцы в таблице в порядке следования их имен принятом при создании таблицы. В каждой таблице должен быть столбец или совокупность столбцов значение которого однозначно идентифицирует каждую запись таблицы. Этот столбец или совокупность столбцов называется первичным ключом primry key PK таблицы.
36589. Основы проектирования баз данных 93.5 KB
  Основные этапы проектирования баз данных 1 Концептуальное инфологическое проектирование Концептуальное инфологическое проектирование построение семантической смысловой модели предметной области то есть информационной модели наиболее высокого уровня абстракции. Такая модель создаётся без ориентации на какуюлибо конкретную СУБД и модель данных. Кроме того в этом контексте равноправно могут использоваться слова модель базы данных и модель предметной области поскольку такая модель является как образом реальности так и образом...
36590. Язык SQL 499.5 KB
  На раннем этапе развития систем управления базами данных(СУБД) в условиях низких технических характеристик ЭВМ основное внимание разработчиков СУБД было направлено на проблемы размещения информации в базе и обмена данными между дисковой памятью и оперативной памятью, поскольку это в первую очередь определяло эффективность функционирования СУБД
36591. Теорія механізмів і машин 8.12 MB
  Структура та класифікація механізмів Структура механізму це його будова. Будовою механізму визначаються такі його важливі характеристики як види виконуваних рухів способи їх перетворення число ступенів вільності. Основними структурними елементами механізму є ланки тверді тіла та кінематичні пари рухомі зєднання твердих тіл. Ланки механізму рухомо зєднані між собою.
36592. ТЕОРІЯ СИСТЕМ І СИСТЕМНИЙ АНАЛІЗ 1.09 MB
  Поняття інформаційної системи. Модель організації як відкритої системи. Сучасні організації підприємства корпорації інтегровані в системи міжнаціональних економічних звязків у транснаціональні компанії в інформаційні системи що обслуговують світовий ринок.