26499

Статистические и позиционные игры

Реферат

Менеджмент, консалтинг и предпринимательство

Принятие решений в статистических играх. принятие решений в позиционных играх. Принятие решений в статистических играх. В теории статистических решений известен ряд методик нахождения оптимального решения.

Русский

2013-08-18

30.18 KB

24 чел.

Статистические и позиционные игры.

- принятие решений в статистических играх.

- принятие решений в позиционных играх.

- использование теории полезности в позиционных играх.

Принятие решений в статистических играх.

Статистическая игра – матричная игра, одним из игроков которой является природа. Считается, что действия природы не носят характера сознательного противодействия и природа рассматривается как некоторая незаинтересованная сторона, состояние которой заранее не известно. То есть стороне, принимающей решения необходимо принимать решения в условиях неопределенности. Эта неопределенность обусловлена отсутствием достоверной информации о возможном состоянии природы. Анализ статистических игр начинается с формирования платежной матрицы, в которой активной стороной (игроком А) выступает человек, принимающий решения, а игроком В выступает природа. Тогда элемент платежной матрицы aij – это выигрыш игрока А при использовании стратегии Ai и нахождении природы в состоянии Sj.

Задача анализа статистической игры заключается в том, чтобы выбрать такую стратегию, которая обеспечила бы игроку А максимальный выигрыш. В теории статистических решений известен ряд методик нахождения оптимального решения. При этом можно упростить игру путем отбрасывания доминируемых и дублируемых стратегий. Однако, исключать названные стратегии может только активная сторона, то есть игрок А, так как природа свои стратегии не выбирает, не корректирует. Во многих случаях при решении задач принятия решений целесообразней перейти от матрицы выигрышей к матрице рисков. Риском rij игрока А при реализации им стратегии Ai при состоянии природы в состоянии Sj называется разность между выигрышем, который игрок может получать, если знает состояние природы  бетаj и выигрыш, который он получит, если он применит i-ю стратегию.

 

Матрица рисков дает более наглядную картину неопределенности, так как из матрицы рисков  видно, чем рискует игрок А, применяя ту или иную стратегию. Другими словами, величина риска – это размер платы за отсутствие информации о состоянии природы. При определении подходов к решению задач статистической игры можно выделить следующие ситуации, определяющие степень неопределенности состояний природы:

Первый случай.

Заключается в том, что вероятности нахождения природы в каждом из состояний заданы   , при этом предполагается, что имеем дело с полной системой событий.

Второй случай.

Состоит в том, что вероятности состояний природы не известны, но можно сделать предположение относительно их значений, например, можно определить частоту появления того или иного события.

Третий случай.

Заключается в том, что вероятности qi неизвестны и у нас нет предположений относительно их значений.

Для первой ситуации, когда заданы вероятности состояний природы игроком А принимается решение, исходя из принципа оптимальности в среднем. То есть в качестве оптимальной стратегии игрок должен выбрать такую стратегию, которая обеспечит ему максимальный средний выигрыш или минимальный средний риск.

Максимальный средний выигрыш есть:

Постановка задачи при втором случае, когда вероятности состояния природы неизвестны, но можно сделать предположения относительно их значений. Возможны следующие ситуации:

При первом подходе 2.1 все состояния природы полагаются равновероятными, то есть. Второй случай 2.2 заключается в том, что все состояния природы располагают в порядке убывания степени правдоподобности. Таким образом, формируется определенный ряд состояний и этому ряду состояний ставится в соответствие некоторая убывающая последовательность чисел. Например, вероятности состояния природы можно определить пропорционально числам убывающей арифметической прогрессии. n – максимальный индекс состояния. При третьем подходе 2.3 прибегают к методам экспертных оценок. Считается, что экспертная оценка снижает влияние фактора субъективности.

Третья ситуация. При принятии решения приходится ограничиваться информацией, содержащейся только в матрице выигрыша. При выборе оптимальной стратегии для получения гарантированного выигрыша можно воспользоваться одним из известных критериев оптимальности.

Первый критерий называется критерием максимакса. В соответствии с этим критерием в качестве оптимальной выбирается стратегия, которая максимизирует максимальный выигрыш для каждого состояния природы. Еще называется критерий крайнего оптимизма.

 

Второй критерий – критерий Вальда. Ориентирует игрока А на наихудшие условия и рекомендует выбирать ту стратегию, при которой в худших условиях выигрыш будет максимальным. То есть игроку А рекомендуется исходить всегда из худших условий. Критерий крайнего пессимизма.  

Третий критерий – критерий минимаксного риска Сэвиджа. Этот критерий рекомендует в качестве оптимальной стратегии выбирать такую стратегию, при которой величина риска минимальна, причем в самых неблагоприятных условиях.

Может быть отнесен к категории крайнего пессимизма. При использовании этого критерия пессимизм проявляется в том, что снижается не минимальный выигрыш, а рассматривается максимальная потеря выигрыша.

Четвертый – компромиссный критерий Гурвица. Критерий пессимизма оптимизма. Согласно этому критерию, игрок должен выбрать такую стратегию, которая обеспечит выигрыш не меньше, чем некоторая заданная величина.

В этом выражении альфа представляет собой некоторое число от 0 до 1 и выбирается субъективным в зависимости от оценки ситуации. Говоря проще, чем больше игрок хочет подстраховаться, тем ближе к единице выбирается величина коэффициента альфа. Альфа – мера пессимизма. При альфа=1 критерий Гурвица совпадает с критерием Вальда. А при альфа=0 с критерием крайнего оптимизма.

Выбор критерия базируется на субъективных оценках и прежде чем выбрать оптимальное решение необходимо проанализировать статистическую игру с точки зрения нескольких критериев. Если рекомендации нескольких критериев совпадут, то можно достаточно уверенно принимать решение. В случае противоречивости оценок по различным критериям необходимо более тщательно проанализировать ситуацию и может быть получить дополнительную информацию.

Принятие решений в позиционных играх.

В отличии от статистических игр в позиционных играх анализируется поэтапное принятие решения. В этом случае множество стратегий и состояний природы на текущем этапе определяет совокупность стратегий и состояний природы для следующего этапа. В качестве модели такой игры используются деревья решений, которые представляют собой графическое изображение логической последовательности принятия решений.

Построение дерева решений включает выполнение следующих этапов:

Первый этап: 

постановка проблемы и поиск альтернатив решений включает:

- выявление проблемы путем сравнения достигнутого состояния и желаемого;

- анализ причин, вызвавших это решение;

- определение значимых для постановки проблемы целей.

- определение логической последовательности достижения этих целей.

- подбор альтернативных решений в зависимости от условий внешней среды.

Второй этап: конструирование дерева решений. Дерево решений содержит узлы двух типов: узлы выбора решений (в этих узлах системным аналитиком производится выбор одной из альтернатив, каждая из которых обозначается в виде дуги, выходящей из узла принятия решений. Следует иметь в виду, движение по каждому ребру может соответствовать определенным затратам) и узлы возникновения возможных исходов (соответствуют моменту появления возможных исходов в зависимости от состояния внешней среды. Возникновение возможных исходов количественно задается распределением условных вероятностей). Полезность каждого исхода приводится в выходах U.

Третий этап: Анализ дерева решений производится начиная от конечных исходов к начальному узлу принятия решений. Для узлов возможных исходов определяется среднее значение выигрыша. Например, для узла D среднее значение выигрыша будет мат. ожидание.

Если для узла возможных исходов возможно только одно состояние и один конечный исход, то среднее значение выигрыша будет определяться U6.

В узле принятия решений реализуется принцип максимизации среднего выигрыша либо максимизации ожидаемой полезности. То есть в каждом узле принятия решений системный аналитик выбирает альтернативу, которая приводит к наибольшему выигрышу и наибольшей ожидаемой полезности. Для узла 3 полезность определяется из условия.

На основе полученного значения полезности находятся средние значения выигрышей для узлов возможных исходов. Процесс продолжается до тех пор, пока для начального узла принятия решений не будет определена оптимальная альтернатива.

Четвертый этап: Анализ устойчивости решений. Цель – определить предельные значения вероятности, при которых производится переход к другим альтернативным решениям.

Пятый этап: Оценка ожидаемой ценности уточненной информации. Этот этап целесообразно выполнять в том случае, если с помощью дополнительного мониторинга можно получить более точную информацию о состоянии среды. Проведение дополнительного мониторинга требует дополнительных денег, поэтому его лучше проводить если затраты на его организацию меньше, чем разность в оценке выигрыша до дополнительного обследования и после. Наиболее распространенными способами оценки вероятностей состояний является субъективный подход аналитиков, объективный подход с помощью различных комбинаторных схем, экспериментальных оценок и т.д., экспериментальный подход, основанный на результатах испытаний, оценочный подход и использование известных функций распределения случайных величин.


 

А также другие работы, которые могут Вас заинтересовать

30518. Ключи криптосистемы. Жизненный цикл ключей. Требования к обеспечению безопасности жизненного цикла ключей. Управление ключами в криптографических системах 34.39 KB
  Методы разграничения доступа: Разграничение доступа по спискам; Использование матрицы установления полномочий; Разграничение доступа по уровням секретности и категориям; Парольное разграничение доступа.; управление сроком действия паролей их периодическая смена; ограничение доступа к файлу паролей; ограничение числа неудачных попыток входа в систему это затруднит применение метода грубой силы ; обучение пользователей; использование программных генераторов паролей такая программа основываясь на несложных правилах может...
30519. Технологии обеспечения безопасности корпоративной сети с использованием оборудования 2-го уровня модели OSI 228.33 KB
  VLN Virtul Loclre Network – это одна из функций Fst Ethernet. VLN позволяет изменять конфигурацию сети объединять пользователей в отдельные рабочие группы определять доступные сегменты для отдельно взятого порта. VLN дает возможность значительно оптимизировать работу локальной сети за счет разгрузки отдельных ее сегментов от лишнего трафика. С помощью VLN можно еще контролировать и эффективно подавлять широковещательные штормы которые в больших сетях иногда останавливают работу целых сегментов.
30520. Технологии обеспечения безопасности корпоративной сети с использованием оборудования 3-го уровня модели OSI 53.73 KB
  Метод анализа на лету заключается в мониторинге сетевого трафика в реальном или близком к реальному времени и использовании соответствующих алгоритмов обнаружения. Системы обнаружения атакIntrusion Detection Systems IDSs анализирует трафик поступающий на нее на соответствие сигнатурам в случае соответствия трафика сигнатуре оповещает администраторов по безопасности о наличии совпадения. Обычно на IDS поступает копия трафика который необходимо анализировать то есть IDS не ставят в разрез соединению это достигается...
30521. Средства обеспечения защиты данных от несанкционированного доступа, средства идентификации и аутентификации объектов БД, языковые средства разграничения доступа, организация аудита в системах БД. Задачи и средства администратора безопасности БД 32.18 KB
  В современных условиях любая деятельность сопряжена с оперированием большими объемами информации, которое производится широким кругом лиц. Защита данных от несанкционированного доступа является одной из приоритетных задач при проектировании любой информационной системы. Следствием возросшего в последнее время значения информации стали высокие требования к конфиденциальности данных. Системы управления базами данных, в особенности реляционные СУБД
30522. Основные понятия защиты информации (субъекты, объекты, доступ, граф доступов, информационные потоки). Постановка задачи построения защищенной автоматизированной системы (АС). Ценность информации 50.99 KB
  Ценность информации. Доска Пример матрицы доступа дискреционная модель защиты Выступление Основные понятия защиты информации. В связи с развивающимся процессом информатизации общества все большие объемы информации накапливаются хранятся и обрабатываются в автоматизированных системах построенных на основе современных средств вычислительной техники и связи.
30523. Модель системы безопасности HRU. Основные положения модели. Теорема об алгоритмической неразрешимости проблемы безопасности в произвольной системе 111.25 KB
  Теорема об алгоритмической неразрешимости проблемы безопасности в произвольной системе На доске множество исходных объектов O o1 o2 oM ; множество исходных субъектов S s1 s2 sN при этом S ⊆ O множество прав доступа субъектов к объектам R матрицей доступа каждая ячейка которой специфицирует права доступа к объектам из конечного набора прав доступа R r1 r2 rK т . Классическая Дискреционная модель реализует произвольное управление...
30524. Основні культурологічні теорії 143 KB
  Історичні науки вивчають процеси становлення і розвитку конкретних народів в їх безпосередній реальності, в хронологічній послідовності подій, вказуючи на конкретні форми міжрегіональної взаємодії.
30526. Модель Белла - Ла-Падулы 97 KB
  Устная часть Основным положением политики безопасности является назначение всем участникам процесса обработки защищаемой информации и документам в которых она содержится специальной метки секретно совершенно секретно и т. Такая метка называется уровнем безопасности. Все уровни безопасности упорядочиваются с помощью установленного отношения доминирования. Контроль доступа осуществляется в зависимости от уровней безопасности взаимодействующих сторон на основании двух правил: 1.