26499

Статистические и позиционные игры

Реферат

Менеджмент, консалтинг и предпринимательство

Принятие решений в статистических играх. принятие решений в позиционных играх. Принятие решений в статистических играх. В теории статистических решений известен ряд методик нахождения оптимального решения.

Русский

2013-08-18

30.18 KB

24 чел.

Статистические и позиционные игры.

- принятие решений в статистических играх.

- принятие решений в позиционных играх.

- использование теории полезности в позиционных играх.

Принятие решений в статистических играх.

Статистическая игра – матричная игра, одним из игроков которой является природа. Считается, что действия природы не носят характера сознательного противодействия и природа рассматривается как некоторая незаинтересованная сторона, состояние которой заранее не известно. То есть стороне, принимающей решения необходимо принимать решения в условиях неопределенности. Эта неопределенность обусловлена отсутствием достоверной информации о возможном состоянии природы. Анализ статистических игр начинается с формирования платежной матрицы, в которой активной стороной (игроком А) выступает человек, принимающий решения, а игроком В выступает природа. Тогда элемент платежной матрицы aij – это выигрыш игрока А при использовании стратегии Ai и нахождении природы в состоянии Sj.

Задача анализа статистической игры заключается в том, чтобы выбрать такую стратегию, которая обеспечила бы игроку А максимальный выигрыш. В теории статистических решений известен ряд методик нахождения оптимального решения. При этом можно упростить игру путем отбрасывания доминируемых и дублируемых стратегий. Однако, исключать названные стратегии может только активная сторона, то есть игрок А, так как природа свои стратегии не выбирает, не корректирует. Во многих случаях при решении задач принятия решений целесообразней перейти от матрицы выигрышей к матрице рисков. Риском rij игрока А при реализации им стратегии Ai при состоянии природы в состоянии Sj называется разность между выигрышем, который игрок может получать, если знает состояние природы  бетаj и выигрыш, который он получит, если он применит i-ю стратегию.

 

Матрица рисков дает более наглядную картину неопределенности, так как из матрицы рисков  видно, чем рискует игрок А, применяя ту или иную стратегию. Другими словами, величина риска – это размер платы за отсутствие информации о состоянии природы. При определении подходов к решению задач статистической игры можно выделить следующие ситуации, определяющие степень неопределенности состояний природы:

Первый случай.

Заключается в том, что вероятности нахождения природы в каждом из состояний заданы   , при этом предполагается, что имеем дело с полной системой событий.

Второй случай.

Состоит в том, что вероятности состояний природы не известны, но можно сделать предположение относительно их значений, например, можно определить частоту появления того или иного события.

Третий случай.

Заключается в том, что вероятности qi неизвестны и у нас нет предположений относительно их значений.

Для первой ситуации, когда заданы вероятности состояний природы игроком А принимается решение, исходя из принципа оптимальности в среднем. То есть в качестве оптимальной стратегии игрок должен выбрать такую стратегию, которая обеспечит ему максимальный средний выигрыш или минимальный средний риск.

Максимальный средний выигрыш есть:

Постановка задачи при втором случае, когда вероятности состояния природы неизвестны, но можно сделать предположения относительно их значений. Возможны следующие ситуации:

При первом подходе 2.1 все состояния природы полагаются равновероятными, то есть. Второй случай 2.2 заключается в том, что все состояния природы располагают в порядке убывания степени правдоподобности. Таким образом, формируется определенный ряд состояний и этому ряду состояний ставится в соответствие некоторая убывающая последовательность чисел. Например, вероятности состояния природы можно определить пропорционально числам убывающей арифметической прогрессии. n – максимальный индекс состояния. При третьем подходе 2.3 прибегают к методам экспертных оценок. Считается, что экспертная оценка снижает влияние фактора субъективности.

Третья ситуация. При принятии решения приходится ограничиваться информацией, содержащейся только в матрице выигрыша. При выборе оптимальной стратегии для получения гарантированного выигрыша можно воспользоваться одним из известных критериев оптимальности.

Первый критерий называется критерием максимакса. В соответствии с этим критерием в качестве оптимальной выбирается стратегия, которая максимизирует максимальный выигрыш для каждого состояния природы. Еще называется критерий крайнего оптимизма.

 

Второй критерий – критерий Вальда. Ориентирует игрока А на наихудшие условия и рекомендует выбирать ту стратегию, при которой в худших условиях выигрыш будет максимальным. То есть игроку А рекомендуется исходить всегда из худших условий. Критерий крайнего пессимизма.  

Третий критерий – критерий минимаксного риска Сэвиджа. Этот критерий рекомендует в качестве оптимальной стратегии выбирать такую стратегию, при которой величина риска минимальна, причем в самых неблагоприятных условиях.

Может быть отнесен к категории крайнего пессимизма. При использовании этого критерия пессимизм проявляется в том, что снижается не минимальный выигрыш, а рассматривается максимальная потеря выигрыша.

Четвертый – компромиссный критерий Гурвица. Критерий пессимизма оптимизма. Согласно этому критерию, игрок должен выбрать такую стратегию, которая обеспечит выигрыш не меньше, чем некоторая заданная величина.

В этом выражении альфа представляет собой некоторое число от 0 до 1 и выбирается субъективным в зависимости от оценки ситуации. Говоря проще, чем больше игрок хочет подстраховаться, тем ближе к единице выбирается величина коэффициента альфа. Альфа – мера пессимизма. При альфа=1 критерий Гурвица совпадает с критерием Вальда. А при альфа=0 с критерием крайнего оптимизма.

Выбор критерия базируется на субъективных оценках и прежде чем выбрать оптимальное решение необходимо проанализировать статистическую игру с точки зрения нескольких критериев. Если рекомендации нескольких критериев совпадут, то можно достаточно уверенно принимать решение. В случае противоречивости оценок по различным критериям необходимо более тщательно проанализировать ситуацию и может быть получить дополнительную информацию.

Принятие решений в позиционных играх.

В отличии от статистических игр в позиционных играх анализируется поэтапное принятие решения. В этом случае множество стратегий и состояний природы на текущем этапе определяет совокупность стратегий и состояний природы для следующего этапа. В качестве модели такой игры используются деревья решений, которые представляют собой графическое изображение логической последовательности принятия решений.

Построение дерева решений включает выполнение следующих этапов:

Первый этап: 

постановка проблемы и поиск альтернатив решений включает:

- выявление проблемы путем сравнения достигнутого состояния и желаемого;

- анализ причин, вызвавших это решение;

- определение значимых для постановки проблемы целей.

- определение логической последовательности достижения этих целей.

- подбор альтернативных решений в зависимости от условий внешней среды.

Второй этап: конструирование дерева решений. Дерево решений содержит узлы двух типов: узлы выбора решений (в этих узлах системным аналитиком производится выбор одной из альтернатив, каждая из которых обозначается в виде дуги, выходящей из узла принятия решений. Следует иметь в виду, движение по каждому ребру может соответствовать определенным затратам) и узлы возникновения возможных исходов (соответствуют моменту появления возможных исходов в зависимости от состояния внешней среды. Возникновение возможных исходов количественно задается распределением условных вероятностей). Полезность каждого исхода приводится в выходах U.

Третий этап: Анализ дерева решений производится начиная от конечных исходов к начальному узлу принятия решений. Для узлов возможных исходов определяется среднее значение выигрыша. Например, для узла D среднее значение выигрыша будет мат. ожидание.

Если для узла возможных исходов возможно только одно состояние и один конечный исход, то среднее значение выигрыша будет определяться U6.

В узле принятия решений реализуется принцип максимизации среднего выигрыша либо максимизации ожидаемой полезности. То есть в каждом узле принятия решений системный аналитик выбирает альтернативу, которая приводит к наибольшему выигрышу и наибольшей ожидаемой полезности. Для узла 3 полезность определяется из условия.

На основе полученного значения полезности находятся средние значения выигрышей для узлов возможных исходов. Процесс продолжается до тех пор, пока для начального узла принятия решений не будет определена оптимальная альтернатива.

Четвертый этап: Анализ устойчивости решений. Цель – определить предельные значения вероятности, при которых производится переход к другим альтернативным решениям.

Пятый этап: Оценка ожидаемой ценности уточненной информации. Этот этап целесообразно выполнять в том случае, если с помощью дополнительного мониторинга можно получить более точную информацию о состоянии среды. Проведение дополнительного мониторинга требует дополнительных денег, поэтому его лучше проводить если затраты на его организацию меньше, чем разность в оценке выигрыша до дополнительного обследования и после. Наиболее распространенными способами оценки вероятностей состояний является субъективный подход аналитиков, объективный подход с помощью различных комбинаторных схем, экспериментальных оценок и т.д., экспериментальный подход, основанный на результатах испытаний, оценочный подход и использование известных функций распределения случайных величин.


 

А также другие работы, которые могут Вас заинтересовать

50515. Создание запроса к внешним источникам данных 109.5 KB
  Регион адрес Город адрес Улица адрес Предприятие Статус предпр. Регион адрес Город адрес Улица адрес Семестр Учебный год Задолженность экзамены Задолженность зачеты Задолженность оплата Пол Задание 2.
50516. Безопасность систем баз данных. Методические указания 200 KB
  Методические указания к лабораторным работам по дисциплине Безопасность систем баз данных Для студентов специальности 090105 Комплексное обеспечение информационной безопасности автоматизированных систем Ижевск 2007 УДК. Методические указания предназначены для выполнения лабораторных работ по дисциплине Безопасность систем баз данных для студентов специальности 090105 – Комплексное обеспечение безопасности автоматизированных систем Данные методические указания предназначены для проведения...
50517. Реализация диалогового интерфейса в СУБД FoxPro. Язык запросов SQL 212 KB
  Форму можно создать с помощью мастера формы Form Wizrd Мастер формы. Создать структуру файла БД в соответствии с вариантом См. Создать форму с помощью мастера. Создать форму с помощью конструктора см.
50518. Безопасность жизнедеятельности. Лабораторный практикум 244.5 KB
  Оптимальные и допустимые величины показателей микроклимата устанавливаются в зависимости от: 1 периода года; холодный период года характеризуется среднесуточной температурой наружного воздуха 10оС и ниже теплый выше 10оС; 2 категории работ по уровню энергозатрат организма.54896 устанавливает что при температуре воздуха на рабочих местах 25 оС и выше...
50519. Закрытый склад. Расчет деревянной конструкции 373.77 KB
  В курсовом проекте произведен расчет деревянных конструкций гнутоклееной рамы. Определены расчетные и нормативные нагрузки на перекрытие и поперечную раму здания. Подобрано сечение элементов поперечника. Выбраны конструктивные решения. Осуществлены расчеты узлов поперечника.
50520. Исследование процессов во влажном воздухе 138.5 KB
  Изучение процессов изменения состояния влажного воздуха приобретение навыков измерения влажности с помощью аспирационного психрометра и Id диаграммы. Смесь сухого воздуха с водяным паром называется влажным воздухом. Соответственно этому влажный воздух бывает: насыщенным влажным воздухом – смесь сухого воздуха с насыщенным водяным паром; ненасыщенным влажным воздухом – смесь сухого воздуха с перегретым водяным паром. При дальнейшем охлаждении влажного воздуха происходит конденсация пара.
50521. Определение настроек BIOS персонального компьютера 62 KB
  Раздел Power Параметр CPI PIC support установлен в положение Enbled разрешено. Возможные значения: Enbled Disbled. Следует оставить данный параметр без изменений Enbled поскольку данным процессором используется технология HyperTreding в противном случае можно нарушить нормальное функционирование системы либо снизить ее производительность. Параметр Microcode Updtion установлен в положение Enbled.
50523. ДОСЛІДЖЕННЯ ПРИНЦИПІВ РОБОТИ ВИМІРЮВАЛЬНИХ КАНАЛІВ ТЕМПЕРАТУРИ НА БАЗІ МІКРОПРОЦЕСОРНОГО ВИМІРЮВАЧА-РЕГУЛЯТОРА ТРМ1 869.5 KB
  Ознайомлення з методами вимірювання температури. КОРОТКІ ТЕОРЕТИЧНІ ВІДОМОСТІ Методи вимірювання температури і температурні шкали Виміряти температуру якогонебудь тіла безпосередньо тобто так як вимірюють інші фізичні величини наприклад довжину масу обєм або час не представляється можливим тому що в природі не існує еталона або зразка одиниці цієї величини. Тому визначення температури речовини роблять за допомогою спостереження за зміною фізичних властивостей іншої так званої термометричної речовини яка при зіткненні з нагрітим...