26499

Статистические и позиционные игры

Реферат

Менеджмент, консалтинг и предпринимательство

Принятие решений в статистических играх. принятие решений в позиционных играх. Принятие решений в статистических играх. В теории статистических решений известен ряд методик нахождения оптимального решения.

Русский

2013-08-18

30.18 KB

24 чел.

Статистические и позиционные игры.

- принятие решений в статистических играх.

- принятие решений в позиционных играх.

- использование теории полезности в позиционных играх.

Принятие решений в статистических играх.

Статистическая игра – матричная игра, одним из игроков которой является природа. Считается, что действия природы не носят характера сознательного противодействия и природа рассматривается как некоторая незаинтересованная сторона, состояние которой заранее не известно. То есть стороне, принимающей решения необходимо принимать решения в условиях неопределенности. Эта неопределенность обусловлена отсутствием достоверной информации о возможном состоянии природы. Анализ статистических игр начинается с формирования платежной матрицы, в которой активной стороной (игроком А) выступает человек, принимающий решения, а игроком В выступает природа. Тогда элемент платежной матрицы aij – это выигрыш игрока А при использовании стратегии Ai и нахождении природы в состоянии Sj.

Задача анализа статистической игры заключается в том, чтобы выбрать такую стратегию, которая обеспечила бы игроку А максимальный выигрыш. В теории статистических решений известен ряд методик нахождения оптимального решения. При этом можно упростить игру путем отбрасывания доминируемых и дублируемых стратегий. Однако, исключать названные стратегии может только активная сторона, то есть игрок А, так как природа свои стратегии не выбирает, не корректирует. Во многих случаях при решении задач принятия решений целесообразней перейти от матрицы выигрышей к матрице рисков. Риском rij игрока А при реализации им стратегии Ai при состоянии природы в состоянии Sj называется разность между выигрышем, который игрок может получать, если знает состояние природы  бетаj и выигрыш, который он получит, если он применит i-ю стратегию.

 

Матрица рисков дает более наглядную картину неопределенности, так как из матрицы рисков  видно, чем рискует игрок А, применяя ту или иную стратегию. Другими словами, величина риска – это размер платы за отсутствие информации о состоянии природы. При определении подходов к решению задач статистической игры можно выделить следующие ситуации, определяющие степень неопределенности состояний природы:

Первый случай.

Заключается в том, что вероятности нахождения природы в каждом из состояний заданы   , при этом предполагается, что имеем дело с полной системой событий.

Второй случай.

Состоит в том, что вероятности состояний природы не известны, но можно сделать предположение относительно их значений, например, можно определить частоту появления того или иного события.

Третий случай.

Заключается в том, что вероятности qi неизвестны и у нас нет предположений относительно их значений.

Для первой ситуации, когда заданы вероятности состояний природы игроком А принимается решение, исходя из принципа оптимальности в среднем. То есть в качестве оптимальной стратегии игрок должен выбрать такую стратегию, которая обеспечит ему максимальный средний выигрыш или минимальный средний риск.

Максимальный средний выигрыш есть:

Постановка задачи при втором случае, когда вероятности состояния природы неизвестны, но можно сделать предположения относительно их значений. Возможны следующие ситуации:

При первом подходе 2.1 все состояния природы полагаются равновероятными, то есть. Второй случай 2.2 заключается в том, что все состояния природы располагают в порядке убывания степени правдоподобности. Таким образом, формируется определенный ряд состояний и этому ряду состояний ставится в соответствие некоторая убывающая последовательность чисел. Например, вероятности состояния природы можно определить пропорционально числам убывающей арифметической прогрессии. n – максимальный индекс состояния. При третьем подходе 2.3 прибегают к методам экспертных оценок. Считается, что экспертная оценка снижает влияние фактора субъективности.

Третья ситуация. При принятии решения приходится ограничиваться информацией, содержащейся только в матрице выигрыша. При выборе оптимальной стратегии для получения гарантированного выигрыша можно воспользоваться одним из известных критериев оптимальности.

Первый критерий называется критерием максимакса. В соответствии с этим критерием в качестве оптимальной выбирается стратегия, которая максимизирует максимальный выигрыш для каждого состояния природы. Еще называется критерий крайнего оптимизма.

 

Второй критерий – критерий Вальда. Ориентирует игрока А на наихудшие условия и рекомендует выбирать ту стратегию, при которой в худших условиях выигрыш будет максимальным. То есть игроку А рекомендуется исходить всегда из худших условий. Критерий крайнего пессимизма.  

Третий критерий – критерий минимаксного риска Сэвиджа. Этот критерий рекомендует в качестве оптимальной стратегии выбирать такую стратегию, при которой величина риска минимальна, причем в самых неблагоприятных условиях.

Может быть отнесен к категории крайнего пессимизма. При использовании этого критерия пессимизм проявляется в том, что снижается не минимальный выигрыш, а рассматривается максимальная потеря выигрыша.

Четвертый – компромиссный критерий Гурвица. Критерий пессимизма оптимизма. Согласно этому критерию, игрок должен выбрать такую стратегию, которая обеспечит выигрыш не меньше, чем некоторая заданная величина.

В этом выражении альфа представляет собой некоторое число от 0 до 1 и выбирается субъективным в зависимости от оценки ситуации. Говоря проще, чем больше игрок хочет подстраховаться, тем ближе к единице выбирается величина коэффициента альфа. Альфа – мера пессимизма. При альфа=1 критерий Гурвица совпадает с критерием Вальда. А при альфа=0 с критерием крайнего оптимизма.

Выбор критерия базируется на субъективных оценках и прежде чем выбрать оптимальное решение необходимо проанализировать статистическую игру с точки зрения нескольких критериев. Если рекомендации нескольких критериев совпадут, то можно достаточно уверенно принимать решение. В случае противоречивости оценок по различным критериям необходимо более тщательно проанализировать ситуацию и может быть получить дополнительную информацию.

Принятие решений в позиционных играх.

В отличии от статистических игр в позиционных играх анализируется поэтапное принятие решения. В этом случае множество стратегий и состояний природы на текущем этапе определяет совокупность стратегий и состояний природы для следующего этапа. В качестве модели такой игры используются деревья решений, которые представляют собой графическое изображение логической последовательности принятия решений.

Построение дерева решений включает выполнение следующих этапов:

Первый этап: 

постановка проблемы и поиск альтернатив решений включает:

- выявление проблемы путем сравнения достигнутого состояния и желаемого;

- анализ причин, вызвавших это решение;

- определение значимых для постановки проблемы целей.

- определение логической последовательности достижения этих целей.

- подбор альтернативных решений в зависимости от условий внешней среды.

Второй этап: конструирование дерева решений. Дерево решений содержит узлы двух типов: узлы выбора решений (в этих узлах системным аналитиком производится выбор одной из альтернатив, каждая из которых обозначается в виде дуги, выходящей из узла принятия решений. Следует иметь в виду, движение по каждому ребру может соответствовать определенным затратам) и узлы возникновения возможных исходов (соответствуют моменту появления возможных исходов в зависимости от состояния внешней среды. Возникновение возможных исходов количественно задается распределением условных вероятностей). Полезность каждого исхода приводится в выходах U.

Третий этап: Анализ дерева решений производится начиная от конечных исходов к начальному узлу принятия решений. Для узлов возможных исходов определяется среднее значение выигрыша. Например, для узла D среднее значение выигрыша будет мат. ожидание.

Если для узла возможных исходов возможно только одно состояние и один конечный исход, то среднее значение выигрыша будет определяться U6.

В узле принятия решений реализуется принцип максимизации среднего выигрыша либо максимизации ожидаемой полезности. То есть в каждом узле принятия решений системный аналитик выбирает альтернативу, которая приводит к наибольшему выигрышу и наибольшей ожидаемой полезности. Для узла 3 полезность определяется из условия.

На основе полученного значения полезности находятся средние значения выигрышей для узлов возможных исходов. Процесс продолжается до тех пор, пока для начального узла принятия решений не будет определена оптимальная альтернатива.

Четвертый этап: Анализ устойчивости решений. Цель – определить предельные значения вероятности, при которых производится переход к другим альтернативным решениям.

Пятый этап: Оценка ожидаемой ценности уточненной информации. Этот этап целесообразно выполнять в том случае, если с помощью дополнительного мониторинга можно получить более точную информацию о состоянии среды. Проведение дополнительного мониторинга требует дополнительных денег, поэтому его лучше проводить если затраты на его организацию меньше, чем разность в оценке выигрыша до дополнительного обследования и после. Наиболее распространенными способами оценки вероятностей состояний является субъективный подход аналитиков, объективный подход с помощью различных комбинаторных схем, экспериментальных оценок и т.д., экспериментальный подход, основанный на результатах испытаний, оценочный подход и использование известных функций распределения случайных величин.


 

А также другие работы, которые могут Вас заинтересовать

27828. Состав и назначение схемы территориального планирования субъекта РФ 14.68 KB
  На картах показываются административные границы земли лесного фонда земли ООПТ границы земель обороны и безопасности границы земель с х назначения территории объектов культурного наследия границы зон с особыми условиями использования территории границы территорий подверженных риску возникновения ЧС и т. Чертеж отражающий современное состояние использования территории – опорный каркас отражает состояние в котором территория находится сейчас На опорном плане должны быть: границы административные ранжированные по численности населения...
27829. Понятие инвестиционного климата и регулирование инвестиций в регионе РФ 24.84 KB
  Государственное регулирование инвестиционной деятельности Государство для выполнения своих функций регулирования экономики использует как экономические косвенные так и административные прямые методы воздействия на инвестиционную деятельность и экономику страны путем издания и корректировки соответствующих законодательных актов и постановлений а также путем проведения определенной экономической в том числе и инвестиционной политики. Сущность форм и методов государственного регулирования инвестиционной деятельности осуществляемой в...
27830. Основные требования к устройствам АПВ и расчет их параметров. Схемы устройств на переменном и выпрямительном оперативном токе в установках высокого напряжения 177.5 KB
  Основные требования к устройствам АПВ и расчет их параметров. Применение АПВ обязательно для всех ЛЭП всех напряжений на шинах ПС. Основные требования к устройству АПВ и расчет их параметров. АПВ бывают трёх и однофазные.
27831. Дифференциальное реле с торможением: принцип действия, устройство дифференциаль 173 KB
  Дифференциальное реле с торможением: принцип действия устройство дифференциального реле с магнитным торможением на принципе сравнения абсолютных значений двух электрических величин. Использование в схемах ДЗ реле с торможением. 1 – уставка тока срабатывания реле обычного. 2 – ток небаланса реле в зависимости от тока внешнего КЗ.
27832. Дифференциальное реле с механическим торможением. Применение и устройство насыщенного трансформатора тока в дифференциальной защите 86 KB
  Дифференциальное реле с механическим торможением. Система сочетает принцип БНТ и принципы реле с торможением: большинству току небаланса соответствует автоматически больший ток торможения в тормозных обмотках. При КЗ в зоне К2 – реле действует но остается тормозной момент что снижает чувствительность. Rмг мало а коэффициент трансформации велик поэтому ток не баланса по прежнему плохо трансформируется в рабочую обмотку и реле КА загрублено.
27833. Фильтры симметричных составляющих токов и напряжений в релейной защите 95 KB
  Фильтры бывают: RL, RC и трансформаторные. Бывают простые и комбинированные, ток на выходе пропорционален всем составляющим.
27834. Трансформаторы тока в схемах релейной защиты 162.5 KB
  F1 – F2 = Fном I1ω1 – I2ω2 = Iномω1 разделив на ω2: I`1 – I2 = I`ном следовательно I`1 = I2 I`ном Если ТТ идеальный Iном = 0 I`1 = I2 – это хорошо но не возможно сделать без Iном т. Для идеального ТТ nт = nв Векторная диаграмма для ТТ Угол γ определяется потерями в стали трансформатора Е2 – опережает Ф на 90 I2 – отстает от Е2 на угол φ который определяется R и Х нагрузки и вторичной обмотки z2 и zн Угол δ – угловая погрешность ТТ ΔI – токовая...
27835. Расчет выдержек времени МТЗ 76 KB
  Основным пусковым органом МТЗ с независимой выдержкой времени является реле РТ40 а МТЗ с ограниченной выдержкой времени – РТ80. Реле РТ80 Сложное большое реле которое совмещает в себе токовое времени и указательное реле. Соответственно защита на этом реле имеет преимущества. В этом реле РТ80 есть два элемента: индукционный элемент эл.
27836. Выбор тока срабатывания максимальной токовой защиты 87 KB
  max Котс – учитывает неточность расчета погрешности в работе реле. Iвз – максимальное значение тока при котором пусковой орган защиты – реле тока – возвращается в первоначальное состояние. коэффициент возврата защиты 1 всегда Iвз = Кв Iсз эта формула получена для первичных реле где Iсз = Iср Iкз = Iсз Схема включения обмоток реле и трансформаторов тока в неполную звезду для этой схемы Iр = Iср при КЗ...