40108

Функция выигрыша в матричных играх без седловой точки. Смешанные и оптимальные смешанные стратегии. Метод сведения решения матричных игр к задаче линейного программирования

Доклад

Менеджмент, консалтинг и предпринимательство

Функция выигрыша в матричных играх без седловой точки. Парная игра с нулевой суммой задается формально матрицей игры матрицей А = {ij} элементы которой определяют выигрыш первого игрока и проигрыш второго если первый игрок выберет iю стратегию а второй jю стратегию. Пара i0j0 называется седловой точкой матрицы решением игры если выполняются условия: mx по столбцу I игрок min по строке II игрок Значение функции выигрыша в седловой точке называется ценой игры. Тогда выигрыш первого игрока при условии что он выбирает...

Русский

2013-10-15

119.5 KB

24 чел.

23. Функция выигрыша в матричных играх без седловой точки. Смешанные и оптимальные смешанные стратегии. Метод сведения решения матричных игр к задаче линейного программирования.

Матричной называют парную игру с нулевой суммой при условии, что каждый игрок имеет конечное число чистых стратегий. Парная игра с нулевой суммой задается формально матрицей игры – матрицей А = {aij}, элементы которой определяют выигрыш первого игрока (и проигрыш второго), если первый игрок выберет i-ю стратегию, а второй - j-ю стратегию. Пара  (i0,j0) называется седловой точкой матрицы (решением игры), если выполняются условия:  (max по столбцу (I игрок), min по строке (II игрок))

Значение функции выигрыша в седловой точке называется ценой игры.

Седловая точка обеспечивает равновесие в игре, но она существует не всегда (н-р, в 2-х пальцевой игре Морра ее нет). В случае, когда нет седловой точки игрокам не выгодно пользоваться одной и той же стратегией, так как в этом случае противник будет выбирать наилучший для себя вариант. Тогда выбор стратегий должен быть вероятностным – выбор осуществляется случайным образом с определенными вероятностями.

Если обозначить через  вероятности выбора i-ой стратегии первым игроком. При этом:

Сумма равна 1, так как он обязан что-то выбрать, у него нет возможности не выбрать

А через  вероятности выбора j-ой стратегии вторым игроком:

то наборы  и  называются смешанными стратегиями первого и второго игроков соответственно. Смешанная стратегия – это набор вероятностей чистых стратегий.

Тогда выигрыш первого игрока при условии, что он выбирает i-ю стратегию, а второй – j-ю стратегию составит .

Функция выигрыша первого игрока  – мат. ожидание выигрыша первого игрока. Соответственно средний выигрыш второго игрока = –M(x, y)

Любая матричная игра имеет решение в смешанных стратегиях, т.е. существует   

Решение задачи (нахождение оптимальных смешанных стратегий) заключается в нахождении седловой точки функции M(x, y) на множестве . Оптимальность понимается в том смысле, что набор устраивает игроков, никто не хочет выбирать другие стратегии.

Тогда  и  называются оптимальными смешанными стратегиями игроков. Задачи заключается в нахождении оптимальных смешанных стратегий игроков и цены игры

Метод сведения решения матричных игр к задаче линейного программирования. (II метод)

Пусть игра определена матрицей   и ценой игры V. По следствию теоремы об оптимальности смешанных стратегий:

Если для смешанных стратегий () и числа V одновременно выполняются (1) и (2), то

– оптимальные стратегии игроков   (m + n неравенств)       (*)

1) Рассмотрим левую часть:

Решение СЛАУ сводится к задаче ЛП.

(1)

2) Рассмотрим правую часть (аналогично):

V меняем на W, так как системы (1)-(2) независимы, поэтому они имеют разные переменные.

(2)

Допустим, решили задачи и получили:

Если в этих решениях последние координаты совпадали бы, то выполнялись бы неравенства:

 

Тогда для каких-то  выполнялось бы следствие теоремы оптимальности.

Покажем двойственность.

Необходимо получить двойственные задачи.

Обозначим

{неравенства (3)-(4) лучше написать в развернутом виде, чтобы была видна двойственность}

  (3)

ЗАМ:

Аналогично для второй задачи:

   (4)

Задачи (3) и (4) – двойственные, т.е. решение одной можно найти из решения другой (в последней симплекс-таблице в строке оценок на местах, соответствующих дополнительным переменным). Значения линейных форм в оптимальной точке совпадут. Поэтому, получив решения , получим

Алгоритм решения:

  1.  по матрице А построить задачи (3) и (4)
  2.  найти решения задач

тогда  – цена игры, оптимальные стратегии игроков:

Преимущества и недостатки метода:

+ сразу получаем решение игры, т.е. не надо переобозначать

+ можно решать игры с любой ценой игры

– больше на 2 переменные

– надо вводить дополнительные переменные, так как


 

А также другие работы, которые могут Вас заинтересовать

49249. ПЛАНИРОВАНИЕ ТЕХНИЧЕСКОГО ОБСЛУЖИВАНИЯ ТРАКТОРОВ И АВТОМОБИЛЕЙ 79.83 KB
  ОПРЕДЕЛЕНИЕ СОСТАВА МТП И ПЛАНИРОВАНИЕ ТЕХНИЧЕСКОГО ОБСЛУЖИВАНИЯ ТРАКТОРОВ ПЛАНИРОВАНИЕ ТЕХНИЧЕСКОГО ОБСЛУЖИВАНИЯ ТРАКТОРОВ РАСЧЕТ ТРУДОЕМКОСТИ И ПРОДОЛЖИТЕЛЬНОСТИ ПРОСТОЕВ ТРАКТОРОВ НА ТО Усвоить методику и приобрести...
49254. Редуктор двухступенчатый червячный 370.19 KB
  Коэффициент потерь одной зубчатой пары при тщательном выполнении и надлежащей смазке не превышает обычно 001. Коэффициент нагрузки: Cg= 1.45 Мпа; SH коэффициент безопасности SH = 11; ZN коэффициент долговечности учитывающий влияние ресурса. продолжительность смены; kг=085 коэффициент годового использования; kс=06 коэффициент суточного использования.
49255. Редуктор червячно-цилиндрический двухступенчатый 361.5 KB
  Поиск путей снижения массы проектируемых объектов является важнейшей предпосылкой дальнейшего прогресса, необходимым условием сбережения природных ресурсов. Большая часть вырабатываемой в настоящее время энергии приходится на механические передачи, поэтому их КПД в известной степени определяет эксплуатационные расходы.
49256. Редуктор червячно-цилиндрический двухступенчатый 356.53 KB
  Коэффициент потерь одной зубчатой пары при тщательном выполнении и надлежащей смазке не превышает обычно 001. Коэффициент нагрузки: Cg= 1.45 Мпа; SH коэффициент безопасности SH = 11; ZN коэффициент долговечности учитывающий влияние ресурса. продолжительность смены; kг=085 коэффициент годового использования; kс=06 коэффициент суточного использования.