40108

Функция выигрыша в матричных играх без седловой точки. Смешанные и оптимальные смешанные стратегии. Метод сведения решения матричных игр к задаче линейного программирования

Доклад

Менеджмент, консалтинг и предпринимательство

Функция выигрыша в матричных играх без седловой точки. Парная игра с нулевой суммой задается формально матрицей игры матрицей А = {ij} элементы которой определяют выигрыш первого игрока и проигрыш второго если первый игрок выберет iю стратегию а второй jю стратегию. Пара i0j0 называется седловой точкой матрицы решением игры если выполняются условия: mx по столбцу I игрок min по строке II игрок Значение функции выигрыша в седловой точке называется ценой игры. Тогда выигрыш первого игрока при условии что он выбирает...

Русский

2013-10-15

119.5 KB

24 чел.

23. Функция выигрыша в матричных играх без седловой точки. Смешанные и оптимальные смешанные стратегии. Метод сведения решения матричных игр к задаче линейного программирования.

Матричной называют парную игру с нулевой суммой при условии, что каждый игрок имеет конечное число чистых стратегий. Парная игра с нулевой суммой задается формально матрицей игры – матрицей А = {aij}, элементы которой определяют выигрыш первого игрока (и проигрыш второго), если первый игрок выберет i-ю стратегию, а второй - j-ю стратегию. Пара  (i0,j0) называется седловой точкой матрицы (решением игры), если выполняются условия:  (max по столбцу (I игрок), min по строке (II игрок))

Значение функции выигрыша в седловой точке называется ценой игры.

Седловая точка обеспечивает равновесие в игре, но она существует не всегда (н-р, в 2-х пальцевой игре Морра ее нет). В случае, когда нет седловой точки игрокам не выгодно пользоваться одной и той же стратегией, так как в этом случае противник будет выбирать наилучший для себя вариант. Тогда выбор стратегий должен быть вероятностным – выбор осуществляется случайным образом с определенными вероятностями.

Если обозначить через  вероятности выбора i-ой стратегии первым игроком. При этом:

Сумма равна 1, так как он обязан что-то выбрать, у него нет возможности не выбрать

А через  вероятности выбора j-ой стратегии вторым игроком:

то наборы  и  называются смешанными стратегиями первого и второго игроков соответственно. Смешанная стратегия – это набор вероятностей чистых стратегий.

Тогда выигрыш первого игрока при условии, что он выбирает i-ю стратегию, а второй – j-ю стратегию составит .

Функция выигрыша первого игрока  – мат. ожидание выигрыша первого игрока. Соответственно средний выигрыш второго игрока = –M(x, y)

Любая матричная игра имеет решение в смешанных стратегиях, т.е. существует   

Решение задачи (нахождение оптимальных смешанных стратегий) заключается в нахождении седловой точки функции M(x, y) на множестве . Оптимальность понимается в том смысле, что набор устраивает игроков, никто не хочет выбирать другие стратегии.

Тогда  и  называются оптимальными смешанными стратегиями игроков. Задачи заключается в нахождении оптимальных смешанных стратегий игроков и цены игры

Метод сведения решения матричных игр к задаче линейного программирования. (II метод)

Пусть игра определена матрицей   и ценой игры V. По следствию теоремы об оптимальности смешанных стратегий:

Если для смешанных стратегий () и числа V одновременно выполняются (1) и (2), то

– оптимальные стратегии игроков   (m + n неравенств)       (*)

1) Рассмотрим левую часть:

Решение СЛАУ сводится к задаче ЛП.

(1)

2) Рассмотрим правую часть (аналогично):

V меняем на W, так как системы (1)-(2) независимы, поэтому они имеют разные переменные.

(2)

Допустим, решили задачи и получили:

Если в этих решениях последние координаты совпадали бы, то выполнялись бы неравенства:

 

Тогда для каких-то  выполнялось бы следствие теоремы оптимальности.

Покажем двойственность.

Необходимо получить двойственные задачи.

Обозначим

{неравенства (3)-(4) лучше написать в развернутом виде, чтобы была видна двойственность}

  (3)

ЗАМ:

Аналогично для второй задачи:

   (4)

Задачи (3) и (4) – двойственные, т.е. решение одной можно найти из решения другой (в последней симплекс-таблице в строке оценок на местах, соответствующих дополнительным переменным). Значения линейных форм в оптимальной точке совпадут. Поэтому, получив решения , получим

Алгоритм решения:

  1.  по матрице А построить задачи (3) и (4)
  2.  найти решения задач

тогда  – цена игры, оптимальные стратегии игроков:

Преимущества и недостатки метода:

+ сразу получаем решение игры, т.е. не надо переобозначать

+ можно решать игры с любой ценой игры

– больше на 2 переменные

– надо вводить дополнительные переменные, так как


 

А также другие работы, которые могут Вас заинтересовать

73059. В.С Соловьев (1853 - 1900) 35.5 KB
  Центральная идея его философии идея всеединства. В аксиологии всеединства центральное место занимает абсолютная ценность Истины Добра и Красоты соответствующих трём Ипостасям Божественной Троицы. Основой всеединства у Соловьева выступает божественная троица в ее связи со всеми божественными творениями...
73060. Понятие: общая характеристика, объём и содержание, виды понятий, отношения между понятиями 42 KB
  Понятие - форма мысли, отражающая предметы в их общих, существенных и отличительных признаках. Понятие может отражать явление, процесс, предмет (как материальный, вещественный, так и идеальный, мнимый, воображаемый). Главное — отражать общее и в то же время существенное, отличительное, специфическое в этом предмете.
73061. Определение понятий, виды определений и правила 24.5 KB
  Определение понятий виды определений и правила. Определение понятия логическая операция раскрывающая содержание понятия т. Как логическая операция определение состоит из двух элементов: определяемого понятия понятия содержание которых требуется раскрыть...
73062. Виды умозаключений: дедукция, индукция, аналогия 23 KB
  Умозаключение - форма мышления посредством которой из одного или нескольких суждений выводится новое суждение; это такая мыслительная структура в которой из двух или более истинных исходных суждений называемых посылками на основании определенной логической связи между ними формируется новое истинное суждение.
73063. Системный и синергетический подходы к культуре: М.Каган, Э.Маркарян, Л.Уайт 35 KB
  Различая три основные формы бытия — бытие природы, бытие общества и бытие человека, он полагает, что культура в самом общем, философском плане представляет собою четвертую форму бытия, которая порождена деятельностью человека.
73065. Политическая философия русского либерализма 28.5 KB
  Личность и исторический процесс в историософской концепции Кавелина; проблема собственности и государства в филии права Чичерина Либерализм возник в екатерининскую эпоху окончательно оформился к середине 19 века. Философия личности. Необходима новая филия постороенная на антропологии.
73066. Философия науки, становление и основные этапы развития 31 KB
  Как философская дисциплина она представлена различными концепциями которые предлагают ту или иную модель развития науки различными подходами и взглядами. Развитие философии науки в конце XIX в. выступает одним из решающих импульсов развития самой науки.
73067. Этика долга Канта 33 KB
  Этическая стратегия Канта ориентирована не на то как должны вести себя индивиды в тех или иных ситуациях не на конкретные добродетели а на обязательства которые сохраняются при всех обстоятельствах и применительно ко всем разумным существам.