21813

ТЕОРИЯ МАТРИЧНЫХ ИГР. Примеры решения задач при парной игре с нулевой суммой

Лекция

Менеджмент, консалтинг и предпринимательство

В разных случаях числа aii могут иметь различный смысл €œвыигрыш€ €œпотери€ €œплатеж€. Игра это действительный или формальный конфликт в котором имеется по крайней мере два участника каждый из которых стремится к достижению собственных целей Правилами игры называют допустимые действия каждого из игроков направленные на достижение некоторой цели. Платежом называется количественная оценка результатов игры. если проигрыш одного игрока равен выигрышу другого.

Русский

2013-08-03

91 KB

97 чел.

ТЕМА 8. ТЕОРИЯ МАТРИЧНЫХ ИГР

Лекция 9

1. Постановка задачи выбора в условиях неопределенности

2.Основные определения и теоремы теории игр

3.Примеры решения задач при парной игре с нулевой суммой.

1. Постановка задачи выбора в условиях неопределенности

Ранее мы познакомились с задачами выбора решения, когда каждой альтернативе (варианту выбора) соответствовал определенный исход. Это был, таким образом, выбор в условиях определенности.

В реальных задачах часто приходится иметь дело с ситуацией, когда альтернатива неоднозначно определяет последствия сделанного выбора. Другими словами, имеется набор возможных исходов y  Y, из которых один окажется совмещенным с выбранной альтернативой, но с какой именно – в момент выбора неизвестно, но станет ясно только тогда, когда выбор уже сделан, и ничего изменить нельзя. Хотя с разной альтернативой x  X связано одно и то же множество исходов Y, для разных альтернатив разные исходы имеют неодинаковое значение.

1.1 Задание неопределенности с помощью матрицы

В случае дискретного набора альтернатив и исходов описанную выше стиуацию можно представить в виде матрицы

X,  Y

y1

y2

y3

yj

ym

x1

a11

a12

a13

a1i

a1m

x2

a21

a22

a23

a2i

a2m

xi

ai1

ai2

ai3

aii

aim

xn

an1

an2

an3

ani

anm

Вектор y = (y1,….ym) – это все возможные исходы. Числа aii выражают оценку ситуации, когда сделан выбор альтернативы хi и реализовался исход yi. В разных случаях числа aii могут иметь различный смысл (“выигрыш”, “потери”, “платеж”).

Возможны два варианта:

  1.  все строки ai = (ai1, …. aim) (т.е. мы видим, это тоже вектор) одинаковы и проблемы выбора между альтернативами нет;
  2.  строки различны, следовательно, возникает проблемв выбора альтернативы.

В случае непрерывных множеств X и Y ситуация описывается аналогично с помощью задаваемых на этих множествах функциях a (x,y), x  X, y  Y.

Мы несколько определились с ситуацией, однако всего этого пока недостаточно для формальной постановки задачи выбора. Реальные задачи могут быть самыми разными и требуют, соответственно, самых разных методов решения.

2.Основные определения и теоремы теории игр

Теория игр относится к разделу прикладной математики исследующей математические модели принятия решений в условиях конфликта, противоречий и неопределенности. Задачей теории игр является нахождение оптимальной стратегии поведения в условиях конфликта, неопределенности или противодействия какой то стороны в этой ситуации независимо от того сознательно или неосознанно это происходит. Игровые математические модели позволяют  не только найти оптимальную стратегию, которая не всегда однозначна, но и оценить каждый вариант решения с различных иногда противоречивых точек зрения, а так же глубже разобраться во всех сложностях и неопределенностях реальной ситуации для принятия до конца продуманного решения.

Началом теории игр как последовательной математической теории поведения можно считать выход в свет  50 лет назад монографии Дж. фон Неймана и О. Моргенштерна.  Французский математик Э. Мулен так характеризует значение теории игр для социально-экономических наук: «По нашему мнению, теория игр представляет собой набор инструментов для построения моделей в экономических и политических теориях. Единственным, но вполне достаточным оправданием существования теории игр служит её растущее применение в этих дисциплинах. Она является поистине неиссякаемым источником гибких концепций, каждая из которых проливает свет на определенные стороны социальных взаимоотношений.».

Вначале введем несколько фундаментальных понятия теории игр, после этого дадим определение этому разделу прикладной математики.

 Конфликт - это противоречие, вызванное противоположными интересами сторон.

 Конфликтная ситуация - ситуация в которой участвуют стороны интересы которых полностью или частично противоположны.

 Игра - это действительный или формальный конфликт, в котором имеется по крайней мере два участника, каждый из которых стремится к достижению собственных целей

 Правилами игры называют допустимые действия каждого из игроков, направленные на достижение некоторой цели.

 Платежом называется количественная оценка результатов игры.

 Парная игра - игра в которой участвуют только две стороны (два игрока).

 Игра с нулевой суммой - парная игра при которой сумма платежа равна нулю,  т. е. если проигрыш одного игрока, равен выигрышу другого.

 Стратегия игрока - это однозначный выбор игрока в каждой из возможных ситуаций, когда этот игрок должен сделать личный ход.

 Оптимальная стратегия - это такая стратегия игрока, которая при многократном повторении игры обеспечивает ему максимально возможный средний выигрыш или минимально возможный средний проигрыш.

Пусть мы имеем парную игру с нулевой суммой, один игрок может выбрать при данном ходе i -ю стратегию из m своих возможных (i=1..m), а второй, не зная выбора первого  j -ю стратегию из n своих возможных стратегий (j=1..n). В результате первый игрок выигрывает величину , а второй проигрывает эту величину. Из этих величин составим матрицу A.

                              A 

 Платежная матрица - так назовем матрицу A или еще по другому матрицей игры.

 Конечной игрой размерности (m  n) называется игра определенная матрицей А имеющей m строк и n столбцов.

Максимином или нижней ценой игры назавем число                                ,

а соответствующая ему стратегия (строка) максиминной.

 Минимаксом или верхней ценой игры назавем число

,

а соответствующая ему стратегия (столбец) минимаксной.

 Теорема 1.1. Нижняя цена игры всегда не превосходит верхнюю цену игры.

 Игрой с седловой точкой  называется игра для которой .

 Ценой игры называется величина , если .

В случае игры с седловой точкой , игрокам выгодно придерживатся максиминной и минимаксной стратегий и не выгодно отклонятся от них . В таких случаях про игру говорят, что в ней имеет место равновесие в чистых стратегиях.

Возможна игра и с несколькими седловыми точками. Тогда игра имеет несколько оптимальных решений, но с одинаковой ценой игры.

Чаще встречаются матричные игры без седловой точки, когда          и тогда для нахождения её решения используются смешанные стратегии.

 Смешанной стратегией игрока называется вектор, каждая из компонент которого показывает относительную частоту использования игроком соответствующей чистой стратегии.

 Теорема 1.2. Основная теорема теории матричных игр. Всякая матричная игра с нулевой суммой имеет решение в смешанных стратегиях.

 Теорема 1.3.  Если один из игроков применяет оптимальную смешанную стратегию, то его выигрыш равен цене игры в не зависимости от того, с какими частотами будет применять второй игрок свои стратегии (в том числе и чистые стратегии).

 2. Примеры решения задач при парной игре с нулевой суммой

   Задача 1.1.

Найти решение игры, заданной матрицей А

                         А=.

   

   Решение. Прежде всего проверим наличие седловой точки в данной матрице.

Для этого найдем нижнюю и верхнюю цену игры.

Минимальные элементы по строкам равны (2 и 3) тогда нижняя цена игры   = max (2; 3) = 3. Максимальные элементы по столбцам равны (3 и 6) тогда верхняя цена игры = min (3; 6) = 3. Отсюда видно, что = =3 и мы имеем седловую точку .= 3, т.е. задача имеет решение в чистых стратегиях.

Оптимальные чистые стратегии для первого и второго игроков равны соответственно U* = (0; 1),  Z* = (1; 0), а цена игры = 3.

   Задача 1.2.

Найти решение игры, заданной матрицей А

                         А=.

   Решение. Прежде всего проверим наличие седловой точки в данной матрице.

Для этого найдем нижнюю и верхнюю цену игры.

Минимальные элементы по строкам равны (2 и 3) тогда нижняя цена игры   = max (2; 3) = 3. Максимальные элементы по столбцам равны (4 и 6) тогда верхняя цена игры = min (4; 6) = 4. Отсюда видно, что    и мы имеем игру, которая имеет решение в смешанных стратегиях, а цена игры  .

Предположим, что для первого игрока смешанная стратегия задается вектором U = (u1; u2). Первый игрок, если придерживается своей оптимальной стратегии, независимо от стратегии второго игрока получает цену игры , т.е.

                       4u1* + 3u2* =                                     (1)

                       2u1* + 6u2* = .

 Кроме этого относительные частоты связаны условием:

                        u1* + u2* = 1.

Решаем полученную систему трех линейных уравнений с тремя неизвестными. Получим оптимальную стратегию первого игрока и цену игры:

U* = ( u1* ;  u2*) = (3/5; 2/5),   = 18/5.

Составим уравнения для нахождения оптимальной стратегии второго игрока, если при любой чистой стратегии первого, второй проигрывает цену игры:

                       4z1* + 2z2* = = 18/5                   (2)

                       3z1* + 6z2* = = 18/5.

Решаем полученную систему двух линейных уравнений с двумя неизвестными. Получим оптимальную стратегию второго игрока:

Z* = ( z1* ;  z2*) = (4/5; 1/5).

Рассмотрим геометрическую интерпретацию этой задачи в смешанных стратегиях.  Для этого в плоскости  введем систему координат и на горизонтальной оси Ou отложим вероятность применения первым игроком его двух стратегий, сумма этих вероятностей равна 1, поэтому весь график расположится на отрезке единичной длины. В точках 0 стратегия (1; 0), а в 1 стратегия (0; 1).

                                          Рисунок 1.

По оси ординат в точке 0 отложим выигрыши первого игрока по первой его стратегии при обеих стратегиях второго, а в точке 1 при второй стратегии первого игрока.  Соединим эти платежи по столбцам, тогда пересечение прямых дадут решение системы уравнений (1), а ордината этой точки цену игры .

Анологично можно построить график для нахождения оптимальной стратегии второго игрока.

Мы рассмотрели только самый простой вариант парной матричной игры с нулевой суммой, но она достаточно наглядно показывает, что иногда можно количественно оценить и выбрать оптимальный вариант поведения в конфликтной ситуации.


 

А также другие работы, которые могут Вас заинтересовать

8482. Социальные последствия научно-технического прогресса 23.4 KB
  Социальные последствия научно-технического прогресса Развитие техники, начиная с эпохи Возрождения, тесно связано со становлением науки. Слившись воедино, две интеллектуальные и творческие силы образовали достаточно устойчивый социальный процесс, ко...
8483. Философия техники 28.75 KB
  Философия техники О становлении философии техники Область философских интересов человека изменяется от одной эпохи к другой, с ростом значения той или иной области деятельности человека она становится все более самостоятельной, начиная привлекать к ...
8484. Философия и техника 185 KB
  Философия и техника Техника как область человеческой деятельности с давних пор привлекает к себе внимание философов. Мыслители Древней Греции и Рима, эпохи Возрождения, нового времени обращались к рассмотрению теоретических и философских проблем тех...
8485. Ответы по философии. Место философии в системе знаний о природе и человеке 198 KB
  Сущность и предмет философии. Место философии в системе знаний о природе и человеке. Философия - это особая форма общественного сознания и познания мира, вырабатывающая систему знаний об основаниях и фундаментальных принципах человеческого быти...
8486. Доктрина Оптимального Строя 83 KB
  Доктрина Оптимального Строя История цивилизаций - это история войн, междоусобиц, революций. Воинская доблесть, умение побеждать, храбрость, патриотизм - безусловно, достоинство Нации, и мы по праву гордимся своими Героями. Но нет, и...
8487. Философия. Определение предмета философии как проблема 57.56 KB
  №1 Определение предмета философии как проблема Ф. возникает в Индии и Китае (12-8 в. до н.э.). Форму самостоятельного знания принимает в греческой ф. С 6 в. до н.э. ф. выделяет себя как знание о первоначалах бытия. Рефлексия - способ объяснения быти...
8488. Современная концепция брендинга 2.68 MB
  Современная концепция брендинга. Современная концепция брендинга Четыре уровня качества бренда Классификация брендов Преимущества брендов Современная концепция брендинга. Новая концепция брендинга основывается на марочном вид...
8489. Поперечная рама стального каркаса здания 1.09 MB
  Поперечная рама стального каркаса здания Задание на курсовой проект Стальной каркас производственного здания Запроектировать поперечную раму стального каркаса одноэтажного здания по следующим исходным данным: длина здания L = 78 м...
8490. Автоматизированные информационные системы в экономике 2.03 MB
  Учебно-методическое пособие Автоматизированные информационные системы в экономике предназначено для студентов экономических специальностей высших учебных заведений. Рассматриваются информационные процессы в экономике, их состав и особенности функцио...