21813

ТЕОРИЯ МАТРИЧНЫХ ИГР. Примеры решения задач при парной игре с нулевой суммой

Лекция

Менеджмент, консалтинг и предпринимательство

В разных случаях числа aii могут иметь различный смысл €œвыигрыш€ €œпотери€ €œплатеж€. Игра это действительный или формальный конфликт в котором имеется по крайней мере два участника каждый из которых стремится к достижению собственных целей Правилами игры называют допустимые действия каждого из игроков направленные на достижение некоторой цели. Платежом называется количественная оценка результатов игры. если проигрыш одного игрока равен выигрышу другого.

Русский

2013-08-03

91 KB

95 чел.

ТЕМА 8. ТЕОРИЯ МАТРИЧНЫХ ИГР

Лекция 9

1. Постановка задачи выбора в условиях неопределенности

2.Основные определения и теоремы теории игр

3.Примеры решения задач при парной игре с нулевой суммой.

1. Постановка задачи выбора в условиях неопределенности

Ранее мы познакомились с задачами выбора решения, когда каждой альтернативе (варианту выбора) соответствовал определенный исход. Это был, таким образом, выбор в условиях определенности.

В реальных задачах часто приходится иметь дело с ситуацией, когда альтернатива неоднозначно определяет последствия сделанного выбора. Другими словами, имеется набор возможных исходов y  Y, из которых один окажется совмещенным с выбранной альтернативой, но с какой именно – в момент выбора неизвестно, но станет ясно только тогда, когда выбор уже сделан, и ничего изменить нельзя. Хотя с разной альтернативой x  X связано одно и то же множество исходов Y, для разных альтернатив разные исходы имеют неодинаковое значение.

1.1 Задание неопределенности с помощью матрицы

В случае дискретного набора альтернатив и исходов описанную выше стиуацию можно представить в виде матрицы

X,  Y

y1

y2

y3

yj

ym

x1

a11

a12

a13

a1i

a1m

x2

a21

a22

a23

a2i

a2m

xi

ai1

ai2

ai3

aii

aim

xn

an1

an2

an3

ani

anm

Вектор y = (y1,….ym) – это все возможные исходы. Числа aii выражают оценку ситуации, когда сделан выбор альтернативы хi и реализовался исход yi. В разных случаях числа aii могут иметь различный смысл (“выигрыш”, “потери”, “платеж”).

Возможны два варианта:

  1.  все строки ai = (ai1, …. aim) (т.е. мы видим, это тоже вектор) одинаковы и проблемы выбора между альтернативами нет;
  2.  строки различны, следовательно, возникает проблемв выбора альтернативы.

В случае непрерывных множеств X и Y ситуация описывается аналогично с помощью задаваемых на этих множествах функциях a (x,y), x  X, y  Y.

Мы несколько определились с ситуацией, однако всего этого пока недостаточно для формальной постановки задачи выбора. Реальные задачи могут быть самыми разными и требуют, соответственно, самых разных методов решения.

2.Основные определения и теоремы теории игр

Теория игр относится к разделу прикладной математики исследующей математические модели принятия решений в условиях конфликта, противоречий и неопределенности. Задачей теории игр является нахождение оптимальной стратегии поведения в условиях конфликта, неопределенности или противодействия какой то стороны в этой ситуации независимо от того сознательно или неосознанно это происходит. Игровые математические модели позволяют  не только найти оптимальную стратегию, которая не всегда однозначна, но и оценить каждый вариант решения с различных иногда противоречивых точек зрения, а так же глубже разобраться во всех сложностях и неопределенностях реальной ситуации для принятия до конца продуманного решения.

Началом теории игр как последовательной математической теории поведения можно считать выход в свет  50 лет назад монографии Дж. фон Неймана и О. Моргенштерна.  Французский математик Э. Мулен так характеризует значение теории игр для социально-экономических наук: «По нашему мнению, теория игр представляет собой набор инструментов для построения моделей в экономических и политических теориях. Единственным, но вполне достаточным оправданием существования теории игр служит её растущее применение в этих дисциплинах. Она является поистине неиссякаемым источником гибких концепций, каждая из которых проливает свет на определенные стороны социальных взаимоотношений.».

Вначале введем несколько фундаментальных понятия теории игр, после этого дадим определение этому разделу прикладной математики.

 Конфликт - это противоречие, вызванное противоположными интересами сторон.

 Конфликтная ситуация - ситуация в которой участвуют стороны интересы которых полностью или частично противоположны.

 Игра - это действительный или формальный конфликт, в котором имеется по крайней мере два участника, каждый из которых стремится к достижению собственных целей

 Правилами игры называют допустимые действия каждого из игроков, направленные на достижение некоторой цели.

 Платежом называется количественная оценка результатов игры.

 Парная игра - игра в которой участвуют только две стороны (два игрока).

 Игра с нулевой суммой - парная игра при которой сумма платежа равна нулю,  т. е. если проигрыш одного игрока, равен выигрышу другого.

 Стратегия игрока - это однозначный выбор игрока в каждой из возможных ситуаций, когда этот игрок должен сделать личный ход.

 Оптимальная стратегия - это такая стратегия игрока, которая при многократном повторении игры обеспечивает ему максимально возможный средний выигрыш или минимально возможный средний проигрыш.

Пусть мы имеем парную игру с нулевой суммой, один игрок может выбрать при данном ходе i -ю стратегию из m своих возможных (i=1..m), а второй, не зная выбора первого  j -ю стратегию из n своих возможных стратегий (j=1..n). В результате первый игрок выигрывает величину , а второй проигрывает эту величину. Из этих величин составим матрицу A.

                              A 

 Платежная матрица - так назовем матрицу A или еще по другому матрицей игры.

 Конечной игрой размерности (m  n) называется игра определенная матрицей А имеющей m строк и n столбцов.

Максимином или нижней ценой игры назавем число                                ,

а соответствующая ему стратегия (строка) максиминной.

 Минимаксом или верхней ценой игры назавем число

,

а соответствующая ему стратегия (столбец) минимаксной.

 Теорема 1.1. Нижняя цена игры всегда не превосходит верхнюю цену игры.

 Игрой с седловой точкой  называется игра для которой .

 Ценой игры называется величина , если .

В случае игры с седловой точкой , игрокам выгодно придерживатся максиминной и минимаксной стратегий и не выгодно отклонятся от них . В таких случаях про игру говорят, что в ней имеет место равновесие в чистых стратегиях.

Возможна игра и с несколькими седловыми точками. Тогда игра имеет несколько оптимальных решений, но с одинаковой ценой игры.

Чаще встречаются матричные игры без седловой точки, когда          и тогда для нахождения её решения используются смешанные стратегии.

 Смешанной стратегией игрока называется вектор, каждая из компонент которого показывает относительную частоту использования игроком соответствующей чистой стратегии.

 Теорема 1.2. Основная теорема теории матричных игр. Всякая матричная игра с нулевой суммой имеет решение в смешанных стратегиях.

 Теорема 1.3.  Если один из игроков применяет оптимальную смешанную стратегию, то его выигрыш равен цене игры в не зависимости от того, с какими частотами будет применять второй игрок свои стратегии (в том числе и чистые стратегии).

 2. Примеры решения задач при парной игре с нулевой суммой

   Задача 1.1.

Найти решение игры, заданной матрицей А

                         А=.

   

   Решение. Прежде всего проверим наличие седловой точки в данной матрице.

Для этого найдем нижнюю и верхнюю цену игры.

Минимальные элементы по строкам равны (2 и 3) тогда нижняя цена игры   = max (2; 3) = 3. Максимальные элементы по столбцам равны (3 и 6) тогда верхняя цена игры = min (3; 6) = 3. Отсюда видно, что = =3 и мы имеем седловую точку .= 3, т.е. задача имеет решение в чистых стратегиях.

Оптимальные чистые стратегии для первого и второго игроков равны соответственно U* = (0; 1),  Z* = (1; 0), а цена игры = 3.

   Задача 1.2.

Найти решение игры, заданной матрицей А

                         А=.

   Решение. Прежде всего проверим наличие седловой точки в данной матрице.

Для этого найдем нижнюю и верхнюю цену игры.

Минимальные элементы по строкам равны (2 и 3) тогда нижняя цена игры   = max (2; 3) = 3. Максимальные элементы по столбцам равны (4 и 6) тогда верхняя цена игры = min (4; 6) = 4. Отсюда видно, что    и мы имеем игру, которая имеет решение в смешанных стратегиях, а цена игры  .

Предположим, что для первого игрока смешанная стратегия задается вектором U = (u1; u2). Первый игрок, если придерживается своей оптимальной стратегии, независимо от стратегии второго игрока получает цену игры , т.е.

                       4u1* + 3u2* =                                     (1)

                       2u1* + 6u2* = .

 Кроме этого относительные частоты связаны условием:

                        u1* + u2* = 1.

Решаем полученную систему трех линейных уравнений с тремя неизвестными. Получим оптимальную стратегию первого игрока и цену игры:

U* = ( u1* ;  u2*) = (3/5; 2/5),   = 18/5.

Составим уравнения для нахождения оптимальной стратегии второго игрока, если при любой чистой стратегии первого, второй проигрывает цену игры:

                       4z1* + 2z2* = = 18/5                   (2)

                       3z1* + 6z2* = = 18/5.

Решаем полученную систему двух линейных уравнений с двумя неизвестными. Получим оптимальную стратегию второго игрока:

Z* = ( z1* ;  z2*) = (4/5; 1/5).

Рассмотрим геометрическую интерпретацию этой задачи в смешанных стратегиях.  Для этого в плоскости  введем систему координат и на горизонтальной оси Ou отложим вероятность применения первым игроком его двух стратегий, сумма этих вероятностей равна 1, поэтому весь график расположится на отрезке единичной длины. В точках 0 стратегия (1; 0), а в 1 стратегия (0; 1).

                                          Рисунок 1.

По оси ординат в точке 0 отложим выигрыши первого игрока по первой его стратегии при обеих стратегиях второго, а в точке 1 при второй стратегии первого игрока.  Соединим эти платежи по столбцам, тогда пересечение прямых дадут решение системы уравнений (1), а ордината этой точки цену игры .

Анологично можно построить график для нахождения оптимальной стратегии второго игрока.

Мы рассмотрели только самый простой вариант парной матричной игры с нулевой суммой, но она достаточно наглядно показывает, что иногда можно количественно оценить и выбрать оптимальный вариант поведения в конфликтной ситуации.


 

А также другие работы, которые могут Вас заинтересовать

82920. Визначні місця Лондона 69 KB
  London is the most interesting place in the world. There are about 10 thousand streets in London. About eight million people live in the city. There are a lot of bridges over the Thames. Tower Bridge is the most famous. It is more than 100 years old. From Tower Bridge you can see the Tower of London.
82921. Розпізнавання геометричних фігур. Задачі на збільшення (зменшення) числа на кілька одиниць 39.5 KB
  Мета: навчитися розпізнавати геометричні фігури, записувати числа в таблицю розрядів. Розв’язувати задачі на збільшення (зменшення) числа на кілька одиниць. Розвивати логічне мислення, увагу, спостережливість. Виховувати позитивне ставлення до ближнього.
82922. Лічба у межах 20. Попереднє і наступне число. Додавання і віднімання виду 14 + 1; 14 – 1 160.5 KB
  Діти знаходять зображення горобчика серед птахів. Діти знаходять зображення зозулі серед птахів. Що ж буде Діти а що може статися якщо хмари закриють сонечко Для чого потрібне сонечко Допоможемо зозулі. Діти розв’язують приклади і звільняють сонечко від хмаринок.
82923. Склад числа 7. Порівняння чисел у межах 7. Складання прикладів на додавання. Написання цифр 41 KB
  Мета. Формувати навички лічби; на основі практичних дій розглянути різні варіанти складу числа 7; учити складати приклади на додавання в межах 7; закріплювати навички порядкової лічби. Розвивати обчислювальні вмінні і навички, увагу, логічне мислення. Виховувати інтерес до уроку математики.
82924. Табличне додавання і віднімання в межах 10. Склад чисел 1 – 10 1.04 MB
  Закріпити уміння додавати і віднімати в межах 10. Удосконалювати навички усних обчислень, розвивати математичні здібності учнів, пам’ять, мислення спостережливість, кмітливість. Повторити геометричний матеріал. Виховувати охайність, культуру запису, інтерес до математики, любов до природи.
82925. Додавання і віднімання числа 3 з переходом через десяток. Розв’язування задач. Робота з геометричним матеріалом 66 KB
  Мета: ознайомити учнів з таблицею додавання і віднімання числа 3; повторити способи утворення й назви чисел другого десятка; вдосконалювати набуті навички; складати та розв’язувати задачі приклади; формувати обчислювальні навички; розвивати математичну мову увагу пам’ятьспостережливість; виховувати любов до природи.
82926. Технологическое проектирование ГАТП на 130 автомобилей ЗИЛ-130 с агрегатным участком 75.66 KB
  В связи с этим современный специалист занимающийся эксплуатацией ремонтом экономикой и организацией автомобильного транспорта должен знать основы технологического проектирования и планировочных решений автотранспортных предприятий уметь грамотно решать различные вопросы...
82927. Постройка магазина «Спектр» по индивидуальному проекту за 5 месяцев, не превышая затрат $180 000 10.89 MB
  Стоит отметить также, что человек на протяжении своей истории практически непрерывно создает что - либо. Но результаты всегда разные, а именно по тому - можно сказать, что универсальному признаку, который позволяет выделить среди них более или менее повседневные и уникальные плоды человеческой деятельности.
82928. Реагування на НС та ліквідація її наслідків - вибух на складі боєприпасів навчального центру «Оршанець» Державної прикордонної служби, розташованому біля с. Геронимівка 133.74 KB
  Надзвичайний стан ‒ це особливий правовий режим, який може тимчасово вводитися в Україні чи в окремих її місцевостях при виникненні надзвичайних ситуацій техногенного або природного характеру не нижче загальнодержавного рівня, що призвели чи можуть призвести до людських і матеріальних втрат...