4597

Принятие решений в условиях неопределенности. Игры с природой

Лабораторная работа

Информатика, кибернетика и программирование

Принятие решений в условиях неопределенности. Игры с природой Цель работы: освоить и закрепить практические навыки по принятию и обоснованию управленческих решений в условиях недостатка информации, когда один из игроков не имеет конкретной цели и сл...

Русский

2012-11-23

129.5 KB

223 чел.

Принятие решений в условиях неопределенности. Игры с природой

Цель работы: освоить и закрепить практические навыки по принятию и обоснованию управленческих решений в условиях недостатка информации, когда один из игроков не имеет конкретной цели и случайным образом выбирает очередные «ходы».

Краткие теоретические сведения

Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игрок 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели, так и случайным образом выбирающий очередные «ходы» по игре. Поэтому термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально.

Матрица игры с природой А=||аij||, где аij – выигрыш (потеря) игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 (i=1, …, m; j=1,…,n).

Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех g=1,…, n akj £ alj, k, l=1,…,m, то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие стратегиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопустимо, поскольку природа не стремится к выигрышу в игре с человеком, для нее нет целенаправленно выигрышных или проигрышных стратегий, она действует неосознанно.

Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий: А1,А2, …, Аm, а у природы имеется n возможных состояний (стратегий): П1, П2,..., Пn, тогда условия игры с природой задаются матрицей А выигрышей (потерь) игрока 1:

.

Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей (потерь), а в виде так называемой матрицы рисков R=||rij||m,n. Величина риска – это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей (потерь) А.

Риск – это разность между результатом, который игрок мог бы получить, если бы он знал действительное состоянием среды, и результатом, который игрок получит при j-й стратегии.

Зная состояние природы (стратегию) Пj, игрок выбирает ту стратегию, при которой его выигрыш максимальный или потеря минимальна, т.е.

rij=bj–aij, где bj=max aij, при заданном j; 1£i£m, если аij – выигрыш.

rij=aij–bj, где bj=min aij, при заданном j; 1£i£m, если аij – потери (затраты).

Неопределенность, связанную с полным отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной».

В таких случаях для определения наилучших решений используются следующие критерии: Вальда, Сэвиджа, Гурвица.

Критерий Вальда. С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник.

Если в исходной матрице по условию задачи результат aij представляет выигрыш лица, принимающего решение, то выбирается решение, для которого достигается значение W=max min aij, 1£i£m, 1£j£n – максиминный критерий.

Если в исходной матрице по условию задачи результат aij представляет потери лица, принимающего решение, то выбирается решение, для которого достигается значение W=min max aij, 1£i£m, 1£j£n – минимаксный критерий.

В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай.

Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А, а матрицей рисков R:

S=min max rij 1£i£m, 1£j£n.

Применение критерия Сэвиджа позволяет любыми путями избежать большого риска при выборе стратегии, а значит избежать большего проигрыша (потерь).

Критерий пессимизма-оптимизма Гурвица. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом.

Критерий основан на следующих двух предположениях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1р) и в самом выгодном состоянии с вероятностью р, где р – коэффициент пессимизма.

Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением:

HA=maxíp max aij+(1-p) min aijý, 1£i£m, 1£j£n, если aij – выигрыш.

HA=miníp min aij+(1-p) max aijý, 1£i£m, 1£j£n, если aij – потери (затраты).

При p=0 критерий Гурвица совпадает с критерием Вальда. При p=1 приходим к решающему правилу вида max max aij, к так называемой стратегии «здорового оптимизма», критерий максимакса.

Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид

HR=miníp max rij+(1-p) min rijý, 1£i£m, 1£j£n.

При р=0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (min rij); при р=1 – по критерию минимаксного риска Сэвиджа.

Значение р от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или оптимизму. При отсутствии ярко выраженной склонности р=0,5 представляет наиболее разумный вариант.

В случае, когда по принятому критерию рекомендуются к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию. Здесь нет стандартного подхода. Выбор может зависеть от склонности к риску игрока 1.

Контрольный пример

Транспортное предприятие должно определить уровень своих производственных возможностей так, чтобы удовлетворить спрос клиентов на транспортные услуги на планируемый период. Спрос на транспортные услуги неизвестен, но прогнозируется, что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует наилучший уровень провозных возможностей транспортного предприятия. Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения провозных возможностей над спросом (из-за простоя подвижного состава), либо из-за неполного удовлетворения спроса на транспортные услуги. Возможные прогнозируемые затраты на развитие провозных возможностей представлены в табл. 4.1.

Таблица 4.1

Варианты
провозных возможностей
транспортного предприятия

Варианты спроса на транспортные услуги

1

2

3

4

1

6

12

20

24

2

9

7

9

28

3

23

18

15

19

4

27

24

21

15

Необходимо выбрать оптимальную стратегию, используя критерии Вальда, Сэвиджа, Гурвица.

Решение

Имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: П1, П2, П3, П4. Известны также четыре стратегии развития провозных возможностей транспортного предприятия: А1, А2, А3, А4. Затраты на развитие провозных возможностей при каждой паре Пi и Аi заданы следующей матрицей:

.

Построим матрицу рисков. В данном примере aij представляет затраты, т.е. потери, значит для построения матрицы рисков используется принцип rij=aij–bj, где bj=min aij.

Для П1: bj=6

Для П2: bj=7

Для П3: bj=9

Для П4: bj=15

Матрица рисков имеет следующий вид:

.

Критерий Вальда

Так как в данном примере aij представляет затраты, т.е. потери, то применяется минимаксный критерий.

Для А1: max aij=24

Для А2: max aij=28

Для А3: max aij=23

Для А4: max aij=27

W=min (max aij)=23, следовательно, наилучшей стратегией развития провозных возможностей в соответствии с минимаксным критерием Вальда будет третья стратегия (А3).

Критерий минимаксного риска Сэвиджа

Для А1: max rij=11

Для А2: max rij=13

Для А3: max rij=17

Для А4: max rij=21

S=min (max rij)=11, следовательно, наилучшей стратегией развития провозных возможностей в соответствии с критерием Сэвиджа будет первая стратегия (А1).

Критерий пессимизма-оптимизма Гурвица

Положим значение коэффициента пессимизма р=0,5.

Так как в данном примере aij представляет затраты (потери), то применятся критерий:

HA=miníp min aij+(1-p) max aijý

min aij

max aij

p min aij + (1-p) max aij

Для А1

6

24

15

Для А2

7

28

17,5

Для А3

15

23

19

Для А4

15

27

21

Оптимальное решение заключается в выборе стратегии А1.

Рассчитаем оптимальную стратегию применительно к матрице рисков:

HR=miníp max rij+(1-p) min rijý

min rij

max rij

p max rij + (1-p) min rij

Для А1

0

11

5,5

Для А2

0

13

6,5

Для А3

4

17

10,5

Для А4

0

21

10,5

Оптимальное решение заключается в выборе стратегии А1.

Вывод: в примере предстоит сделать выбор, какое из возможных решений предпочтительнее:

по критерию Вальда – выбор стратегии А3;

по критерию Сэвиджа – выбор стратегии А1;

по критерию Гурвица – выбор стратегии А1.

Индивидуальное задание

Решите задачу согласно вашему индивидуальному варианту.

Вариант 1

Найти наилучшие стратегии по критериям Вальда, Сэвиджа (коэффициент пессимизма равен 0,2), Гурвица применительно к матрице рисков (коэффициент пессимизма равен 0,4) для следующей платежной матрицы игры с природой (элементы матрицы – выигрыши):

.

Вариант 2

Дана матрица игры с природой в условиях полной неопределенности (элементы матрицы – выигрыши):

.

Требуется проанализировать оптимальные стратегии игрока, используя критерии пессимизма-оптимизма Гурвица применительно к платежной матрице А и матрице рисков R при коэффициенте пессимизма р=0; 0,5; 1. При этом выделить критерии максимакса Вальда и Сэвиджа.

Вариант 3

Дана следующая матрица выигрышей:

.

Определите оптимальную стратегию, используя критерии Вальда, Сэвиджа и Гурвица (коэффициент пессимизма равен 0,4).

Вариант 4

Один из пяти станков должен быть выбран для изготовления партии изделий, размер которой Q может принимать три значения: 150, 200, 350. Производственные затраты Сi для I станка задаются следующей формулой:

Ci=Pi+ci×Q.

Данные Pi и ci приведены в табл. 4.2.

Таблица 4.2

Показатели

Модель станка

1

2

3

4

5

Pi

30

80

50

160

100

ci

14

6

10

5

4

Решите задачу для каждого из следующих критериев Вальда, Сэвиджа, Гурвица (критерий пессимизма равен 0,6). Полученные решения сравните.

Вариант 5

При выборе стратегии Aj по каждому возможному состоянию природы Si соответствует один результат Vij. Элементы Vij, являющиеся мерой потерь при принятии решения, приведены в табл. 4.3.

Таблица 4.3

Стратегии

Состояние природы

S1

S2

S3

S4

A1

2

6

5

8

A2

3

9

1

4

A3

5

1

6

2

Выберите оптимальное решение в соответствии с критериями Вальда, Сэвиджа, Гурвица (при коэффициенте пессимизма, равном 0,5).

Вариант 6

Намечается крупномасштабное производство легковых автомобилей. Имеются четыре варианта проекта автомобиля Rj. Определена экономическая эффективность Vji каждого проекта в зависимости от рентабельности производства. По истечении трех сроков Si рассматриваются как некоторые состояния среды (природы). Значения экономической эффективности для различных проектов и состояний природы приведены в следующей табл. 4.4.

Таблица 4.4

Проекты

Состояние природы

S1

S2

S3

R1

20

25

15

R2

25

24

10

R3

15

28

12

R4

9

30

20

Требуется выбрать лучший проект легкового автомобиля для производства, используя критерий Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,1. Сравнить решения и сделать выводы.

Вариант 7

Определите тип электростанции, которую необходимо построить для удовлетворения энергетических потребностей комплекса крупных промышленных предприятий. Множество возможных стратегий в задаче включает следующие параметры:

R1 – сооружается гидростанция;

R2 – сооружается теплостанция;

R3 – сооружается атомная станция.

Экономическая эффективность сооружения электростанции зависит от влияния случайных факторов, образующих множество состояний природы Si.

Результаты расчета экономической эффективности приведены в следующей табл. 4.5.

Таблица 4.5

Тип станции

Состояние природы

S1

S2

S3

S4

S5

R1

40

70

30

25

45

R2

60

50

45

20

30

R3

50

30

40

35

60

Вариант 8

Фирма рассматривает вопрос о строительстве станции технического обслуживания (СТО) автомобилей. Составлена смета расходов на строительство станции с различным количеством обслуживаемых автомобилей, а также рассчитан ожидаемый доход в зависимости от удовлетворения прогнозируемого спроса на предлагаемые услуги СТО (прогнозируемое количество обслуженных автомобилей в действительности). В зависимости от принятого решения – проектного количества обслуживаемых автомобилей в сутки (проект СТО) Rj и величины прогнозируемого спроса на услуги СТО – построена табл. 4.6 ежегодных финансовых результатов (доход д.е.):

Таблица 4.6

Проекты СТО

Прогнозируемая величина удовлетворяемости спроса

0

10

20

30

40

50

20

-120

60

240

250

250

250

30

-160

15

190

380

390

390

40

-210

-30

150

330

500

500

50

-270

-80

100

280

470

680

Определите наилучший проект СТО с использованием критериев Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,5.

Вариант 9

Магазин может завести один из трех типов товара Аi; их реализация и прибыль магазина зависят от типа товара и состояния спроса. Предполагается, что спрос может иметь три состояния Вi (табл. 4.7). Гарантированная прибыль представлена в матрице прибыли.

Таблица 4.7

Тип товара

Спрос

В1

В2

В3

А1

20

15

10

А2

16

12

14

А3

13

18

15

Определить, какой товар закупать магазину.

Вариант 10

Дана следующая матрица выигрышей:

.

Определите оптимальную стратегию, используя критерии Вальда, Сэвиджа и Гурвица (коэффициент пессимизма равен 0,6).

Вариант 11

Администрации театра нужно решить, сколько заказать программок для представлений. Стоимость заказа 200 ф. ст. плюс 30 пенсов за штуку. Программки продаются по 60 пенсов за штуку, и к тому же доход от рекламы составит дополнительные 300 ф. ст. Из прошлого опыта известна посещаемость театра (табл. 4.8).

Таблица 4.8

Посещаемость

4000

4500

5000

5500

6000

Ее вероятность

0,1

0,3

0,3

0,2

0,1

Ожидается, что 40% зрителей купят программки.

1. Используя критерии Вальда, Сэвиджа и Гурвица, определите, сколько программок должна заказать администрация театра.

2. Допустим, что рекламодатели увеличат сумму с 300 до 400 ф. ст., число посетителей будет больше 5250, к тому же спрос на программки будет полностью удовлетворен. Как это повлияет на рекомендации в п. 1?

Вариант 12

При выборе стратегии Aj по каждому возможному состоянию природы Si соответствует один результат Vij. Элементы Vij, являющиеся мерой потерь при принятии решения, приведены в табл. 4.9.

Таблица 4.9

Стратегии

Состояние природы

S1

S2

S3

S4

A1

20

12

15

15

A2

14

23

12

26

A3

25

21

24

30

Выберите оптимальное решение в соответствии с критериями Вальда, Сэвиджа, Гурвица (при коэффициенте пессимизма, равном 0,6).

Вариант 13

Пекарня печет хлеб на продажу магазинам. Себестоимость одной булки составляет 30 пенсов, ее продают за 40 пенсов. В табл. 4.10 приведены данные о спросе за последние 50 дней:

Таблица 4.10

Спрос в день, тыс. шт.

10

12

14

16

18

Число дней

5

10

15

15

5

Если булка испечена, но не продана, то убытки составят 20 пенсов за штуку. Используя критерии Вальда, Сэвиджа, Гурвица (при коэффициентах: 0,4 – вероятность максимальной покупки, 0,6 – вероятность минимальной покупки), определите, сколько булок нужно выпекать в день.

Вариант 14

Компания выбирает, какой вид продукции целесообразно производить. Имеются четыре вида продукции Аj. Определена прибыль от производства каждого вида продукции в зависимости от состояний экономической среды Вi. Значения прибыли для различных видов продукции и состояний природы приведены в следующей табл. 4.11.

Таблица 4.11

Вид продукции

Состояние экономической среды

В1

В2

В3

А1

40

52

45

А2

58

45

89

А3

45

36

65

А4

36

89

45

Требуется выбрать лучший проект легкового автомобиля для производства, используя критерии Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,4. Сравнить решения и сделать выводы.

Вариант 15

Компания «Kilroy» выпускает очень специфичный безалкогольный напиток, который упаковывается в 40-пинтовые бочки. Напиток готовится в течение недели, и каждый понедельник очередная партия готова к употреблению. Однако в одно из воскресений всю готовую к продаже партию пришлось выбросить. Секретный компонент, используемый для приготовления напитка, покупается в небольшой лаборатории, которая может производить каждую неделю в течение полугода (так налажено производство) только определенное количество этого компонента. Причем он должен быть использован в кратчайший срок.

Переменные затраты на производство одной пинты напитка составляют 70 пенсов, продается она за 1,50 ф. ст. Однако компания предвидит, что срыв поставок приведет к потере части покупателей в долгосрочной перспективе, а следовательно, придется снизить цену на 30 пенсов.

За последние 50 недель каких-либо явных тенденций в спросе выявлено не было (табл. 4.12).

Таблица 4.12

Спрос на бочки в неделю

3

4

5

6

7

Число недель

5

10

15

10

10

Определите, что нужно предпринять, используя критерии Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,5. Сравнить решения и сделать выводы.


 

А также другие работы, которые могут Вас заинтересовать

52709. Героев имена помнит Донбасс 53 KB
  Цель: Воспитывать уважительное отношения к исторической памяти народа. Способствовать формированию стремлению учащихся знать историю своего народа и отстаивать историческую правду. Воспитывать ответственность, эмпатию, потребность личного участия в мероприятиях, посвященных празднованию памятных дат.