6272

Принятие решений в условиях неопределённости

Реферат

Менеджмент, консалтинг и предпринимательство

Принятие решений в условиях неопределённости Максиминный критерий Вальда. Критерий Сэвиджа (минимаксного риска). Критерий Гурвица (пессимизма-оптимизма). Максиминный критерий Вальда (критерий крайнего пессимизма) (рассчитывай...

Русский

2012-12-31

138.5 KB

210 чел.

Принятие решений в условиях неопределённости

Содержание

1. Максиминный критерий Вальда.

2. Критерий Сэвиджа (минимаксного риска).

3. Критерий Гурвица (пессимизма-оптимизма).

1. Максиминный критерий Вальда (критерий крайнего пессимизма)

(«рассчитывай на худшее»)

В группу критериев выбора оптимальной стратегии статистика, применяемых при неизвестных априорных вероятностях состояний природы, входят критерии Вальда, Сэвиджа и Гурвица. Они используют анализ платежной матрицы либо матрицы рисков.

Если распределение вероятностей будущих состояний природы неизвестно, то вся информация о природе сводится к перечню ее возможных состояний.

Максиминный критерий Вальда – это критерий крайнего пессимизма, или критерий осторожного наблюдателя. Его можно сформулировать как для чистых, так и для смешанных стратегий.

Критерий Вальда является критерием крайнего пессимизма, так как статистик предполагает, что природа реализует такие состояния, при которых величина его выигрыша принимает наименьшее значение.

Критерий тождественен максиминному (пессимистическому) критерию, используемому при решении матричных игр в чистых стратегиях.

Из каждой строки  выбираются минимальные элементы, т.е. которые соответствуют наихудшему результату ЛПР при известных состояниях «природы» . Затем выбирается стратегия ЛПР, соответствующая максимальному элементу из отобранных минимальных:

.    (1)

Выбранные таким образом варианты полностью исключают риск, поскольку ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется.

Применение данного критерия оправданно, если ситуация, в которой принимается решение, характеризуется следующими признаками:

  •  вероятности состояний «природы» неизвестны;
  •  необходимо считаться с наихудшим из возможных вариантов;
  •  решение реализуется только один раз или малое количество раз;
  •  полная недопустимость риска.

Таким образом, оптимальной по критерию Вальда считается чистая стратегия , которая в наихудших условиях гарантирует максимальный выигрыш. Значит, оптимальной будет максиминная чистая стратегия, а максимальным выигрышем – нижняя чистая цена игры  в парной игре с нулевой суммой.

Пример 1. 

Игра "Поставщик".

Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед.

Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции.

Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем.

Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед.

Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его  количество на складе превысит допустимую норму, равную одной партии.

Какой стратегии должен придерживаться завод в сложившейся ситуации?

Решение 

У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транспорт, 3) послать к поставщику представителя и транспорт, 4) купить и привезти материал-заменитель от другого поставщика.

Составим таблицу расчетов:

Затраты и убытки фирмы-изготовителя

Ситуация

Стоимость материала

Недовыпуск продукции

Транспорт

Командировочные расходы

Издержки хранения

Общая сумма

1. 1

- 100

0

0

0

0

- 100

1. 2

0

- 400

0

0

0

- 400

2. 1

- 100

0

- 50

0

0

- 150

2. 2

- 50

- 200

- 50

0

0

- 300

3. 1

- 100

0

- 50

- 50

0

- 200

3. 2

- 80

- 80

- 50

- 50

0

- 260

4. 1

- 250

0

- 50

0

- 30

- 330

4. 2

- 150

0

- 50

0

0

- 200

Решение

На основе полученных результатов вычислений можно составить платежную матрицу:

min

max

- 100

- 400

- 400

- 150

- 300

- 300

- 200

- 260

- 260

- 260

- 330

- 200

- 330

Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транспорт.

1. Рассмотренный способ поиска оптимального решения есть критерий Вальда (максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:

ед.

Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход.

2. Максимаксный критерий. Самый благоприятный случай:

ед.

Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.

Критерий Вальда для смешанных стратегий 

Оптимальной считается та смешанная стратегия статистика , при которой минимальный средний выигрыш будет максимальным:    .   (2)

Критерий Вальда ориентируют статистика на самые неблагоприятные состояния природы, то есть выражают пессимистическую оценку ситуации.

2. Критерий Сэвиджа (минимаксного риска)

На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа. Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.

По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.

При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.

Для решения задачи строится так называемая «матрица рисков», элементы которой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального варианта решения.

Напомним, что Риском игрока  при выборе стратегии  в условиях (состояниях) природы называется разность между максимальным выигрышем, который можно получить в этих условиях, и выигрышем, который получит игрок в тех же условиях, применяя стратегию .

Критерий Сэвиджа – это критерий минимаксного риска, минимизации «сожалений». Этот критерий, как критерий Вальда, является максимально осторожным и пессимистическим.

В критерии Сэвиджа пессимизм проявляется по-другому: худшим считается не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, что можно было бы достичь в данных условиях (максимальный риск).

Критерий Сэвиджа ориентируется не на результат, а на риск (потери или штрафы) .

В качестве оптимальной выбирается стратегия, при которой величина потерь в наихудших условиях минимальна. Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту стратегию, которая минимизирует максимальный риск:     

.   (3)

Требования, предъявляемые к ситуации, в которой принимается решение по критерию Сэвиджа, совпадают с требованием к использованию критерия Вальда. Критерий Сэвиджа, как и критерий Вальда, ориентирует статистика на самые неблагоприятные состояния природы.

Пример 2. Для задачи «Поставщик» минимакс риска достигается сразу при двух стратегиях А2 и А3:

max

min

0

200

200

50

100

100

100

100

60

100

100

230

0

130

Найти оптимальное решение игры , применяя критерий Сэвиджа.

Решение. 

Ориентируемся на самые неблагоприятные состояния «природы». Вычислим риски статистика .

Для первого столбца:

Для второго столбца:

Для третьего столбца:

Запишем матрицу рисков.

Стратегии статистика

33

0

0

0

21

26

2

19

1

Определим в каждой строке наибольшее число – наибольший риск статистика , если он применяет стратегию , а природа меняет свои состояния , , . Дополним матрицу рисков последним столбцом «наибольшие риски».

Матрица рисков и наибольшие риски

Стратегии статистика

Наибольшие риски

33

0

0

33

0

21

26

26

2

19

1

19

Найдем наименьший риск: .

Значит, оптимальной стратегией по критерию Сэвиджа является стратегия .

4.3. Критерий Гурвица (пессимизма-оптимизма)

Критерий Гурвица – критерий обобщенного максимума, или пессимизма-оптимизма. 

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы.

Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей.

Этот критерий обеспечивает промежуточное решение  между крайним оптимизмом и крайним пессимизмом, которое определяется по принципу:

.   (4)

Число () - степень оптимизма, удовлетворяет условию  и выбирается из субъективных соображений, особенностей среды, здравого смысла, исходя из опыта ЛПР, его отношения к риску и т.п. На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма ближе к нулю.

Для каждой строки рассчитывается среднее взвешенное (с учетом выбранного значения ) наименьшего и наибольшего результатов, после чего выбирается строка с максимальным значением.

При  имеем критерий крайнего оптимизма, т.е. отражает позицию азартного игрока, ожидающего наиболее благоприятное состояние среды.

При  критерий Гурвица превращается в критерий крайнего пессимизма Вальда.

Если 0<<1, то имеем промежуточное отношение ЛПР к возможным рискам. При желании подстраховаться в данной ситуации  принимают близким к единице.

Выбор значения  субъективен, а, следовательно, субъективен и выбор решения, что совершенно неизбежно в условиях неопределенности.

Чем опаснее ситуация, тем больше ЛПР стремится застраховать себя от возможных рисков, тем ближе  к 0. А чем менее он азартен, тем  ближе к 1.

Оптимальная по Гурвицу стратегия должна гарантировать статистику больший выигрыш по сравнению с выигрышем, принимаемым статистиком интуитивно или исходя из опыта.

Применение критерия Гурвица оправданно, если ситуация, в которой принимается решение, характеризуется признаками:

  •  вероятности состояний природы неизвестны;
  •  необходимо считаться с наихудшим из возможных вариантов;
  •  решение реализуется малое количество решений;
  •  допускается некоторый риск.

Пример 3. Найти оптимальное решение статистической игры, заданной платежной матрицей , применяя критерий Гурвица. 

Решение. 

Для применения критерия Гурвица нужно знать значение вероятности . Пусть, например, . Это означает, что событие «наименьший возможный выигрыш статистика » желаем сделать более правдоподобным ( близко к единице), то есть страхуемся  от неблагоприятных ситуаций в игре. Тогда  

.

Запишем все промежуточные результаты в таблицу.

 

-13

9

15

-13

-11,7

15

1,5

-10,2

20

-12

-11

-12

-10,8

20

2

-8,8

18

-10

14

-10

-9

18

1,8

-7,2

Из последнего столбца таблицы видно, что максимальное значение  равно (–7,2) и соответствует чистой стратегии ; она и будет оптимальной по критерию Гурвица.

Анализ практических ситуаций проводится по нескольким критериям одновременно, что позволяет глубже исследовать суть явления и выбрать наиболее обоснованное управленческое решение. В качестве оптимальной на основании совокупных исследований берется та стратегия, которая чаще других называлась оптимальной по всем критериям.

Выбор критерия (как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хотя бы частичной информации относительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы, применяют метод Байеса-Лапласа, либо проводят эксперимент, позволяющий уточнить поведение природы.

Контрольные вопросы

  1.  Что понимается под играми с природой?
  2.  Какими критериями пользуется статистик для определения своей оптимальной стратегии в условиях неопределенности?
  3.  Что понимается под риском игрока?
  4.  Поясните принципы использования моделей теории игр в экономических задачах в условиях неопределенности (игры с природой).  
  5.  Когда пользуются критериями Вальда, Сэвиджа, Гурвица? Опишите правила выбора оптимальной стратегии с применением критериев.
  6.  Какой из критериев является самым оптимистическим и пессимистическим и почему?
  7.  Как, применяя несколько критериев, выбрать наиболее обоснованное решение статистической игры?

PAGE  6


 

А также другие работы, которые могут Вас заинтересовать

36825. Мировые информационные ресурсы 444 KB
  Задание №1 Сформируйте электронный глоссарий по тематике Мировые информационные ресурсы: Блог Веб – страница Интернет ресурс Информационная культура Информационное общество Информационные взаимодействия Информационные ресурсы Информационные сети Информационные системы Информационный портал Информационный потенциал общества Информация Мировые информационные ресурсы Национальные информационные ресурсы Сайт Сервис Средства массовой информации Телеконференция Файловый сервер Чат Электронная база...
36826. Получить навыки работы с электронной таблицей Microsoft Excel 170 KB
  Откройте меню настройки панелей управления Вид Панели инструментов и убедитесь в том что включено отображение только двух панелей: Стандартная и Форматирование. Чтобы настроить масштаб отображения войдите в меню Вид Масштаб. Войдите в меню Сервис Параметры. Для этого достаточно воспользоваться командой меню Правка Отменить.
36827. МОДЕЛИРОВАНИЕ реакции с диффузией в трубчатом реакторе 862.5 KB
  Поэтому математическое описание процессов протекающих в этих реакторах имеет большое значение. Рассмотрим математическое описание трубчатого реактора для проведение реакции с диффузией. Этот поток входит в реактор где одновременно с диффузией осуществляется реакция первого порядка Длина реактора L площадь его поперечного сечения 1 м2. При условии что скорость питания w м3 ч концентрация М равна с0 а коэффициент диффузии М принимается постоянный со значением D м2 ч определить концентрацию М как функцию длины реактора.
36828. ПОВЕРКА МИКРОМЕТРА 227.5 KB
  Лабораторная работа № 2 ПОВЕРКА МИКРОМЕТРА Цель работы: изучить устройство и принцип действия микрометра; получить первичные практические навыки в выполнении поверки СИ осуществить поверку микрометра определить пригодность микрометра к использованию. Устройство и принцип действия микрометра Микрометр относится к классу микрометрических измерительных инструментов принцип действия которых основан на использовании винтовой пары винт гайка позволяющей преобразовать вращательное движение микровинта в поступательное. Устройство...
36829. МНОГОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 124.5 KB
  Для создания таких массивов служит функция meshgrid. [XY]=meshgridxy – преобразует область заданную векторами x и y в двухмерные массивы X и Y которые могут быть использованы для вычисления значений функции двух переменных и построения трехмерных графиков. Пример [XY]=meshgrid1:1:46:1:9 X = 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 Y = 6 6 6 6 7 7 7 7 8 8 8 8 9 9 9 9 В этом примере формируются массивы X и Y для построения трехмерной по верхности при изменении x от 1 до 4 с шагом 1 и y от 6 до 9 с шагом 1. Пример [xy]=meshgrid3: .
36830. Исследование разборчивости речи методом артикуляционных измерений при защите речевой информации различными видами маскирующих сигналов 201.5 KB
  Звуковые колебания в жидкой и газообразной среде воздухе представляют собой продольные колебания так как частицы среды колеблются вдоль линии распространения звука. Вследствие этого образуются сгущения и разряжения среды двигающейся от источника колебаний с определенной скоростью называемой скоростью звука. Скорость звука Скорость звука является постоянной величиной для данной среды и метеорологических условий и определяется по формуле ...
36831. СОЗДАНИЕ И ИСПОЛЬЗОВАНИЕ ДИАГРАММ 67 KB
  В табличном процессоре MS Excel создать документ и сохранить его в личной папке под именем ФИО_лабExcel4_группа.xls. В созданном документе выполнить все задания.
36832. РЕШЕНИЕ ОПТИМИЗАЦИОННЫХ ЗАДАЧ 1.05 MB
  В созданном документе выполнить все задания каждое задание оформлять на отдельном листе. ЗАДАНИЕ 1. ЗАДАНИЕ 2. ЗАДАНИЕ 3.
36833. НЕРАЗРУШАЮЩИЙ КОНТРОЛЬ И ДИАГНОСТИКА ЭЛЕКТРООБОРУДОВАНИЯ 110.57 KB
  Научные положения дисциплины «Неразрушающий контроль и диагностика электрооборудования» сформулированы на основе теории электромагнитных полей, специальных разделов математики, таких как теория функций комплексных чисел, конформных преобразований, теории рядов, теории симметрии. При изучении дисциплины необходимо знание высшей математики, основ теории поля, основ программирования.