Пример применения критерия вальда. Критерии вальда, сэвиджа, гурвица и лапласа

Критерий Вальда

Критерий Вальда является самым "осторожным". Согласно ему, оптимальной альтернативой будет та, которая обеспечивает наилучший исход среди всех возможных альтернатив при самом плохом стечении обстоятельств.

Если исходы отражают подлежащие минимизации показатели (убытки, расходы, потери и т.д.), то критерий Вальда ориентируется на "минимакс" (минимум среди максимальных значений потерь всех альтернатив).

Если в качестве исходов альтернатив фигурируют показатели прибыли, дохода и других показателей, которые надо максимизировать (по принципу "чем больше, тем лучше"), то ищется "максимин" выигрыша (максимум среди минимальных выигрышей). Здесь и далее для всех критериев в тексте мы будем рассматривать именно такой случай, когда исход показывает некий выигрыш.

По критерию Вальда оценкой i-й альтернативы является ее наименьший выигрыш:

W i = min(x ij), j = 1..M

Оптимальной признается альтернатива с максимальным наихудшим выигрышем:

Х* = Х k , W k = max(W i), i = 1..N

Пример применения критерия Вальда

Есть два проекта Х 1 и Х 2 , которые при трех возможных сценариях развития региона (j=1..3) обеспечивают разную прибыль. Значения прибыли приведены в таблице 2. Необходимо выбрать проект для реализации.

Табл.2. Исходные данные.

Среди возможных проектов нет доминирующих ни абсолютно, ни по состояниям. Поэтому решение придется принимать по критериям.

Если выбор оптимального проекта осуществляется по критерию Вальда, то ЛПР должен выполнить следующие действия:

1. Найти минимальные исходы для каждой альтернативы. Это и будут значения критерия Вальда:

W 1 = min(x 1j), j = 1..3 => W 1 = min(45, 25, 50) = 25

W 2 = min(x 2j), j = 1..3 => W 2 = min(20, 60, 25) = 20

2. Сравнить значения критерия Вальда и найти наибольшую величину. Альтернатива с максимальным значением критерия будет считаться оптимальной:

25 > 20 => W 1 > W 2 => X* = X 1

Если бы решение принималось только по критерию Вальда, ЛПР выбрал для реализации проект Х 1 , поскольку прибыль, которую обеспечит данный проект при самом плохом развитии ситуации, выше.

Выбрав оптимальную альтернативу по критерию Вальда, ЛПР гарантирует себе, что при самом плохом стечении обстоятельств он не получит меньше, чем значение критерия. Поэтому данный показатель еще называют критерием гарантированного результата .

Основной проблемой критерия Вальда является его излишняя пессимистичность, и, как следствие, не всегда логичный результат. Так, например, при выборе по данному критерию между альтернативами А{100; 500} и В{90; 1000} следует остановиться на варианте А. Однако в жизни логичнее было бы выбрать В, так как в худшем случае В лишь немного хуже А, тогда как при хорошем стечении обстоятельств В обеспечивает гораздо больший выигрыш.


2. Критерий "максимакса"

Диаметральной противоположностью критерия Вальда является так называемый критерий "максимакса". Если Вальд отражал взгляд предельного пессимиста, то "максимакс" соответствует отношению крайнего оптимизма. Все внимание уделяется только наилучшим исходам, поэтому оценкой i-й альтернативы по данному критерию является ее наибольший выигрыш М i:

М i = mах(x ij), j = 1..M

Оптимальной считается альтернатива с максимальным наибольшим выигрышем:

Х* = Х k , М k = max(М i), i = 1..N

Пример применения критерия "максимакса"

В условиях примера из п. 1 (табл.2) действия ЛПР, использующего критерий "максимакса" для принятия решения, будут следующие:

1. Найти максимальные исходы для каждой альтернативы:

М 1 = max(x 1j), j = 1..3 =>М 1 = max(45, 25, 50) = 50

М 2 = max(x 2j), j = 1..3 =>М 2 = max(20, 60, 25) = 60

2. Сравнить найденные значения и определить альтернативу с максимальной величиной критерия:

50 < 60 => М 1 < М 2 => X* = X 2

По критерию "максимакса" оптимальным является проект Х 2 ., который может обеспечить наибольшую прибыль при наилучшем стечении обстоятельств.

Критерий "максимакса" не учитывает никакие иные исходы, кроме самых лучших. Поэтому его применение, во-первых, может быть весьма опасным, и, во-вторых, также как и критерий Вальда он может приводить к нелогичным решениям. Например, среди альтернатив А{-100; 0; 500} и В{200; 300; 400} с позиции "максимакса" лучшей является А, однако она несет в себе и опасность убытков (-100), и вообще все исходы, кроме лучшего намного уступают В. Поэтому практическое применение критерия "максимакса" весьма

Критерий Лапласа

Критерий Лапласа основан на принципе недостаточного обоснования . Поскольку в рамках информационного подхода в ситуации неопределенности вероятности состояний неизвестны, то нет оснований утверждать, что они различны. Поэтому можно допустить, что они одинаковы.

По критерию Лапласа в качестве оценки альтернативы используется средний выигрыш:

Оптимальной является альтернатива с максимальным средним выигрышем:

Х* = Х k , L k = max(L i), i = 1..N

При использовании максиминного критерия Вальда в качестве оптимальной выбирается стратегия, которая максимизирует минимальный результат для каждой альтернативы:

Значение критерия Вальда для рассматриваемого примера v op , = 4. Этому значению соответствует стратегия Х 4 .

Для критерия минимаксного риска Сэвиджа оптимальной является стратегия, при которой величина риска Гу в наихудших условиях минимальна, т.е. равна

а риск определяется как Гу =(шахау)-ау. Значение критерия Сэвиджа

для рассматриваемого примера равно единице. Ему соответствует стратегия Х 2 .

Критерий оптимизма - пессимизма Гурвица предполагает, что при выборе решения не следует руководствоваться ни крайним пессимизмом, ни крайним оптимизмом. Согласно этому критерию стратегия выбирается из условия

Значение коэффициента пессимизма к выбирается между нулем и единицей. При к = 1 критерий Гурвица превращается в критерий Вальда, при к > 0 - в критерий крайнего оптимизма.

В случае использования критерия безразличия Лапласа предполагается, что (неизвестные) вероятности возможных состояний окружающей среды (природы) одинаковы. Этот критерий выявляет альтернативу с максимальным средним результатом:

Пример 13.15. Молодой специалист (ЛПР) приглашен на стажировку в одну из европейских стран на пять лет. По итогам испытательного срока длительностью один год он может быть приглашен на постоянную работу. Ему необходимо распорядиться двухкомнатной квартирой, которую он имеет.

Возможные состояния конъюнктуры рынка S/.

  • 1) останется в Европе и курс доллара увеличится на 10% за год;
  • 2) останется в Европе и курс доллара уменьшится на 10% за год;
  • 3) вернется в Россию и курс доллара увеличится на 10% за год;
  • 4) вернется в Россию и курс доллара уменьшится на 10% за год.

Варианты решений для ЛПР Я):

  • 1) продать квартиру перед отъездом за 7 200 тыс. руб. (240 тыс. дол.);
  • 2) сдать квартиру в аренду за 30 тыс. руб./мес.;
  • 3) сдать одну комнату в аренду за 12 тыс. руб., а вторую продать за 2 400 тыс. руб.;
  • 4) продать квартиру через год, когда решение о переезде будет принято.

Очевидно, что если придется возвращаться и квартира будет сохранена, то этот вариант предпочтительнее. К такому варианту добавим некий бонус:

  • 1) если квартира продана сразу, то вычитаем сумму минимальной стоимости квартиры - 220 тыс. дол.;
  • 2) если квартира сохранена, то такую же сумму прибавляем;
  • 3) если продана только одна комната, то бонус равен стоимости одной комнаты - 80 тыс. дол.

Пусть курс доллара на данный момент равен 30 руб. Составим матрицу выигрышей в долларах США (табл. 13.9).

Вычислим платежную матрицу игры (табл. 13.10) и матрицу рисков (табл. 13.11)

Найдем решения, используя все рассмотренные критерии. Применяя максиминный критерий Вальда, получим

Этому критерию соответствует стратегия Ху Критерий минимаксного риска Сэвиджа дает

Таблица 13.9

30000 12 , -0000

30000 12 , -0000

12 000 12+2 400 000

12 000 12+ 2400 000

12 000 1 2+ 2 400 000

12 000 12+2 400 000

7200000 , омо

344 . ГЛАВА 13. ЭЛЕМЕНТЫ ТЕОРИИ ИГР

Таблица 13.10

г опт = шах {0,0,59111,0} = 59111,

что соответствует выбору стратегии X 3 .

Применяя критерий Гурвица при к = 0,6 (что соответствует среднестатистическим предпочтениям), получим


Этому критерию также соответствует стратегия X 3 . По критерию Лапласа

Это решение соответствует стратегии Х 4 .

Таким образом, по трем критериям оптимальной стратегией является X з.

В заключении отметим, что каждый критерий имеет свои положительные и отрицательные стороны. Анализ матрицы игры при помощи разных критериев позволяет исследовать задачу с разных точек зрения, особенно это полезно, если соответствующая матрица имеет большую размерность. Это в любом случае более конструктивный подход, чем попытки сравнения множества вариантов. Если полученные решения совпадут, как в примере, то решение однозначно. Если нет, то нужно провести дополнительный анализ с учетом всех характеристик рассматриваемых критериев.

В ситуации неопределенности невозможно определить вероятности наступления тех или иных последствий принимаемых решений. Поэтому критерий математического ожидания, который широко используется в ситуации риска, и для которого обязательно нужны упомянутые вероятности, здесь неприменим. Вместо него используются иные критерии.

Для выбора оптимальной стратегии в ситуации неопределенности существует два основных критерия: максимин и минимакс. Максимин называют еще критерием пессимиста или критерием Вальда , а минимакс - критерием Сэвиджа.

Критерий Вальда (Уолда) – максиминный. Этот критерий опирается на принцип наибольшей осторожности – критерий крайнего пессимизма, который основывается на выборе "из худшего – лучшее". По сути, это критерий минимакса – основной в теории игр. Согласно этому критерию природа (среда) ведет себя как разумный агрессивный противник, делающий все, чтобы помешать нам достичь успеха. Оптимальной считается та стратегия, которая гарантирует выигрыш наибольший (max) из всех наихудших (min) возможных исходов действия по каждой стратегии – уровень безопасности:

Выбранная таким образом оптимальная по критерию Вальда стратегия называется максиминной, а величина W – максимином.

Критерий Сэвиджа минимаксного риска . Критерий предполагает предварительное составление так называемой матрицы "рисков" (потерь, сожалений). В теории статистических решений риском rij при пользовании стратегией Qi в условиях Gj называется разность между выигрышем, который мог бы быть получен, если бы были известны условия Gj, и выигрышем, который будет получен, не зная их и выбирая стратегию Qi:

Минимакс ориентирован не столько на минимизацию потерь, сколько на минимизацию сожалений по поводу упущенной прибыли. Он допускает разумный риск ради получения дополнительной прибыли. Пользоваться этим критерием для выбора стратегии поведения в ситуации неопределенности можно лишь тогда, когда есть уверенность в том, что случайный убыток не приведет фирму к полному краху



Критерий произведений

Высокодоходные акции редко бывают достаточно надежными, а самые надежные высокодоходными. Поэтому при покупке акций всегда приходится выбирать между их доходностью и их надежностью и как-то увязывать их между собой. Такая проблема всегда встает при любом инвестиционном проекте. Если известны вероятности сохранения или потери инвестиций, то эта проблема решается с помощью критерия математического ожидания. Если их нет, приходится обращаться к другими критериям. Одним из таких критериев является критерий произведений. Он позволяет выбрать такой проект, который бы был наиболее доходным и в то же время наименее рискованным. Критерий произведений рассчитывается по формуле:

Критерий произведений способен работать на минимуме информации.

Пример решения задачи

Предположим, что в условиях колебания спроса G j = {3000, 6000, 9000,12000} у торгового предприятия существуют три стратегии сбыта какого-либо товара: Q п (1) = 6000 шт; Q п (2) = 9000 шт; Q п (3) = 12000 шт. по цене реализации C р = 70 руб. при цене покупки C п = 30 руб. и средних издержках И = 10руб./шт.

В соответствии с ресурсными возможностями торгового предприятия рассчитаем варианты среднегодовой прибыли по формуле (1), а результаты сведем в таблице 3.

Таблица 3 - Матрица выигрышей (прибылей) коммерческих стратегий при неопределенной рыночной конъюнктуре

1. Критерий Вальда. Для определения оптимальной стратегии по критерию наибольшей осторожности дополним табл. 3 столбцом 6 справа, укажем для каждой строки минимум прибыли и выберем ту стратегию, при которой минимум строки максимален (см. табл. 4).

Таблица 4 - Сводная матрица прибылей

2. Критерий Гурвица. Пусть показатель пессимизма λ определен λ = 0,4.

Для вычисления значений стратегий по критерию взвешенной (разумной) осторожности в дополнительном столбце 7 табл. 4 найдем максимальные значения для каждой строки. Тогда:

Максимальное значение соответствует двум стратегиям закупки Q п (1) и Q п (2) .

3. Критерий Лапласа. Исходя из принципа равновероятности состояний природы найдем средние значения "выигрышей"– прибылей для каждой стратегии:

По критерию усреднения выигрышей Лапласа наилучшей является стратегия закупки Q п (2)

4. Критерий Байеса-Лапласа. Для определения оптимальной стратегии по критерию средневзвешенной оценки выигрышей необходимо знать распределение вероятностей спроса. Пусть из прошлого опыта или экспертным путем такие вероятности определены (нижняя строка в табл. 4).

Тогда оценки по критерию для каждой стратегии составят:

Максимальное значение соответствует стратегии Q п (2) .

Таблица 5 - Матрица рисков коммерческих стратегий

5. Критерий Сэвиджа. Перейдем от матрицы выигрышей к матрице рисков (табл. 5). Для этого предварительно укажем в дополнительной строке таблицы максимально возможные выигрыши по каждому состоянию природы (предпоследняя строка) и затем рассчитаем соответствующие риски r i j = max П i j – П i j

для заполнения матрицы рисков (табл. 5). Исходя из принципа наибольшей осторожности, находим максимальные значения рисков по строкам и из них выбираем стратегии Q п (1) и Q п (2) с минимальным значением максимально возможного риска. Перенесем полученные значения в табл. 4 для подведения итогов выбора.

Итак, конкурирующими оказались стратегии Q п (1) и Q п (2) (выбор стратегии Q п (3) по критерию Гурвица вызван, скорее всего, излишним оптимизмом при выборе показателя λ). Стратегия Q п (1) выбрана по критериям Вальда, Лапласа и Сэвиджа, стратегия Q п (2) – по критериям Лапласа, Байеса-Лапласа и Сэвиджа.

Предпочтение той или иной стратегии выбирается лучшей по большинству критериев. Но в нашем случае две стратегии Q п (1) и Q п (2) равнозначны в этом смысле.

Задача по вариантами:

Таблица 6 - Матрица прибылей коммерческих стратегий при неопределенной рыночной конъюнктуре

Вариант 1

Вариант 2

Вариант 3

Вариант 4

Вариант 5

Вариант 6

Вариант 7

Вариант 8

Вариант 9

Многие из нас не любят попадать в ситуацию, когда информации о внешних факторах очень мало, или она напрочь отсутствует, и при этом нужно срочно сделать важный выбор. Скорее всего, именно поэтому большинство людей предпочитает избегать на работе ответственности и довольствуется скромным, но вместе с тем относительно спокойным служебным положением. Если бы они знали о теории игр и о том, какую пользу могут сослужить критерии Вальда, Сэвиджа, Гурвица, карьера наиболее сообразительных из них наверняка бы стремительно пошла вверх.

Рассчитывай на худшее

Именно так можно охарактеризовать первый из перечисленных принципов. Критерий Вальда нередко называют еще критерием крайнего пессимизма или правилом минимального зла. В условиях и шаткого, неустойчивого положения вполне логичным представляется перестраховочная позиция, которая рассчитана на самый худший случай. Максиминный критерий Вальда ориентирует на максимизацию выигрыша при наиболее неблагоприятных обстоятельствах. Примером его использования может служить максимальное увеличение минимального дохода, максимизация минимальных объемов наличности и т. п. Такая стратегия оправдывает себя в тех случаях, когда человек, принимающий решения, не столько заинтересован в большой удаче, сколько хочет застраховать себя от внезапных потерь. Другими словами, критерий Вальда сводит риск к минимуму и позволяет принимать наиболее безопасные решения. Подобный подход дает возможность получить гарантированный минимум, хотя фактический итог может оказаться не таким уж и плохим.

Критерий Вальда: пример использования

Предположим, некое предприятие собирается выпускать новые виды товаров. При этом следует сделать выбор между одним из четырех вариантов В 1 , В 2 , В 3 , В 4 , каждый из которых предполагает определенный тип выпуска либо их сочетание. От принятия решения в конечном счете будет зависеть, какую предприятие получит прибыль. Как конкретно сложится рыночная конъюнктура в будущем, неизвестно, однако аналитики прогнозируют три основных сценария развития событий: С 1 , С 2 , С 3 . Полученные данные позволяют составить таблицу возможных вариантов выигрыша, которые соответствуют каждой паре возможного решения и вероятной обстановки.

Виды продукции

Сценарии рыночной конъюнктуры

Наихудший результат

Используя критерий Вальда, следует выбрать такую, которая будет для рассматриваемого предприятия наиболее оптимальной. В нашем случае показатель эффективности

Е = мах {25;22;15;20} = 25.

Его мы получили, выбрав по каждому из вариантов минимальный результат и вычленив среди них тот, который принесет наибольший доход. Это означает, что решение В 1 будет для фирмы, согласно данному критерию, самым оптимальным. Даже при самой неблагоприятной обстановке будет получен результат 25 (С 1), в то же время не исключено, что он достигнет 45 (С 3).

Отметим еще раз, что критерий Вальда ориентирует человека на максимально осторожную линию поведения. При других обстоятельствах вполне возможно руководствоваться иными соображениями. К примеру, вариант В 3 мог бы принести выигрыш в 90 при гарантированном результате в 15. Однако этот случай выходит за рамки темы данной статьи, и потому рассматривать его мы пока не будем.

Краткая теория

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под природой будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений.

Управление любым объектом осуществляется путем принятия последовательности управленческих решений. Для принятия решения необходима информация (совокупность сведений о состоянии объекта управления и условиях его работы). В тех случаях когда отсутствует достаточно полная информация, возникает неопределенность в принятии решения. Причины этого могут быть различны: требующаяся для полного обоснования решения информация принципиально не может быть получена (неустранимая неопределенность); информация не может быть получена своевременно, к моменту принятия решения; затраты, связанные с получением информации, слишком высоки. По мере совершенствования средств сбора, передачи и обработки информации неопределенность управленческих решении будет уменьшаться. К этому нужно стремиться. Существование неустранимой неопределенности связано со случайным характером многих явлений. Например, в торговле, случайный характер изменения спроса делает невозможным его точное прогнозирование, a, следовательно, и формирование идеально точного заказа на поставку товара. Принятие решения в этом случае связано с риском. Приемка партии товара на основании выборочного контроля также связана с риском принятия решения в условиях неопределенности. Неопределенность может быть снята путем полного контроля всей партии, однако это может оказаться слишком дорогостоящим мероприятием. В сельском хозяйстве, например, с целью получения урожая человек предпринимает ряд действии (пашет землю, вносит удобрения, борется с сорняками и т. п.). Окончательный результат (урожай) зависит от действий не только человека, но и природы (дождь, засуха, вечер и т. п.). Из приведенных примеров видно, что полностью исключить неопределенность в управлении экономической системой нельзя, хотя, повторим, к этому нужно стремиться. В каждом конкретном случае следует принимать во внимание степень риска при принятии управленческих решений, по возможности максимально учитывать имеющуюся информацию с целью уменьшения неблагоприятных последствий, которые могут возникнуть из-за ошибочных решений.

Две стороны, участвующие в игре, будем называть игрок I и игрок II. Каждый из игроков располагает конечным набором действий (чистых стратегий), которые он может применять в процессе игры. Игра имеет повторяющийся, циклический характер. о каждом цикле игроки выбирают одну из своих стратегии, что однозначно определяет платеж . Интересы игроков противоположны. Игрок I старается вести игру так, чтобы платежи были как можно большими. Для игрока II желательны как можно меньшие значения платежей (с учетом знака). Причем в каждом цикле выигрыш одного из игроков в точности совпадает с проигрышем другого. Игры такого типа называются играми с нулевой суммой.

Решить игру - значит определить оптимальное поведение игроков. Решение игр является предметом теории игр. Оптимальное поведение игрока инвариантно относительно изменения всех элементов платежной матрицы на некоторую величину.

В общем случае определение оптимального поведения игроков связано с решением двойственной пары задач линейного программирования. В отдельных случаях могут быть использованы более простые методы. Часто платежную матрицу удается упростить путем удаления из нее строк и столбцов, соответствующих доминируемым стратегиям игроков, доминируемой называется стратегия, все платежи которой не лучше соответствующих платежей некоторой другой стратегии и хотя бы один из платежей хуже соответствующего платежа этой другой стратегии, называемой доминирующей.

В обычной стратегической игре принимают участие «разумные и антагонистические» противники (противоборствующие стороны). В таких играх каждая из сторон предпринимает именно те действия, которые наиболее выгодны ей и менее выгодны противнику. Однако очень часто неопределенность, сопровождающая некоторую операцию, не связана с сознательным противодействием противника, а зависит от некой, не известной игроку I объективной действительности (природы). Такого рода ситуации принято называть играми с природой. Игрок II - природа - в теории статистических игр не является разумным игроком, так как рассматривается как некая незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Возможные состояния природы (ее стратегии) реализуются случайным образом. В исследовании операций оперирующую сторону (игрока I) часто называют статистиком, а сами операции - играми статистика с природой или статистическими играми.

Рассмотрим игровую постановку задачи принятия решения в условиях неопределенности. Пусть оперирующей стороне необходимо выполнить операцию в недостаточно известной обстановке относительно состояний которой можно сделать предположений. Эти предположения будем рассматривать как стратегии природы. Оперирующая сторона в своем распоряжении имеет возможных стратегий - . Выигрыши игрока I при каждой паре стратегий и - предполагаются известными и заданы платежной матрицей .

Задача заключается в определении такой стратегии (чистой или смешанной), которая лри ее применении обеспечила бы оперирующей стороне наибольший выигрыш.

Выше уже говорилось, что хозяйственная деятельность человека может рассматриваться как игра с природой. Основной особенностью природы как игрока является ее не заинтересованность в выигрыше.

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и заведомо невыгодных стратегий лица, играющего с природой. Что касается стратегий природы, то ни одну из них отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока I. Ввиду того что природа не противодействует игроку I, может показаться, что игра с природой проще стратегической игры. На самом деле это не так. Противоположность интересов игроков в стратегической игре в некотором смысле как бы снимает неопределенность, чего нельзя сказать о статистической игре. Оперирующей стороне в игре с природой легче в том отношении, что она скорее.всего выиграет больше, чем в игре против сознательного противника. Однако ей труднее принять обоснованное решение, так как в игре с природой неопределенность ситуации сказывается в гораздо более сильной степени.

После упрощения платежной матрицы игры с природой целесообразно не только оценить выигрыш при той или иной игровой ситуации, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях. Эта разность в теории игр называется риском.

Природа меняет состояние стихийно, совершенно не заботясь о результате игры. В антагонистической игре мы предполагали, что игроки пользуются оптимальными (в определенном выше смысле) смешанными стратегиями. Можно предположить, что природа применяет наверняка не оптимальную стратегию. Тогда какую? Если бы существовал ответ на этот вопрос, то принятие решения лицом, принимающим решения (ЛПР) сводилось бы к детерминированной задаче.

Если вероятности состояний природы известны, то пользуются критерием Байеса, в соответствии с которым оптимальной считается чистая стратегия , при которой максимизируется средний выигрыш:

Критерий Байеса предполагает, что нам хотя и неизвестны условиях выполнения операций (состояния природы) , но известны их вероятности .

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Если игроку представляются в равной мере правдоподобными все состояния природы, то иногда полагают и, учитывая, «принцип недостаточного основания» Лапласа, оптимальной считают чистую стратегию , обеспечивающую:

Если же смешанная стратегия природы неизвестна, то в зависимости от гипотезы о поведении природы можно предложить ряд подходов для обоснования выбора решения ЛПР. Свою оценку характера поведения природы будем характеризовать числом , которое можно связывать со степенью активного «противодействия» природы как игрока Значение соответствует наиболее пессимистичному отношению ЛПР в смысле «содействия» природы в достижении им наилучших хозяйственных результатов. Значение соответствует наибольшему оптимизму ЛПР. Как известно, в хозяйственной деятельности указанные крайности опасны. Скорее всего, целесообразно исходить из некоторого промежуточного значения . В этом случае используется критерий Гурвица, согласно которому наилучшим решением ЛПР является чистая стратегия , соответствующая условию:

Критерий Гурвица (критерий «оптимизма-пессимизма») позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся в поле между значениями по критериям «максимакса» и «максимина» (поле между этими значениями связано посредством выпуклой линейной функции).

В случае крайнего пессимизма ЛПР указанный критерий называется критерием Вальда. Согласно этому критерию, наилучшей считается максиминная стратегия. Это критерий крайнего пессимизма. По этому критерию ЛПР выбирает ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш:

Такой выбор соответствует наиболее робкому поведению ЛПР, когда он предполагает наиболее, неблагоприятное поведение природы, боится больших потерь. Можно предположить, что он не получит больших выигрышей. Согласно критерию Сэвиджа, следует выбирать чистую стратегию соответствующую условию:

где риск .

Критерий Сэвиджа (критерий потерь от «минимакса») предполагает, что из всех возможных вариантов «матрицы решений» выбирается та альтернатива, которая минимизирует размеры максимальных потерь по каждому из возможных решений. При использовании этого критерия «матрица решения» преобразуется в «матрицу риска», в которой вместо значений эффективности проставляются размеры потерь при различных вариантах развития событий.

Недостатком критериев Вальда, Сэвиджа и Гурвица является субъективная оценка поведения природы. Хотя указанные критерии и дают некоторую логическую схему принятия решений, резонно все же задать вопрос: «А почему сразу не выбрать субъективное решение, вместо того чтобы иметь дело с разными критериями?» Несомненно, определение решения по различным критериям помогает ЛПР оценить принимаемое решение с различных позиций и избежать грубых ошибок в хозяйственной деятельности.

Пример решения задачи

Условие задачи

После нескольких лет эксплуатации оборудование может оказаться в одном из трех состояний:

  1. требуется профилактический ремонт;
  2. требуется замена отдельных деталей и узлов;
  3. требуется капитальный ремонт.

В зависимости от ситуации руководство предприятия может принять следующие решения:

Требуется найти оптимальное решение данной проблемы по критерию минимизации затрат с учетом следующих предположений:

a 4 6 9 b 5 3 7 c 20 15 6 q 0.4 0.45 0.15

Решение задачи

Если возникли сложности с решением задач, то сайт сайт оказывает онлайн помощь студентам по методам оптимальных решений с контрольными или экзаменами.

Игра парная, статистическая. В игре участвуют 2 игрока: руководство предприятия и природа.

Под природой в данном случае понимаем совокупность внешних факторов, которые определяют состояние оборудования.

Стратегия руководства:

Отремонтировать оборудование своими силами

Вызвать бригаду специалистов

Заменить оборудование новым

Стратегия природы - 3 возможных состояния оборудования.

Требуется профилактический ремонт;

Следует заменить отдельные детали и узлы;

Требуется капитальный ремонт.

Расчет платежной матрицы и матрицы рисков

Поскольку элементы матрицы - затраты, то будем считать их выигрышными но со знаком минус. Платежная матрица:

-4 -6 -9 -9 -5 -3 -7 -7 -20 -15 -6 -20 0.4 0.45 0.15

Составляем матрицу рисков:

-4-(-20)=16 -6-(-15)=9 -9-(-9)=0 16 -5-(-20)=15 -3-(-15)=12 -7-(-9)=2 15 -20-(-20)=0 -15-(-15)=0 -6-(-9)=3 3

Критерий Байеса

Определяем средние выигрыши:

По критерию Байеса оптимальной является стратегия - вызвать бригаду специалистов

Критерий Лапласа

Определим средние выигрыши:

По критерию Лапласа оптимальной является стратегия - вызвать бригаду специалистов

Критерий Вальда

По критерию Вальда оптимальной является стратегия - вызвать бригаду специалистов

Критерий Сэвиджа

По критерию Сэвиджа оптимальной является стратегия - заменить оборудование новым

Критерий Гурвица

По критерию Гурвица оптимальной является стратегия - вызвать бригаду специалистов

Ответ

По всем критериям, за исключением критерия Сэвиджа, оптимальной является стратегия «Вызвать бригаду специалистов». По критерию Сэвиджа, который минимизирует риски, оптимальной является стратегия «Заменить оборудование новым».


Содержит изложенные в краткой и доступной форме теоретические сведения о матричной игре без седловой точки и способе сведения такой задачи к задаче линейного программирования, для отыскания ее решения в смешанных стратегиях. Приведен пример решения задачи.

Многоканальная СМО с неограниченной очередью
Приведены необходимые теоретические сведения и образец решения задачи по теме "Многоканальная система массового обслуживания с неограниченной очередью", подробно рассмотрены показатели многоканальной системы массового обслуживания (СМО) с ожиданием обслуживания - среднее число каналов, занятых обслуживанием заявки, длина очереди, вероятность образования очереди, вероятность свободного состояния системы, среднее время ожидания в очереди.

Критический путь, критическое время и другие параметры сетевого графика работ
На примере решения задачи рассмотрены вопросы построения сетевого графика работ, нахождение критического пути и критического времени. Также показано вычисление параметров и резервов событий и работ - ранних и поздних сроков, общих (полных) и частных резервов.