Задачи теории статистических решений. (статистические игры)

Критерий Сэвиджа один из критериев принятия решений в условиях неопределённости. Условиями неопределённости считается ситуация, когда последствия принимаемых решений неизвестны, и можно лишь приблизительно их оценить. Для принятия решения… … Википедия

Критерий согласия Колмогорова - или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

Вальда критерий - , другое написание критерий Уолда см. Максимин … Экономико-математический словарь

Критерий согласия Пирсона - Критерий Пирсона, или критерий χ² (Хи квадрат) наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… … Википедия

Критерий Краскела - Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия

Критерий Кохрена - Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия

Критерий Лиллиефорса - статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… … Википедия

Критерий Уилкоксона - Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Добавить иллюстрации. Т Крит … Википедия

Последовательный статистический критерий - Последовательный статистический критерий последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе. Пусть наблюдению в статистическом эксперименте доступна случайная величина с… … Википедия

Тест Вальда - (англ. Wald test) статистический тест, используемый для проверки ограничений на параметры статистических моделей, оцененных на основе выборочных данных. Является одним из трех базовых тестов проверки ограничений наряду с тестом… … Википедия

Книги

  • Теория вероятностей и математическая статистика в задачах: Более 360 задач и упражнений , Борзых Д.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к… Купить за 443 руб
  • Теория вероятностей и математическая статистика в задачах. Более 360 задач и упражнений , Борзых Д.А.. В предлагаемом пособии содержатся задачи различного уровня сложности. Однако основной акцент сделан на задачах средней сложности. Это сделано намеренно с тем, чтобы побудить студентов к…
Назначение сервиса . Данный тип задач относится к задачам принятия решений в условиях неопределенности . С помощью сервиса можно выбрать оптимальную стратегию, используя:
  • критерий минимакса, критерий максимакса, критерий Байеса, критерий Вальда, критерий Сэвиджа , критерий Лапласа, критерий Ходжа-Лемана см. Типовые задания ;
  • критерий Гурвица, обобщенный критерий Гурвица с расчетом эффективности.
Также проводится планирование идеального эксперимента. Результаты онлайн вычислений оформляются в отчете формата Word (см. пример оформления).

Инструкция . Для выбора оптимальной стратегии в онлайн режиме необходимо задать размерность матрицы. Затем в новом диалоговом окне выбрать необходимые критерии и коэффициенты. Также можно вставить данные из Excel .

Размерность платежной матрицы (целевая функция ЗПР в условиях неопределенности)
2 3 4 5 6 7 8 9 10 x 2 3 4 5 6 7 8 9 10 ",0);">
Примечание : Сначала, если возможно, упрощают матрицу, вычеркивая невыгодные стратегии A. Стратегии природы вычеркивать нельзя, т. к. каждое из состояний природы может наступить случайным образом, независимо от действий A .

Любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под "природой" понимается совокупность неопределенных факторов; влияющих на эффективность принимаемых решений. Безразличие природы к игре (выигрышу) к возможность получения экономистом (статистиком) дополнительной информации о ее состоянии отличают игру экономиста с природой от обычной матричной игры, в которой принимают участие два сознательных игрока.

Пример . Предприятие может выпускать 3 вида продукции А 1 , А 2 и А 3 , получая при этом прибыль, зависящую от спроса, который может быть в одном из 4-х состояний (В 1 , В 2 , В 3 , В 4). Элементы платежной матрицы характеризуют прибыль, которую получат при выпуске i-й продукции при j-м состоянии спроса. Игра предприятия А против спроса В задана платежной матрицей:



В 1

В 2

В 3

В 4

А 1

2

7

8

6

А 2

2

8

7

3

А 3

4

3

4

2

Определить оптимальные пропорции в выпускаемой продукции, гарантирующие максимизацию средней величины прибыли при любом состоянии спроса, считая его определенным. Задача сводится к игровой модели, в которой.

Решение.
Критерий максимакса .


Выбираем из (8; 8; 4) максимальный элемент max=8

Критерий Лапласа .


Выбираем из (5.75; 5; 3.25) максимальный элемент max=5.75
Вывод: выбираем стратегию N=1.

Критерий Вальда .


Выбираем из (2; 2; 2) максимальный элемент max=2
Вывод: выбираем стратегию N=1.

Критерий Севиджа .
Находим матрицу рисков.
Риск - мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце b j = max(a ij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r 11 = 4 - 2 = 2; r 21 = 4 - 2 = 2; r 31 = 4 - 4 = 0;
2. Рассчитываем 2-й столбец матрицы рисков.
r 12 = 8 - 7 = 1; r 22 = 8 - 8 = 0; r 32 = 8 - 3 = 5;
3. Рассчитываем 3-й столбец матрицы рисков.
r 13 = 8 - 8 = 0; r 23 = 8 - 7 = 1; r 33 = 8 - 4 = 4;
4. Рассчитываем 4-й столбец матрицы рисков.
r 14 = 6 - 6 = 0; r 24 = 6 - 3 = 3; r 34 = 6 - 2 = 4;


Результаты вычислений оформим в виде таблицы.

Выбираем из (2; 3; 5) минимальный элемент min=2
Вывод: выбираем стратегию N=1.

Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A 1 .

Многие из нас не любят попадать в ситуацию, когда информации о внешних факторах очень мало, или она напрочь отсутствует, и при этом нужно срочно сделать важный выбор. Скорее всего, именно поэтому большинство людей предпочитает избегать на работе ответственности и довольствуется скромным, но вместе с тем относительно спокойным служебным положением. Если бы они знали о теории игр и о том, какую пользу могут сослужить критерии Вальда, Сэвиджа, Гурвица, карьера наиболее сообразительных из них наверняка бы стремительно пошла вверх.

Рассчитывай на худшее

Именно так можно охарактеризовать первый из перечисленных принципов. Критерий Вальда нередко называют еще критерием крайнего пессимизма или правилом минимального зла. В условиях и шаткого, неустойчивого положения вполне логичным представляется перестраховочная позиция, которая рассчитана на самый худший случай. Максиминный критерий Вальда ориентирует на максимизацию выигрыша при наиболее неблагоприятных обстоятельствах. Примером его использования может служить максимальное увеличение минимального дохода, максимизация минимальных объемов наличности и т. п. Такая стратегия оправдывает себя в тех случаях, когда человек, принимающий решения, не столько заинтересован в большой удаче, сколько хочет застраховать себя от внезапных потерь. Другими словами, критерий Вальда сводит риск к минимуму и позволяет принимать наиболее безопасные решения. Подобный подход дает возможность получить гарантированный минимум, хотя фактический итог может оказаться не таким уж и плохим.

Критерий Вальда: пример использования

Предположим, некое предприятие собирается выпускать новые виды товаров. При этом следует сделать выбор между одним из четырех вариантов В 1 , В 2 , В 3 , В 4 , каждый из которых предполагает определенный тип выпуска либо их сочетание. От принятия решения в конечном счете будет зависеть, какую предприятие получит прибыль. Как конкретно сложится рыночная конъюнктура в будущем, неизвестно, однако аналитики прогнозируют три основных сценария развития событий: С 1 , С 2 , С 3 . Полученные данные позволяют составить таблицу возможных вариантов выигрыша, которые соответствуют каждой паре возможного решения и вероятной обстановки.

Виды продукции

Сценарии рыночной конъюнктуры

Наихудший результат

Используя критерий Вальда, следует выбрать такую, которая будет для рассматриваемого предприятия наиболее оптимальной. В нашем случае показатель эффективности

Е = мах {25;22;15;20} = 25.

Его мы получили, выбрав по каждому из вариантов минимальный результат и вычленив среди них тот, который принесет наибольший доход. Это означает, что решение В 1 будет для фирмы, согласно данному критерию, самым оптимальным. Даже при самой неблагоприятной обстановке будет получен результат 25 (С 1), в то же время не исключено, что он достигнет 45 (С 3).

Отметим еще раз, что критерий Вальда ориентирует человека на максимально осторожную линию поведения. При других обстоятельствах вполне возможно руководствоваться иными соображениями. К примеру, вариант В 3 мог бы принести выигрыш в 90 при гарантированном результате в 15. Однако этот случай выходит за рамки темы данной статьи, и потому рассматривать его мы пока не будем.

Выбор наилучшего решения в условиях неопределенности существенно зависит от того, какова степень этой неопределенности, т.е. от того, какой информацией располагает ЛПР.

Предположения субъективны, поэтому и степени неопределенности со стороны ЛПР должны различаться. Практикуются два основных подхода к принятию решения в условиях неопределенности. Лицо, принимающее решение, может использовать имеющуюся у него информацию и свои собственные личные суждения, а также опыт для идентификации и определения субъективных вероятностей возможных внешних условий, оценки возможных последствий альтернатив в различных условиях внешней среды. Это, в сущности, делает условия неопределенности аналогичными условиям риска, а процедура принятия решения, обсуждавшаяся ранее для условий риска, выполняется и в этом случае.

Если степень неопределенности слишком высока, то ЛПР предпочитает не делать допущений относительно вероятностей различных внешних условий, т.е. это лицо может или не учитывать вероятности, или рассматривать их как равные, что практически одно и то же. Если применяется данный подход, то для оценки предполагаемых стратегий имеются четыре критерия решения:

  • 1) критерий решения Вальда, называемый также максимином;
  • 2) альфа-критерий решения Гурвица;
  • 3) критерий решений Сэвиджа, называемый также критерием отказа от минимакса;
  • 4) критерий решений Лапласа, называемый также критерием решения Бэйеса.

Пожалуй, наиболее трудная задача для ЛПР заключается в выборе конкретного критерия, наиболее подходящего для решения предложенной задачи. Выбор критерия должен быть логичным при данных обстоятельствах. Кроме того, при выборе критерия должны учитываться философия, темперамент и взгляды нынешнего руководства фирмы (оптимистические или пессимистические, консервативные или прогрессивные).

Рассмотрим эти утверждения на конкретном примере. Элементами модели выбора альтернатив в условиях неопределенности являются матрица принятия решений i, Sj| и целевая функция Е {A i, w (S j)} (рис. 6.9).

Рис. 6.9.

А i, – альтернативы действий; Sj – состояние внешней среды; w (S j) – вероятности наступления состояния S j, причем Σmj= 1w(S j) = 1; e ij – результат, который будет достигнут, если выбрана альтернатива А i и наступит состояние внешней среды S j

В качестве иллюстрационного примера возьмем матрицу решений (рис. 6.10), включающую в себя пять альтернатив (A i; i = 1, ..., 5) и четыре состояния внешней среды (S j; j = 1,4). Последствия принимаемых решений приведены на пересечении строк и столбцов (e ij).

Рис. 6.10.

В условиях определенности, т.е. когда принятие решений происходит после наступления событий во внешней среде (апостериори), должно приниматься решение, максимизирующее целевую функцию (рис. 6.11). Так, при наступлении события S 1 необходимо принимать альтернативу A2, при S2 → A4, при S3 → A5, при S4 → A1.

Рис. 6.11.

В условиях риска необходимо принимать решение (выбирать альтернативу Ai) до наступления события Sj во внешней среде (априори), что требует учета вероятности w (Sj) наступления этого события. Это можно сделать путем умножения вероятности наступления этого события w (S j) на результат e ij, получаемый от принятия того или иного решения, и выбрать наибольшее значение Ai (рис. 6.12).

Рис. 6.12.

В случае если степень неопределенности слишком высока, то ЛПР может присваивать значениям вероятности свои субъективные значения, сводя задачу к принятию решений в условиях риска, либо не делать допущений относительно вероятностей различных внешних условий, т.е. может или не учитывать вероятности, или рассматривать их как равные, применяя различные критерии для выбора.

Критерий решения Вальда

Критерием Вальда "рассчитывай на худшее" (критерий крайнего пессимизма, или максимин) называют критерий, предписывающий обеспечить значение параметра эффекта, равного а:

Этот критерий ориентирует ЛПР на наихудшие условия и рекомендует выбрать ту стратегию, для которой выигрыш максимален. В других, более благоприятных условиях использование этого критерия приводит к потере эффективности системы или операции.

В рассматриваемом случае (рис. 6.13) в соответствии с критерием "крайнего пессимизма" наилучшей альтернативой будет A1.

Другим предельным случаем критерия Вальда является критерий "необузданного оптимизма", или максимакс:

В соответствии с этим критерием необходимо выбрать альтернативу А 2.

Рис. 6.13.

Альфа-критерий решения Гурвица

Этот критерий рекомендует при выборе решения в условиях неопределенности не руководствоваться крайним пессимизмом (всегда "рассчитывай на худшее", α = 0) или крайним оптимизмом ("все будет наилучшим образом", а = 1). Рекомендуется некое среднее решение (0 ≤ α ≤ 1). Этот критерий имеет следующий вид:

где α – некий коэффициент, выбираемый экспериментально из интервала между 0 и 1.

Использование этого коэффициента вносит дополнительный субъективизм в принятие решений с использованием критерия Гурвица.

В рассматриваемом примере (рис. 6.14) для случая а = 0,7 предпочтительной альтернативой становится А3.

Рис. 6.14.

Здесь приняты следующие обозначения:

Критерий решения Сэвиджа

В соответствии с этим минимаксным критерием, если требуется в любых условиях избежать большого риска, то оптимальным будет то решение, для которого риск, максимальный при различных вариантах условий, окажется минимальным.

При использовании критерия Сэвиджа обеспечивается наименьшее значение максимальной величины риска:

где риск r ij определяется выражением r ij = β – e ij, β – максимально возможный выигрыш.

Критерий Сэвиджа, как и критерий Вальда, – это критерий крайнего пессимизма, но только пессимизм здесь проявляется в том, что минимизируется максимальная потеря в выигрыше по сравнению с тем, чего можно было бы достичь в данных условиях.

Для рассматриваемого примера результаты выбора альтернативы приведены на рис. 6.15.

Рис. 6.15.

В рассматриваемом примере альтернатива А 4 минимизирует максимальное "наказание" за неверно определенное состояние внешней среды.

Критерий решения Лапласа

Критерий Лапласа, или байесов критерий, гласит, что если вероятности состояния среды неизвестны, то они должны приниматься как равные. В этом случае выбирается стратегия, характеризующаяся самой предполагаемой стоимостью при условии равных вероятностей. Критерий Лапласа позволяет сводить условие неопределенности к условиям риска. Критерий Лапласа называют критерием рациональности, и он подходит для стратегических долгосрочных решений, как и все названные выше критерии.

В рассматриваемом примере наилучшей альтернативой по критерию Лапласа (рис. 6.16) является А 5.

Рис. 6.16.

Кроме названных выше четырех критериев для принятия решений в условиях неопределенности существуют неколичественные методы, такие как приобретение дополнительной информации, хеджирование, гибкое инвестирование и др.

Наиболее просто решается задача о выборе решения в условиях неопределенности, когда нам хотя и неизвестны условия выполнения операции (состояние природы) но известны их вероятности:

В этом случае в качестве показателя эффективности, который мы стремимся обратить в максимум, естественно взять среднее значение, или математическое ожидание выигрыша, с учетом вероятностей всех возможных условий.

Обозначим это среднее значение для стратегии игрока через

или, короче,

Очевидно, есть не что иное, как взвешенное среднее выигрышей строки, взятых с кесами . В качестве оптимальной стратегии естественно выбрать ту из стратегий для которой величина обращается в максимум.

С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем.

Пример 1. Планируется операция в заранее неизвестных метеорологических условиях; варианты этих условий: Согласно материалам метеосводок за много лет частоты (вероятности) этих вариантов равны соответственно:

Возможные варианты организации операции в различных метеоусловиях приносят различную выгоду. Значения «дохода» для каждого решения в разные условиях приведены в табл. 13.1

Таблица 13.1

В последней строке даны вероятности условий. Средние выигрыши приведены в последнем столбце. Из него видно, что оптимальной стратегией игрока является его стратегия дающая средний выигрыш (отмечен звездочкой).

При выборе оптимальной стратегии в неизвестных условиях с известными вероятностями можно пользоваться не только средним выигрышем

но и средним риском

который, разумеется, нужно обратить не в максимум, а в минимум.

Покажем, что стратегия, максимизирующая средний выигрыш совпадает со стратегией, минимизирующей средний риск Вычислим оба эти показателя и сложим их:

(13.2)

Эта сумма (среднее взвешенное значение максимумов столбцов) для данной матрицы есть величина постоянная; Обозначим ее С:

откуда средний риск равен

Очевидно, эта величина обращается в минимум тогда же, когда а, - в максимум, следовательно, стратегия, выбранная из условий минимального среднего риска, совпадает со стратегией, выбранной из условий максимального среднего выигрыша.

Заметим, что в случае, когда известны вероятности состояний природы при решении игры с природой всегда можно обойтись одними чистыми стратегиями, не применяя смешанных. Действительно, если мы будем применять какую-то смешанную стратегию

т. е. стратегию с вероятностью стратегию с вероятностью и т. д., то наш средний выигрыш, осредненный и по условиям (состояниям природы) и по нашим стратегиям, будет:

Это - взвешенное среднее выигрышей соответствующих нашим чистым стратегиям.

Но ясно, что любое среднее не может превосходить максимальной из осредняемых величин:

Поэтому применение смешанной стратегии с любыми вероятностями не может быть выгоднее для игрока, чем применение чистой стратегии .

Вероятности условий (состояний природы) могут быть определены из статистических данных, связанных с многократным выполнением подобных операций или просто с проведением наблюдений над состояниями природы. Например, если железной дороге за данный промежуток времени предстоит выполнить не вполне известный объем перевозок, то данные о распределении условий могут быть взяты из опыта прошлых лет. Если, как в предыдущем примере, успех операции зависит от метеоусловий, данные о них могут быть взяты из статистики метеосводок.

Однако часто встречаются случаи, когда, приступая к выполнению операции, мы не имеем представления о вероятностях состояний природы; все наши сведения сводятся к перечню вариантов состояний, а оценить их вероятности мы не можем. Так, например, вряд ли нам удастся разумно оценить вероятность того, что в течение ближайших k лет будет предложено и реализовано важное техническое изобретение.

Разумеется, в подобных случаях вероятности условий (состояний природы) могут быть оценены субъективно: некоторые из них представляются нам более, а другие - менее правдоподобными. Для того чтобы наши субъективные представления о большей или меньшей «правдоподобности» той или другой гипотезы превратить в численные оценки, могут применяться различные технические приемы. Так, если мы не можем предпочесть ни одной гипотезы, если они все для нас равноправны, то естественно назначить их вероятности равными друг другу:

Это - так называемый «принцип недостаточного основания» Лапласа. Другой часто встречающийся случай - когда мы имеем представление о том, какие условия более вероятны, а какие - менее, т. е. можем расположить имеющиеся гипотезы в порядке убывания их правдоподобности: всего правдоподобнее первая гипотеза (ПО, затем вторая ) менее всего правдоподобна гипотеза (). Однако, насколько одна из них вероятнее другой - мы не знаем. В этом случае можно, например, назначить вероятности гипотез пропорциональными членам убывающей арифметической прогрессии:

или, учитывая, что

Иногда удается, исходя из опыта и здравого смысла, оценить и более тонкие различия между степенями правдоподобия гипотез.

Подобные методы субъективной оценки «вероятности-правдоподобности» разных гипотез о состоянии природы могут иногда помочь при выборе решения. Однако нельзя забывать, что «оптимальное решени выбранное на основе субъективных вероятностей, неизбежно окажется тоже субъективным. Степень субъективности решения можно уменьшить, если вместо вероятностей назначенных произвольно одним лицом, ввести средние из таких вероятностей, назначенных, независимо друг от друга, группой квалифицированных лиц («экспертов»). Метод опроса экспертов вообще широко применяется в современной науке, когда речь идет об оценке неопределенной ситуации (например, в футурологии). Опыт применения подобных методов учит, что зачастую оценки экспертов (принятые независимо одним от другого) оказываются далеко не столь разноречивыми, как это можно было предположить заранее, и вывести из них некоторые предпосылки для принятия разумного решения вполне возможно.

Выше мы осветили вопрос о выборе решения на основе объективно вычисленных или субъективно назначенных вероятностей состояний природы. Этот подход в теории решений - не единственный. Кроме него существуют еще несколько «критериев» или подходов к выбору оптимального решения в условиях неопределенности. Остановимся на некоторых из них.

1. Максиминный критерий Вальда

Согласно этому критерию в качестве оптимальной выбирается та стратегия игрока А, при которой минимальный выигрыш максимален, т. е. стратегия, гарантирующая при любых условиях выигрыш, не меньший, чем максимин:

(13.4)

Если руководствоваться этим критерием, надо всегда ориентироваться на худшие условия и выбирать ту стратегию, Для которой в худших условиях выигрыш максимален. Пользуясь таким критерием в играх с природой, мы как бы ставим взамен этой безличной и незаинтересованной инстанции активного и злонамеренного противника. Очевидно, такой подход может быть продиктован только крайним пессимизмом в оценке обстановки - «всегда надо рассчитывать на худшее!» - но как один из возможных подходов заслуживает рассмотрения.

2. Критерий минимаксного риска Сэвиджа

Сущность этого критерия в том, чтобы любыми путями избежать большого риска при принятии решения.

Критерий Сэвиджа, так же как и критерий Вальда - это критерий крайнего пессимизма, но только пессимизм здесь понимается по-другому: худшим объявляется не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях (максимальный риск).

3. Критерий пессимизма-оптимизма Гурвица

Этот критерий рекомендует в условиях неопределенности при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее!) ни крайним, легкомысленным оптимизмом (все обойдется наилучшим образом!) Критерий Гурвица имеет вид:

где - коэффициент, выбираемый между нулем и единицей.

Проанализируем структуру выражения (13.6). При критерий Гурвица превращается в пессимистический критерий Вальда, а при - в критерий «крайнего оптимизма», рекомендующий выбирать ту стратегию, для которой в наилучших условиях выигрыш максимален. При получается нечто среднее между крайним пессимизмом и крайним оптимизмом (коэффициент и выражает как бы «меру пессимизма» исследователя). Этот коэффициент выбирается из субъективных соображений - чем опаснее ситуация, чем больше мы хотим в ней «подстраховаться», тем ближе к единице выбирается и.

При желании можно построить критерий, аналогичный критерию оптимизма-пессимизма Гурвица исходя не из выигрыша, а из риска, как в критерии Сэвиджа, но мы на этом не будем останавливаться.

Несмотря на то, что выбор критерия, как и выбор параметра в критерии Гурвица, являются субъективным, все же может оказаться полезным просмотреть ситуацию с точки зрения этих критериев. Если рекомендации, вытекающие из различных критериев, совпадают - тем лучше, можно смело выбирать рекомендуемое ими решение. Если же, как это часто бывает, рекомендации противоречат друг другу - всегда имеет смысл задуматься над этим и принять окончательное решение с учетом его сильных и слабых сторон. Анализ матрицы игры с природой под углом зрения разных критериев часто дает лучшее представление о ситуации, о достоинствах и недостатках каждого решения, чем непосредственное рассмотрение матрицы, особенно, когда ее размеры велики.

Пример 2. Рассматривается игра с природой 4X3 с четырьмя стратегиями игрока: и тремя вариантами условий (состояний природы): Матрица выигрышей дана в табл. 13.2.

Таблица 13.2

Найти оптимальное решение (стратегию), пользуясь критериями Вальда, Сэвиджа и критерием Гурвица при

Решение. 1. Критерий Вальда.

В каждой строке матрицы берем наименьший выигрыш (табл. 13.3).

Из величин максимальная (отмечена звездочкой) равна 0,25, следовательно, по критерию Вальда оптимальной является стратегия

2. Критерий Сэвиджа.

Строим матрицу рисков и помещаем в правом добавочном столбце максимальный риск в каждой строке (табл. 13.4).

Минимальным из значений является 0,60 (отмечено звездочкой); следовательно, по критерию Сэвиджа, оптимальной является любая из стратегий

Таблица 13.3

3. Критерий Гурвица

Записываем в правых трех столбцах матрицы (табл. 13 5) «пессимистическую» оценку выигрыша «оптимистическую» а); и их среднее взвешенное по формуле (13.6):

для которой достигается

(минимум берется по всем Найти этот минимакс (или максимин в критерии Вальда) можно обычными методами линейного программирования. Могут быть случаи, когда применение смешанных стратегий при пользовании критериями Вальда, Сэвиджа, Гурвица даст преимущество по сравнению с тем решением, где применяются одни чистые стратегии, однако мы будем рассматривать эти критерии только для чистых стратегий.

Одна из причин этого - в том, что мы хотим избежать сложных вычислений, когда их результат может быть сведен на нет недостатком сведений о ситуации (незнание вероятностей условий). Другая, более важная причина - в том, что основное содержание теории статистических решений (мы коснемся его в следующем параграфе) - это планирование получения и использования дополнительной информации о состоянии природы, которую можно добыть путем эксперимента. Исследования показывают, что в типичных случаях, когда речь идет о получении сколько-нибудь значительного количества дополнительной информации, критерии, не пользующиеся вероятностями состояний (Вальда и др.), становятся практически равносильными критерию, основанному на вероятностях состояний. Но мы знаем, что при пользовании таким критерием применение смешанных стратегий не имеет смысла; стало быть, если мы можем получить сколько-нибудь много дополнительной информации, применение смешанных стратегий теряет смысл (каким бы из критериев выбора решения мы ни пользовались). Если же мы не можем, производя эксперименты, добывать новую информацию, то различные критерии могут давать противоречащие друг другу рекомендации, как мы видели в примере 3.