Задача 3. Принятие решений в условиях неопределенности.
Игры с природой
Краткие теоретические сведения
Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игрок 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели, так и случайным образом выбирающий очередные «ходы» по игре. Поэтому термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально.
Матрица игры с природой А=||аij||, где аij – выигрыш (потеря) игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 (i=1, …, m; j=1,…,n).
Мажорирование стратегий в игре с природой имеет определенную специфику: исключать из рассмотрения можно лишь доминируемые стратегии игрока 1: если для всех g=1,…, n akj alj, k, l=1,…,m, то k-ю стратегию принимающего решения игрока 1 можно не рассматривать и вычеркнуть из матрицы игры. Столбцы, отвечающие стратегиям природы, вычеркивать из матрицы игры (исключать из рассмотрения) недопустимо, поскольку природа не стремится к выигрышу в игре с человеком, для нее нет целенаправленно выигрышных или проигрышных стратегий, она действует неосознанно.
Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий: А1,А2, …, Аm, а у природы имеется n возможных состояний (стратегий): П1, П2,..., Пn, тогда условия игры с природой задаются матрицей.
А выигрышей (потерь) игрока 1:
Возможен и другой способ задания матрицы игры с природой: не в виде матрицы выигрышей (потерь), а в виде так называемой матрицы рисков R=||rij||m,n. Величина риска – это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей (потерь) А.
Риск – это разность между результатом, который игрок мог бы получить, если бы он знал действительное состоянием среды, и результатом, который игрок получит при j-й стратегии.
Зная состояние природы (стратегию) Пj, игрок выбирает ту стратегию, при которой его выигрыш максимальный или потеря минимальна, т.е.
rij=j–aij, где j=max aij, при заданном j; 1im, если аij – выигрыш.
rij=aij–j, где j=min aij, при заданном j; 1im, если аij – потери (затраты).
Неопределенность, связанную с полным отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной».
В таких случаях для определения наилучших решений используются следующие критерии: Вальда, Сэвиджа, Гурвица.
Критерий Вальда. С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник.
Если в исходной матрице по условию задачи результат aij представляет выигрыш лица, принимающего решение, то выбирается решение, для которого достигается значение W=max min aij, 1im, 1jn – максиминный критерий.
Если в исходной матрице по условию задачи результат aij представляет потери лица, принимающего решение, то выбирается решение, для которого достигается значение W=min max aij, 1im, 1jn – минимаксный критерий.
В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай.
Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А, а матрицей рисков R:
S=min max rij 1im, 1jn.
Применение критерия Сэвиджа позволяет любыми путями избежать большого риска при выборе стратегии, а значит избежать большего проигрыша (потерь).
Критерий пессимизма-оптимизма Гурвица. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом.
Критерий основан на следующих двух предположениях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1 р) и в самом выгодном состоянии с вероятностью р, где р – коэффициент пессимизма.
Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением:
HA=maxp max aij+(1-p) min aij, 1im, 1jn, если aij – выигрыш.
HA=minp min aij+(1-p) max aij, 1im, 1jn, если aij – потери (затраты).
При p=0 критерий Гурвица совпадает с критерием Вальда. При p=1 приходим к решающему правилу вида max max aij, к так называемой стратегии «здорового оптимизма», критерий максимакса.
Применительно к матрице рисков R критерий пессимизма-оптимиз¬ма Гурвица имеет вид
HR=minp max rij+(1-p) min rij, 1im, 1jn.
При р=0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (min rij); при р=1 – по критерию минимаксного риска Сэвиджа.
Значение р от 0 до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или оптимизму. При отсутствии ярко выраженной склонности р=0,5 представляет наиболее разумный вариант.
В случае, когда по принятому критерию рекомендуются к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию. Здесь нет стандартного подхода. Выбор может зависеть от склонности к риску игрока 1.
ИДИВИДУАЛЬНОЕ ЗАДАНИЕ
Решите задачу согласно вашему индивидуальному варианту.
Вариант 0
Найти наилучшие стратегии по критериям Вальда, Сэвиджа (коэффициент пессимизма равен 0,2), Гурвица применительно к матрице рисков (коэффициент пессимизма равен 0,4) для следующей платежной матрицы игры с природой (элементы матрицы – выигрыши):
Вариант 1
Дана матрица игры с природой в условиях полной неопределенности (элементы матрицы – выигрыши):
Требуется проанализировать оптимальные стратегии игрока, используя критерии пессимизма-оптимизма Гурвица применительно к платежной матрице А и матрице рисков R при коэффициенте пессимизма р=0; 0,5; 1. При этом выделить критерии максимакса Вальда и Сэвиджа.
Вариант 2
Дана следующая матрица выигрышей:
Определите оптимальную стратегию, используя критерии Вальда, Сэвиджа и Гурвица (коэффициент пессимизма равен 0,4).
Вариант 3
Один из пяти станков должен быть выбран для изготовления партии изделий, размер которой Q может принимать три значения: 150, 200, 350. Производственные затраты Сi для I станка задаются следующей формулой:
Ci=Pi+ciQ.
Данные Pi и ci приведены в табл. 4.2.
Таблица 4.2
Решите задачу для каждого из следующих критериев Вальда, Сэвиджа, Гурвица (критерий пессимизма равен 0,6). Полученные решения сравните.
Вариант 4
При выборе стратегии Aj по каждому возможному состоянию природы Si соответствует один результат Vij. Элементы Vij, являющиеся мерой потерь при принятии решения, приведены в табл. 4.3.
Таблица 4.3
Выберите оптимальное решение в соответствии с критериями Вальда, Сэвиджа, Гурвица (при коэффициенте пессимизма, равном 0,5).
Вариант 5
Намечается крупномасштабное производство легковых автомобилей. Имеются четыре варианта проекта автомобиля Rj. Определена экономическая эффективность Vji каждого проекта в зависимости от рентабельности производства. По истечении трех сроков Si рассматриваются как некоторые состояния среды (природы). Значения экономической эффективности для различных проектов и состояний природы приведены в следующей табл. 4.4.
Таблица 4.4
Требуется выбрать лучший проект легкового автомобиля для производства, используя критерий Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,1. Сравнить решения и сделать выводы.
Вариант 6
Определите тип электростанции, которую необходимо построить для удовлетворения энергетических потребностей комплекса крупных промышленных предприятий. Множество возможных стратегий в задаче включает следующие параметры:
R1 – сооружается гидростанция;
R2 – сооружается теплостанция;
R3 – сооружается атомная станция.
Экономическая эффективность сооружения электростанции зависит от влияния случайных факторов, образующих множество состояний природы Si.
Результаты расчета экономической эффективности приведены в следующей табл. 4.5.
Таблица 4.5
Вариант 7
Фирма рассматривает вопрос о строительстве станции технического обслуживания (СТО) автомобилей. Составлена смета расходов на строительство станции с различным количеством обслуживаемых автомобилей, а также рассчитан ожидаемый доход в зависимости от удовлетворения прогнозируемого спроса на предлагаемые услуги СТО (прогнозируемое количество обслуженных автомобилей в действительности). В зависимости от принятого решения – проектного количества обслуживаемых автомобилей в сутки (проект СТО) Rj и величины прогнозируемого спроса на услуги СТО – построена табл. 4.6 ежегодных финансовых результатов (доход д.е.):
Таблица 4.6
Определите наилучший проект СТО с использованием критериев Вальда, Сэвиджа, Гурвица при коэффициенте пессимизма 0,5.
Вариант 8
Магазин может завести один из трех типов товара Аi; их реализация и прибыль магазина зависят от типа товара и состояния спроса. Предполагается, что спрос может иметь три состояния Вi (табл. 4.7). Гарантированная прибыль представлена в матрице прибыли.
Таблица 4.7
Определить, какой товар закупать магазину.
Вариант 9
Дана следующая матрица выигрышей:.
Определите оптимальную стратегию, используя критерии Вальда, Сэвиджа и Гурвица (коэффициент пессимизма равен 0,6).