§2. Производные критерии. Принятие решений в условиях риска и неопределенности. Обобщенный минимаксный критерий и метод

Этот критерий опирается одновременно на ММ-критерий и критерий Баеса-Лапласа. С помощью параметра n выражается степень доверия к используемому распределений вероятностей. Если доверие велико, то доминирует критерий Баеса-Лапласа, в противном случае  ММ-критерий, т.е. мы ищем

E ir = {n + (1-n) e ir }, 0 £ n £ 1.

Правило выбора, соответствующее критерию Ходжа-Лемана формируется следующим образом:

матрица решений дополняется столбцом, составленным из средних взвешенных (с весом n º const) математическое ожиданиями и наименьшего результата каждой строки (*). Отбираются те варианты решений в строках которого стоит набольшее значение этого столбца.

При n = 1 критерий Ходжа-Лемана переходит в критерий Байеса-Лапласа, а при n = 0 становится минимаксным.

Выбор n субъективен т. к. Степень достоверности какой-либо функции распределения  дело тёмное.

Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:

F j неизвестны, но некоторые предположения о распределении вероятностей возможны;

2) принятое решение теоретически допускает бесконечно много реализаций;

3) при малых числах реализации допускается некоторый риск.

О. Критерий Гермейера.

Этот критерий ориентирован на величину потерь, т.е. на отрицательные значения всех e ij . При этом

e ir = e ij q j .

Т.к. в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие e ij <0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij - a при подходящем образом подобранном a > 0. При этом оптимальный вариант решения зависит от а .

Правило выбора согласно критерию Гермейера формулируется следующим образом:

матрица решений дополняется ещё одним столбцом содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния F j . Выбираются те варианты в строках которых находится наибольшее значение e ij этого столбца.

В каком-то смысле критерий Гермейера обобщает ММ-критерий: в случае равномерного распределения q j = , j = , они становятся идентичными.

Условия его применимости таковы:

1) вероятности появления состояния F j неизвестны;

2) с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться;

3) допускается некоторый риск;

4) решение может реализоваться один или несколько раз.

Если функция распределения известна не очень надёжно, а числа реализации малы, то, следуя критерию Гермейера, получают, вообще говоря, неоправданно большой риск.

О. BL (MM) - критерий.

Стремление получить критерии, которые бы лучше приспосабливались к имеющейся ситуации, чем все до сих пор рассмотренные, привело к построению так называемых составных критериев. В качестве примера рассмотрим критерий, полученный путем объединения критериев Байеса-Лапласа и минимакса.

Правило выбора для этого критерия формулируется следующим образом:

матрица решений дополняется еще тремя столбцами. В первом из них записываются математические ожидания каждой из строк, во втором - разность между опорным значением

и наименьшим значением

соответствующей строки. В третьем столбце помещаются разности между наибольшим значением

каждой строки и наибольшим значением той строки, в которой находится значение . Выбираются те варианты, строки которых (при соблюдении приводимых ниже соотношений между элементами второго и третьего столбцов) дают наибольшее математическое ожидание. А именно, соответствующее значение

из второго столбца должно быть или равно некоторому заранее заданному уровню риска . Значение же из третьего столбца должно быть больше значения из второго столбца.

Применение этого критерия обусловлено следующими признаками ситуации, в которой принимается решение:

1) вероятности появления состояний F j неизвестны, однако имеется некоторая априорная информация в пользу какого-либо определенного распределения;

3) допускается ограниченный риск;

4) принятое решение реализуется один раз или многократно.

BL(MM)-критерий хорошо приспособлен для построения практических решений прежде всего в области техники и может считаться достаточно надежным. Однако заданные границы риска и, соответственно, оценок риска не учитывает ни число применения решения, ни иную подобную информацию. Влияние субъективного фактора хотя и ослаблено, но не исключено полностью.

существенно в тех случаях, когда решение реализуется только один или малое число раз. В этих условиях недостаточно ориентироваться на риск, связанный только с невыгодными внешними состояниями и средними значениями. Из-за этого, правда, можно понести некоторые потери в удачных внешних состояниях. При большом числе реализаций это условие перестает быть таким уж важным. Оно даже допускает разумные альтернативы. При этом не известно, однако, четких количественных указаний, в каких случаях это условие следовало бы опускать.

О. Критерий произведений.

Правило выбора в этом случае формулируется так:

Матрица решений дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты, в строках которых находятся наибольшие значения этого столбца.

Применение этого критерия обусловлено следующими обстоятельствами:

1) вероятности появления состояния F j неизвестны;

2) с появлением каждого из состояний F j по отдельности необходимо считаться;

3) критерий применим и при малом числе реализаций решения;

4) некоторый риск допускается.

Критерий произведений приспособлен в первую очередь для случаев, когда все e ij положительны. Если условие положительности нарушается, то следует выполнять некоторый сдвиг e ij + а с некоторой константой а  ï e ij ï. Результат при этом будет, естественно зависеть от а. На практике чаще всего

а:= ï e ij ï+1.

Если же никакая константа не может быть признана имеющей смысл, то критерий произведений не применим.

5 о. Пример.

Рассмотрим тот же пример (табл. 1).

Построение оптимального решения для матрицы решений о проверках по критерию Гурвица имеет вид (при С =0.5, в 10 3):

С e ij (1-С) e ij e ir e ir
-20.0 -22.0 -25.0 -12.5 -10.0 -22.5
-14.0 -23.0 -31.0 -15.5 -7.0 -22.5
-24.0 -40.0 -20.0 -20.0 -20.0

В данном примере у решения имеется поворотная точка относительно весового множителя С : до С = 0.57 в качестве оптимального выбирается Е 3 , а при больших значенияхЕ 1 .

Применение критерия Ходжа-Лемана (q = 0.33, n = 0.5, в 10 3) :

e ij n (1-n) e ij e ir e ir
-22.33 -25.0 -11.17 -12.5 -23.67 -23.67
-22.67 -31.0 -11.34 -15.5 -26.84
-21.33 -40.0 -10.67 -20.0 -30.76

Критерий Ходжа-Лемана рекомендует вариант Е 1 (полная проверка)  так же как и ММ-критерий. Смена рекомендуемого варианта происходит только при n = 0.94. Поэтому равномерное распределение состояний рассматриваемой машины должно распознаваться с очень высокой вероятностью, чтобы его можно было выбрать по большему математическому ожиданию. При этом число реализаций решения всегда остаётся произвольным.

Критерий Гермейера при q j = 0.33 даёт следующий результат (в ):

e ir = e ij q j e ir
-20.0 -22.0 -25.0 -6.67 -7.33 -8.33 -8.33 -8.33
-14.0 -23.0 -31.0 -4.67 -7.67 -10.33 -10.33
-24.0 -40.0 -8.0 -13.33 -13.33

В качестве оптимального выбирается вариант Е 1 . Сравнение вариантов с помощью величин e ir показывает, что способ действия критерия Гермейера является даже более гибким, чем у ММ-критерия.

В таблице, приведенной ниже, решение выбирается в соответствии с BL(MM)-критерием при q 1 =q 2 =q 3 = 1 / 2 (данные в 10 3).

-20.0 -22.0 -25.0 -23.33 -20.0
-14.0 -23.0 -31.0 -22.67 +6.0 -14.0 +6.0
-24.0 -40.0 -21.33 +15.0 +20.0

Вариант Е 3 (отказ от проверки) принимается этим критерием только тогда, когда риск приближается к . В противном случае оптимальным оказывается Е 1 . Во многих технических и хозяйственных задачах допустимый риск бывает намного ниже, составляя обычно только незначительный процент от общих затрат. В подобных случаях бывает особенно ценно, если неточное значение распределения вероятностей сказывается не очень сильно. Если при этом оказывается невозможным установить допустимый риск заранее, не зависимо от принимаемого решения, то помочь может вычисление ожидаемого риска . Тогда становится возможным подумать, оправдан ли подобный риск. Такое исследование обычно дается легче.

Результаты применения критерия произведения при а = 41×10 3 и а = 200×10 3 имеют вид:

e ir = e ij e ir
+21 +19 +16
а =41 +27 +18 +10
+41 +17 +1
+180 +178 +175
а =200 +186 +177 +169
+200 +176 +160

Условие e ij > 0 для данной матрицы не выполнимо. Поэтому к элементам матрицы добавляется (по внешнему произволу) сначала а = 41×10 3 , а затем а = 200×10 3 .

Для а = 41×10 3 оптимальным оказывается вариант Е 1 , а для а = 200×10 3  вариант Е 3 , так что зависимость оптимального варианта от а очевидна.

Часть 2. Теория игр.

КЛАССИФИКАЦИЯ ИГР.

Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.

В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения. Чем больше игроков - тем больше проблем.

По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной . Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий игра называется бесконечной .

По характеру взаимодействия игры делятся на:

1) бескоалиционные : игроки не имеют права вступать в соглашения, образовывать коалиции;

2) коалиционные (кооперативные)  могут вступать в коалиции.

В кооперативных играх коалиции наперёд определены.

По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой .

По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, типа дуэлей и др.

Матричная игра  это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец  номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).

Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.

Биматричная игра  это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец  стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице  выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.

Если функция выигрышей является выпуклой, то такая игра называется выпуклой . Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.

ГЛАВА 1. МАТРИЧНЫЕ ИГРЫ.

Критерий Ходжа-Лемана.

Обозначается – HL-критерий. Представляет собой взвешенную сумму критериев Байеса-Лапласа и МиниМаксного.

где v – весовой коэффициент,
и отражает степень доверия к используемому распределению вероятностей.

Если v=0 - критерий HL совпадает с ММ-критерием;

Если v=1 – критерий HL совпадает с критерием Байеса-Лапласа.

Данный критерий применяется:

Вероятность появления событий F j – неизвестны, но можно сделать некоторые предположения.

Принятие решений теоретически реализуется и при малых числах реализации допускается некоторый риск.

Критерий Гурвица

Обозначается – HW-критерий.

В этом критерии оценочная функция представляет собой средневзвешенное между точками зрения крайнего оптимизма и крайнего пессимизма.

где с – весовой коэффициент. Обычно с=0,5. Тогда получаем среднее взвешенное.

Правило выбора согласно критерию Гурвица, формируется следующим образом:

матрица решений
дополняется столбцом, содержащим среднее взвешенное наименьшего и наибольшего результатов для каждой строки. Выбираются только те варианты, в строках которых стоят наибольшие элементы
e ij этого столбца.

Если с=1 – критерий азартного игрока;

Если с=0 – критерий минимаксов.

Применяется этот критерий:

    о вероятности наступления событий ничего не известно;

    решение принимается малое число раз и допускается некоторый риск.

С – показывает степень допустимого риска.

Составной критерий Байеса-Лапласа и МиниМаксного критериев BL (MM )

Данный критерий позволяет управлять величиной допустимого риска и более того, позволяет выбрать решение, в котором риск будет оправдан.

Идея этого критерия: вначале находится решение по МиниМаксному критерию и это решение используют в качестве опорного. После этого выбирают уровень допустимого риска, т.е. величину на которую возможный выигрыш может быть меньше, чем в опорном решении (в худшем случае). Из дальнейшего рассмотрения исключаются все решения, у которых величина риска превышает допустимый. Обозначим i 0 – номер опорного решения.

- величина допустимого риска.

В результате получаем множество решений. Это дает возможность выбрать среди них решения, в которых риск оправдан, т.е такие решения, дополнительный выигрыш которых в лучшем случае по сравнению с базовым вариантом превышает возможный проигрыш в худшем случае.

Пример: пусть некую технологическую установку требуется подвергнуть проверке с приостановкой ее работы. К текущему моменту времени установка может находиться в одном из трех состояний:

F 1 – неисправностей нет и установка может продолжать работу;

F 2 – требуется незначительный ремонт отдельных деталей;

F 3 – дальнейшая эксплуатация установки возможно только после капитального ремонта.

Возможные решения:

E 1 – осуществить полную проверку оборудования с привлечением специалистов со стороны;

E 2 – провести осмотр и возможный ремонт своими силами;

E 3 – отказаться от проверки и не приостанавливать выпуск продукции.

Исходя из опыта, предприятие построило следующую матрицу, приняв во внимание основной критерий – затраты на проверку и ремонт.

По МиниМаксному критерию следует выбрать решение Е 1 , т.е. осуществить полную проверку оборудования с привлечением специалистов со стороны.

=-20, т.е. решение Е 1 .

Критерий Сэвижда.

Строим матрицу сожалений:

По критерию Сэвиджа – решение Е 1 .

Критерий Байеса-Лапласа.

Предположим, что все состояния равновероятны – 1/3.

По критерию Байеса-Лапласа предпочтительнее решение Е 3 .

Критерий Гурвица. с=0,5

Принятие решений в многоцелевых задачах

Отличительной особенностью многоцелевых задач является отсутствие одного оптимального решения.

Рассматриваются целое множество решений, которое называется множество Паретто оптимальных решений или множеством компромиссных решений.

Причем любое решение из этого множества может быть оптимальным. Без привлечения дополнительной информации об отношении предпочтения лица, принимающего решение (ЛПР), решить задачу невозможно.

Все методы делятся в зависимости от того, какая информация используется.

Все методы можно разделить на 2 класса:

    методы, основанные на построении отношения предпочтения более сильного, чем отношение Паретто.

    Методы, основанные на построении агрегированного критерия.

Предпочтительное большинство методов используют информацию об относительной важности критериев.

Отношение Паретто – это отношение превосходства, которое определяется следующим образом: решение считается эффективным, если не существует другого решения, не уступающему ему по всем параметрам и превосходит хотя бы по одному.

Таким образом, это бинарное отношение позволяет сравнивать и в результате получать множество оптимальных решений:

Методы выбора наилучшего решения.

    Метод выделения главного критерия.

Один из критериев называется главным, на остальные накладываются ограничения. Наилучшем решением будет решение оптимизирующие (максимизирующее, минимизирующее) главный критерий с учетом ограничений на остальные критерии.

    Метод последовательных уступок

Упорядочивание критериев по убыванию важности и решение выбирается по следующему алгоритму: выбирается один по важности критерий и среди текущего множества решений выбирается наилучший по данному критерию, затем назначается некоторая уступка и текущее множество решений сужается до решений, у которых оценка по текущему критерию уже наилучшего варианта не более, чем уступки. После этого, переходят к следующему по важности критерию.

    Метод составного критерия

Информация об относительной важности критериев отображается в виде набора весовых коэффициентов.

Проблемы данного метода: 1) выбора весовых коэффициентов. Применяется метод анализа иерархии (метод Саати); 2) критерии должны быть приведены к одной шкале или масштабу; 3) недостатки по одному критерию можно компенсировать преимуществом по другим критериям: наложением ограничений на все критерии.

    Нормативные методы

Сводятся к построению множества нормативов по каждому критерию и некоторой метрики, которая показывает степень отклонения решений от нормативов. Наилучшее решение имеет минимальное отклонение от нормативов:

    Методы логического объединения критериев.

Все критерии преобразуются таким образом, что они могут принимать логические значения (истина, ложь). Истина означает, что i-я цель достигнута, а ложь – цель не достигнута. Обобщенный критерий записывается в виде логической функции и решение считается эффективным, если функция принимает значение «истина». Методы нечеткой логики позволяют выразить степень достижения цели по каждому критерию и обобщенный критерий с очень высокой точностью.

    Метод ELEKTRE

Определение отношения Паретто: веса критериев. Все множество критериев разбивается на три подмножества:

- подмножество критериев, по которому вариант x>y.

И считается, что вариант x превосходит y, если значение этой функции некоторому пороговому значению. Кроме того, обходятся дополнительные специальные условия, ограничивающие возможность сравнения вариантов.

Вводится еще одна функция, которая называется индексом несогласия.

Пример:

    Сформировать множество Паретто;

γ 1 =1; γ 2 =1; γ 3 =1; γ 4 =1.

    Должно быть ≥ 1

    Метод порядковой оптимизации.

Используется информация об относительной важности критериев. Данный метод основан на определении упорядоченности критериев по важности; нахождении порядковых отношений, которые удовлетворяют этому упорядочиванию; построении полинома по этим порядковым отношениям.

Пример: В роли ЛПР выступает покупатель автомобиля. ЛПР сформировал для себя 5 критериев:

    Комфортность;

    Престижность марки;

    Скоростные качества;

    Внешний вид авто.

Критерии 1 и 2 имеют одинаковую важность, также как и критерии 3, 4 и 5. Критерии 1 или 2 важнее критериев 3, 4 и 5. Понятие «быть лучше» для покупателя означает превосходить по первым двум критериям и по любой паре из оставшихся. Инициирующий полином в данном случае выглядит следующим образом:

Если возьмем следующее упорядочивание критериев - схема важности критериев – то на основании этого:.

Проблемы: 1) сам процесс получения информации об относительной важности критериев трудоемкий; 2) ЛПР может давать противоречивую информацию о сравнительной важности критериев; 3) оценки по критериям должны быть предоставлены в строгих шкалах.

Метод эффективен, если количество критериев небольшое. Применение данного метода не зависит от количества сравниваемых вариантов. Не требуется, чтобы критерии были одной природы и выражены в одних единицах.

    Метод Подиновского

Основан на построении более сильного отношения, чем отношение Паретто. Информация об относительной важности критериев не преобразуется в числовую форму. От ЛПР получается информация о том, что некоторая группа критериев важнее или равноценно другой группе критериев. Позволяет сузить множество вариантов. Далее информация используется для упорядочивания векторов оценок решений, поле чего из нового множества векторов выбирается не доминируемое по Паретто.

Ограничения применения метода: критерии должны быть однородны.

Критерий Ходжа-Лемана привносит фактор определенной субъективности при принятии решения.

Решение принимается в условиях риска. Однако у ЛПР есть некое недоверие к распределению вероятностей состояний окружающей среды.

Поэтому ЛПР вводит некий "коэффициент доверия" l к вероятностям состояний окружающей среды (0 £ l £ 1). Чтобы сильно не рисковать, обычно таким коэффициентом берут 0,4. Этот коэффициент ещё называют уровнем оптимизма.

Показатель эффективности стратегии Аi по критерию Ходжа-Лемана находится по формуле:

#Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще тремя столбцами. В первый нужно внести значения математических ожиданий всех стратегий, умноженных на уровень оптимизма l = 0,4. Во второй нужно внести значения наименьших элементов всех строк, умноженных на уровень пессимизма 1 – l = 1 – 0,4 = 0,6 . В третий добавленный столбец внесем сумму значений первых двух добавленных столбцов:

Пример вычислений для первой строки:

0,4  (0,33 + 0,27 + 0,153 + 0,115 + 0,256) = 0,4  5,75 = 2,3

= 0,6  3 = 1,8

В нашем случае наибольший элемент 4,78 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор для вложения должен выбрать третий проект.

Ответ А3 .

Экспертные оценки минимаксного метода и методов Байеса - Лапласа и Сэвиджа

Приведенные в подпараграфе 2.8.1 простейшие критерии и стратегии принятия решений (2.8.1) (2.8.5) имеют ясное и логическое объяснение мотивов, которыми руководствуются лица, принимающие решения. Далее можно перейти к рассмотрению обобщенных классических критериев принятия решений. К ним относятся минимаксный критерий, критерий Байеса - Лапласа, критерий Сэвиджа, а также другие обобщения.

Минимаксный критерий и метод

Минимаксный критерий использует оценочную функцию (2.8.1, а), соответствующую пессимистической позиции, формализуемой соотношением

Справедливо соотношение

причем Zn„„ в (2.8.8) - оценочная функция минимаксного критерия.

Правило выбора решения в соответствии с минимаксным критерием интерпретируется следующим образом. Матрица решений {ву} дополняется еще одним столбцом из наименьших результатов еГ каждой строки. При принятии решения следует выбрать такие варианты Ею, строки которых соответствуют наибольшим значениям ег этого столбца. Выбранные таким образом варианты полностью исключают риск, поскольку лицо, принимающее решение, ориентировано на пессимистическую позицию, что не позволяет получить худший результат. Вне зависимости от условий Fj результат выбора не может оказаться ниже 2.тт. Минимаксный критерий относится к числу фундаментальных, поскольку используется весьма часто. Применение минимаксного критерия оправдано в следующих ситуациях:

  • 1) о возможности появления внешних состояний (условий) Б] ничего неизвестно (например, неизвестны вероятности появления состояний Р])щ,
  • 2) приходится считаться с появлением различных внешних состояний Рр
  • 3) решение реализуется только один раз;
  • 4) необходимо исключить всякий риск (недопустимо получение результата ниже значения 2,„,„).

Критерий и метод Байеса - Лапласа

Для построения оценочной функции данного критерия используется априорная информация о вероятностях ц} появления внешних условий Ру Тем самым данная вероятностная модель учитывает каждое из возможных последствий. Пусть - вероятность появления внешнего состояния (условия) Ру Тогда критерий Байеса - Лапласа

соответствует множеству

Фактически в данном критерии в качестве оценочной функции выбирается математическое ожидание оценки, соответствующей у"-му варианту, причем усреднение происходит по множеству условий Г^.

Правило принятия решении (2.8.11)-(2.8.13) имеет вероятностную интерпретацию. При этом ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

  • - вероятности появления состояний (условий) известны и не зависят от времени;
  • - решение реализуется (теоретически) бесконечно много раз;
  • - для малого числа реализаций решения допускается некоторый риск.

Позиция лица, принимающего решения на основе критерия Байеса - Лапласа, является более оптимистичной, чем по минимаксному критерию.

Критерий и метод Сэвиджа

Этот критерий основывается на предварительном преобразовании матрицы системных оценок в соответствии с соотношениями

Оценочная функция имеет вид

Множество оптимальных вариантов решения определяется соотношением

Смысл критерия (2.8.16) становится ясным после анализа соотношений (2.8.14)-(2.8.17).

Величины а =(тахе, еЛ, вычисляемые в соответствии

(2.8.14), можно трактовать как максимальный дополнительный выигрыш, который достигается, если В состояний Fj вместо варианта £", выбрать другой, оптимальный для этого внешнего состояния. Величины ay =(тахву е^) можно также интерпретировать и как потери (штрафы), возникающие в состоянии Fj при замене оптимального для него варианта

Тогда величина eir определенная равенством (2.8.12), представляет собой - при интерпретации йу как потерь - максимально возможные (по всем внешним состояниям Fj) потери в случае выбора варианта Ej. Согласно соотношениям (2.8.15), (2.8.17) максимально возможные потери минимизируются за счет выбора £;.

С точки зрения матрицы {еф критерий Сэвиджа связан с риском, однако с позиции матрицы {ау) он от риска свободен, поскольку использует стратегию минимаксного критерия.

Обобщенный минимаксный критерий и метод

Этот критерий использует расширение доли вероятностно заданной неопределенности. Предположим, что для каждого из возможных внешних состояний Fj определена вероятность его появления

Введем вероятность Р, применения г"-го варианта решения и будем предполагать возможность реализации т вариантов решения. Тогда среднее значение

где Р= (/>„ ...,/>,„), д = (

В реальной ситуации вектор ц неизвестен. В этом случае, ориентируясь на наименее выгодное распределение ц состояний Fj, можно добиться максимального увеличения е(Р, д) за счет выбора наиболее удачного распределения Р вариантов решения £;. Подобная стратегия соответствует расширенному минимаксному критерию, причем в данной ситуации реализуется игровая стратегия: состояния Fj минимизируют критерий, а варианты Е, его максимизируют. Общая формулировка данного расширенного минимального критерия имеет вид

где векторы Рид определены в (2.8.18).

Таким образом, цель расширенного минимаксного критерия - нахождение наилучшего распределения вероятностей на множестве вариантов Е, когда в многократно использовавшейся ситуации ничего не известно о вероятностных состояниях ^, относительно которых предполагается "невыгодное" распределение.

Производные критерии, оценки и принятие решений

Данный класс критериев позволяет рассматривать задачи принятия решения с обобщенных позиций, причем обобщение предполагает более полный учет априорно известных факторов, а также введение новых функциональных элементов.

Следует иметь в виду, что для интерпретации критериев можно воспользоваться идеями подпараграфа 2.8.1. В соответствии с подпараграфом 2.8.1 целесообразно свести рассмотренные производные (обобщенные) критерии в табл. 2.8.

Критерий Гурвица

Оценочная функция критерия Гурвица находится между точками предельного оптимума (С = 0) и крайнего пессимизма (С = 1). Характерно, что при С = 1 критерий Гурвица превращается в минимаксный критерий (см. подпараграф 2.8.1).

Критерий Ходжа - Лемана

Критерий основан на минимаксном критерии и критерии Байеса - Лапласа, характеризуется тем, что с помощью параметра в выражает степень доверия к используемому распределению вероятностей. При V = 1 критерий переходит в критерий Байеса - Лапласа, а при V = 0 - в минимаксный критерий. Ситуация, в которой рекомендовано применение этого критерия, характеризуется следующими условиями: вероятности появления состояний Е] неизвестны, но некоторые предположения о распределениях вероятностей возможны; принятое решение теоретически допускает бесконечно много реализаций: при малых числах реализации допускается некоторый риск.

Критерий Ю. Б. Гермейера

Данный критерий ориентирован на оценочные функции, отражающие величину потерь, т.е. на отрицательные значения всех е-у матрицы оценок, применяется в хозяйственных задачах и ориентирован на цены и затраты. Смысл остальных параметров: <77 - вероятность условия Еу а ег - минимум математического ожидания затрат. В критерии Ю. Б. Гермейера допускается некоторый риск при принятии решения, а также должны быть известны вероятности Цр

Таблица 2.8.

Минимаксный критерий и метод Байеса - Лапласа

Метод позволяет лучше адаптироваться к ситуации за счет введения составных частей, логически унаследованных от других критериев (см. табл. 2.8). На первом этапе формирования критерия фиксируется опорное значение 2тт, задаваемое минимаксным критерием. Затем задается допустимый риск 5д0|| >0 и определяется множество согласия Величины £,-=£^0- ште^ё 1 характеризуют наиболее возможные потери в сравнении с е^. После этого формируется выигрышное множество /2. Множеству /] п ¡2 принадлежат варианты решений, для которых в определенных состояниях могут иметь потери по сравнению с состоянием, задаваемым минимаксным критерием, однако в других состояниях имеется, по меньшей мере, прирост выигрыша.

Таким образом, рассмотренные методы позволяют расширить классы методов, используемых для принятия решений в условиях неполной статистически заданной неопределенности на основе обработки таблиц экспертных оценок.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.сайт/

Принятие решений в условиях риска и неопределенности

З.У. Блягоз, А.Ю. Попова

Важнейшей составляющей частью любого вида человеческой деятельности является принятие решений в условиях вероятностной неопределенности. Сложность выбора того или иного решения зависит от степени определенности возможных исходов или последствий. Существуют ситуации, в которых можно более или менее точно оценить вероятность наступления исходов для каждого решения. В этих случаях говорят о принятии решений в условиях риска. Но гораздо чаще невозможно даже приблизительно указать вероятность того или иного результата, что связано с недостаточной информированностью о внешних обстоятельствах, в которых приходится принимать решение. Эта неопределенность порождается множеством различных факторов, таких как экономическая ситуация в стране, уровень инфляции, курсы валют, рыночная конъюнктура, политические отношения, состояние погоды, стихийные обстоятельства и т.п. В этом случае речь идет о принятие решений в условиях вероятностной неопределенности.

Математическая модель ситуации, в которой принятие решений зависит от объективных обстоятельств, называется игрой с природой.

Подобные модели изучает такой раздел математики как «Теория игр с природой» («Теория принятия решений»). Она служит для выработки рекомендаций по рациональному образу действий в условиях риска и неопределенности, вызванной не зависящими от нас причинами.

Игру с природой можно определить как парную игру, в которой сознательный игрок А, заинтересованный в наиболее выгодном для него исходе игры, выступает против участника, совершенно безразличного к результату природа П.

Очевидно, что при решении игр с природой достаточно найти наилучшие рекомендации только для игрока А, потому как природа в рекомендациях не нуждается, развиваясь в соответствии с определенными законами независимо от того, удобно это человеку или нет.

Пусть игрок А располагает m возможными стратегиями, которые обозначим A 1 , A 2 ,…, A m , тогда как природа П может принимать одно из n своих состояний П 1 , П 2 ,…, П n . .

Предполагается обычно, что игрок А в состоянии оценить результаты выбора им каждой из своих стратегий А i , i=1,…,m, при каждом состоянии природы П j , j=1,…,n, количественно выражающиеся действительными числами а ij . Эти числа называются выигрышами игрока А.

В таком случае игра может быть задана матрицей Р = mn, называемой платежной матрицей (или матрицей игры).

Если в платежной матрице элементы k-ой строки не меньше соответствующих элементов s-ой строки, т.е. , то доминируемую (дублируемую) строку s можно удалить, т.к. она определяет стратегию, заведомо не лучшую стратегии. Это позволяет значительно упростить платежную матрицу игры. Отбрасывать же те или иные состояния природы нельзя, поскольку она может реализовать любое свое состояние независимо от того, выгодно оно игроку А или нет.

После упрощения платежной матрицы иногда выгодно перейти от нее к матрице рисков, которая позволит более четко выявить преимущество одной стратегии по сравнению с другой при данном состоянии природы.

Риском r ij игрока А, когда он пользуется чистой стратегией A i при состоянии П j природы, называется разность между максимальным выигрышем, который он мог бы получить, достоверно зная, что природой будет реализовано именно состояние Пj, и тем выигрышем aij, который он получит, используя стратегию A i , не зная, какое из состояний Пj природа реализует.

Таким образом, элементы rij матрицы рисков определяются по формуле:

где - максимально возможный выигрыш игрока А при состоянии Пj (максимальный элемент j-го столбца платежной матрицы).

Учитывая специфику игр с природой, при поиске оптимальных решений обращаются к различным критериям, дающим некоторою логическую схему принятия решения.

В условиях риска, т.е. когда известны вероятности qj состояний природы, можно использовать критерии Байеса, Лапласа, Ходжа-Лемана. При принятии решений в условиях неопределенности критерии Вальда, Сэвиджа, Гурвица и произведений.

вероятностный неопределенность решение математический

Критерий Байеса

Этот критерий используется в предположении, что вероятности q j состояний природы Пj известны. В качестве показателя эффективности чистой стратегии Ai используется средневзвешенный выигрыш при стратегии Аi с весами q1,…,qn, т.е. величина

Оптимальной по Байесу чистой стратегией является стратегия с максимальным показателем эффективности. Цена игры в этом случае определяется по формуле:

Аналогично можно найти оптимальную по Байесу стратегию, используя формулу

и матрицу рисков. В этом случае средний риск следует минимизировать. Однако, следует заметить, что стратегия, максимизирующая средний выигрыш, совпадает со стратегией, минимизирующей средний риск.

Критерий Лапласа

Если игрок А не располагает объективной информацией об вероятностях qj состояний природы Пj и считает в равной мере правдоподобными все состояния, то их вероятности полагают одинаковыми и равными 1/n. Этот прием называют принципом недостаточного основания Лапласа. Отсюда вытекает и критерий Лапласа, в соответствии с которым оптимальной считается чистая стратегия, обеспечивающая максимальный средний выигрыш игрока А при равенстве всех вероятностей.

В этом случае показатели эффективности каждой чистой стратегии рассчитываются по формуле:

а цена игры равна

При использовании критериев Байеса и Лапласа предполагается, что ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

Ш вероятности появления состояний Пj известны и не зависят от времени.

Ш решение реализуется (теоретически) бесконечно много раз.

Ш для малого числа реализаций решения допускается некоторый риск.

При достаточно большом количестве реализаций среднее значение постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск практически исключён.

Критерий Вальда

В случае, если вероятности состояний природы неизвестны и нет возможности получить о них какую-либо статистическую информацию, при определении оптимального решения можно использовать критерий Вальда.

Критерий Вальда является критерием крайнего пессимизма, т.к. здесь игрок А исходит из предположения, что природа П «действует» против него наихудшим образом, т.е. реализует такие состояния Пj, при которых величина его выигрыша принимает наименьшее значение.

Показатели эффективности каждой чистой стратегии рассчитываются по формуле:

Оптимальной по критерию Вальда считается та чистая стратегия, показатель эффективности которой будет максимальным, т.е. обеспечивается максимин

Критерий Вальда часто также называют максиминным критерием.

Выбранные таким образом варианты полностью исключают риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется.

Применение критерия Вальда бывает оправдано, если ситуация, в которой принимается решение, следующая:

Ш о возможности появления внешних состояний Пj ничего не известно;

Ш решение реализуется только один раз;

Ш необходимо исключить какой бы то ни было риск.

Критерий Сэвиджа

Критерий Сэвиджа, как и критерий Вальда, является критерием крайнего пессимизма, ибо и здесь игрок А исходит из предположения, что природа реализует самые неблагоприятные для него состояния. Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту чистую стратегию, при которой минимизируется величина максимального риска.

Таким образом, показатель эффективности определяется как величина максимального риска:

А цена игры равна

При использовании критерия Сэвиджа ситуация, в которой принимается решение, должна удовлетворять тем же условиям, что и при применении критерия Вальда.

Критерий Гурвица

Занять более уравновешенную позицию, которая находится где-то между точкой зрения крайнего оптимизма и крайнего пессимизма, предлагает критерий Гурвица. Его также часто называют критерием пессимизма-оптимизма.

В области чистых стратегий показатель эффективности определяется из условия:

Оптимальной по Гурвицу считается та чистая стратегия, показатель эффективности которой принимает наибольшее значение

Параметр выбирается из субъективных соображений, потому что на практике очень трудно найти количественную характеристику для тех долей оптимизма и пессимизма, которые присутствуют при принятии решения. Чаще всего полагают равным 0,5.

При критерий Гурвица превращается в критерий Вальда (крайнего пессимизма).

При - в критерий крайнего оптимизма, или критерий «азартного игрока», делающего ставку на то, что исход игры будет для него самым благоприятным:

При получается нечто среднее между точкой зрения крайнего оптимизма и крайнего пессимизма.

Критерий Гурвица применяется в случае, когда:

о вероятностях появления состояния Пj ничего не известно;

реализуется только малое количество решений;

допускается некоторый риск.

Критерий Ходжа-Лемана

Этот критерий опирается одновременно на критерий Вальда и критерий Байеса-Лапласа. С помощью параметра выражается степень доверия к используемому распределений вероятностей, а коэффициент (1-) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот. Если доверие велико, то доминирует критерий Байеса-Лапласа, в противном случае критерий Вальда, т.е. показатель эффективности чистой стратегии Аi равен:

Стратегия с максимальным показателем эффективности является оптимальной. Цена игры определяется по формуле:

При =1 критерий Ходжа-Лемана переходит в критерий Байеса-Лапласа, а при =0 становится критерием Вальда. Выбор субъективен т.к. определить степень достоверности какой-либо функции распределения довольно сложно. Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:

Ш вероятности появления состояния Пj неизвестны, но некоторые предположения о распределении вероятностей возможны;

Ш принятое решение теоретически допускает бесконечно много реализаций;

Ш при малых числах реализации допускается некоторый риск.

Критерий произведений

Критерий произведений используется в тех случаях, когда все элементы платежной матрицы положительны, т.е. . Если это условие нарушается, то можно перейти к строго положительным значениям с помощью преобразования аij+a при подходящем образом подобранном a0. Результат при этом будет, естественно, зависеть от а.

При использовании этого критерия показатель эффективности каждой чистой стратегии определяется по формуле:

Оптимальной по критерию произведений будет та чистая стратегия, показатель эффективности которой будет наибольшим.

Применение этого критерия обусловлено следующими обстоятельствами:

вероятности появления состояния Пj неизвестны;

с появлением каждого из состояний Пj по отдельности необходимо считаться;

критерий применим и при малом числе реализаций решения;

некоторый риск допускается.

Пример.

«Фото Колор» - небольшой производитель химических реактивов и оборудования, которые используются некоторыми фотостудиями при изготовлении 35-мм фильмов. Один из продуктов, который предлагает «Фото Колор» - фиксаж ВС-6. Накопленный опыт работы показывает, что спрос на этот продукт может составлять 11, 12 или 13 ящиков в неделю. От продажи каждого ящика фирма получает 350 руб. прибыли. ВС-6, как и многие фотографические реактивы, имеет очень малый срок годности. Поэтому, если ящик не продан к концу недели, его следует уничтожить. Так как каждый ящик обходится фирме в 560 рублей, она теряет эту сумму в случае, если ящик не продан к концу недели. Кроме того, если спрос на продукт будет высок, а произведено ВС-6 меньше, то фирма понесет убытки, связанные с недополученной прибылью в размере 160 руб. за ящик.

Определить еженедельный объем производства фиксажа ВС-6, обеспечивающий фирме наибольшую прибыль.

В рассматриваемой ситуации в качестве сознательного игрока А выступает фирма «Фото Колор». Ее чистыми стратегиями будут: А 1 - решение о еженедельном выпуске 11 ящиков фиксажа ВС-6, А 2 - решения о еженедельном выпуске 12 ящиков, А 3 - решение о еженедельном выпуске 13 ящиков.

В качестве второго игрока будем рассматривать совокупность всех внешних обстоятельств, в которых формируется спрос на продукт, - природу П. В данном случае природа может реализовать любое из своих состояний: П 1 - еженедельный спрос на фиксаж ВС-6 составляет 11 ящиков, П 2 - 12 ящиков, П 3 - 13 ящиков.

Выигрыши игрока А - еженедельная прибыль от продажи ВС-6 представлены в следующей таблице.

Наиболее благоприятными будут комбинации (А 1 ; П 1), (А 2 ; П 2) и (А 3 ; П 3), когда еженедельный спрос на фиксаж будет совпадать с объемом производства. В этом случае прибыль будет равна

В случае если еженедельный спрос на продукт превышает объем выпуска (ситуации (А 1 ; П 2), (А 1 ; П 3) и (А 2 ; П 3)), то прибыль будет равна соответственно

Если же объем выпуска продукции будет превышать спрос (ситуации (А 2 ; П 1), (А 3 ; П 1) и (А 3 ; П 2)), то имеем

Очевидно, что в платежной матрице нет доминирующих стратегий, поэтому упростить ее нельзя.

Прежде чем начать анализ, построим матрицу рисков, которая позволит более четко выявить преимущество одной стратегии по сравнению с другой при данном состоянии природы. Расчет производим, используя формулу (1).

Подсчитаем показатели эффективности стратегий

Ш по критерию Байеса в предположении, что вероятности продать 11, 12 или 13 ящиков в течение недели равны 0,45, 0,35 и 0,2,

Ш по критерию Лапласа в предположении, что эти вероятности в равной мере правдоподобны и равны 1/3,

Ш по критерию Ходжа-Лемана с коэффициентом доверия к вероятностям состояний природы, например,

Ш по критерию Вальда, критерию Сэвиджа, критерию произведений, критерию Гурвица с показателем (крайнего оптимизма), критерию Гурвица с показателем оптимизма, например, .

Данные результаты расчетов приведены в таблице.

Гурвица при (крайнего оптимизма)

произведений

Для расчета показателей эффективности по критерию Сэвиджа используем матрицу рисков.

Гурвица при

В данном примере у решения имеются две поворотные точки относительно весового множителя: до в качестве оптимальной выбирается стратегия А 3 , при - стратегия А 2 , а при больших значениях А 1 .

Ходжа - Лемана при

Критерий Ходжа-Лемана рекомендует стратегию А 1 (выпуск 11 ящиков) так же как и критерий Вальда. Смена рекомендуемой стратегии происходит при. Поэтому если, степень доверия игрока А к используемому распределению вероятностей достаточно высока в качестве оптимальной выбирается стратегия А 2 .

При использовании 8 критериев стратегия А 2 выбиралась в качестве оптимальной 5 раз, стратегия А 1 - 2 раза и стратегия А 3 - 1 раз. Поэтому можно сделать вывод о том, что применение стратегии А 2 (выпуск 12 ящиков фиксажа ВС-6) является более предпочтительным.

Примечания

1. Абчук, В.А. Экономико-математические методы: Элементарная математика и логика. Методы исследования операций / В.А. Абчук. - СПб.: Союз, 1999. - 246с.

2. Аронович, А.Б Сборник задач по исследованию операций / А.Б. Аронович, М.Ю. Афанасьев, Б.П. Суворов. - М.: Изд-во МГУ, 1997. - 252с.

3. Грешилов, А.А. Как принять наилучшее решение в реальных условиях? / А.А. Грешилов. - М.: Радио и связь, 1991. - 118с.

4. Исследование операций в экономике: учебное пособие / Н.Ш. Кремер [и др.]. - М.: ЮНИТИ, 1997. - 428с.

5. Лабскер, Л.Г. Общая методика конструирования критериев оптимальности решений в условиях риска и неопределенности / Л.Г. Лабскер, Е.В. Яновская // Финансовый менеджмент. - 2002. - №5.

6. Просветов, Г.И. Математические методы в экономике: учебно-методическое пособие / Г.И. Просветов. - М.: Изд-во РДЛ, 2004. - 364с.

Размещено на сайт

Подобные документы

    Сущность общей методики формирования критериев. Расчет показателя эффективности стратегии, средневзвешенного выигрыша, цены игры, оптимальности стратегии по критериям Байеса, Лапласа, Вальда, Ходжа-Лемана, Гермейера, максимаксному, критерию произведений.

    реферат , добавлен 23.05.2010

    Теория статистических решений как поиск оптимального недетерминированного поведения в условиях неопределенности. Критерии принятия решений Лапласа, минимаксный, Сэвиджа, Гурвица и различия между ними. Математические средства описания неопределенностей.

    контрольная работа , добавлен 25.03.2009

    Принятие решений в условиях неопределенности. Критерий Лапласа и принцип недостаточного основания. Критерий крайнего пессимизма. Требования критерия Гурвица. Нахождение минимального риска по Сэвиджу. Выбор оптимальной стратегии при принятии решения.

    контрольная работа , добавлен 01.02.2012

    Оптимизация решений динамическими методами. Расчет оптимальных сроков начала строительства объектов. Принятие решений в условиях риска (определение математического ожидания) и неопределенности (оптимальная стратегия поведения завода, правило максимакса).

    контрольная работа , добавлен 04.10.2010

    Критерии принятия решений в условиях радикальной и вероятностной неопределенности: критерий Вальда, Сэвиджа, Гурвица, Лапласа, Байеса. Выбор проекта, который обеспечит максимальный доход из минимально возможных. Определение среднего дохода по проекту.

    контрольная работа , добавлен 23.09.2014

    Экономическое обоснование принятия решений в условиях риска. Понятие и формулировки, методы решения проблем. Критерий Гермейера, Гурвица, Байеса-Лапласа. Решение задачи при помощи компьютера: условные, абсолютные, искомые апостериорные вероятности.

    курсовая работа , добавлен 09.04.2013

    Статистические модели принятия решений. Описание моделей с известным распределением вероятностей состояния среды. Рассмотрение простейшей схемы динамического процесса принятия решений. Проведение расчета вероятности произведенной модификации предприятия.

    контрольная работа , добавлен 07.11.2011

    Решение задач при помощи пакета прикладных программ MatLab. Загрузка в MatLab матриц A и P. Нахождение оптимальной стратегии для заданных матриц с использованием критериев принятия решений в условиях неопределённости Вальда, Гурвица, Лапласа, Сэвиджа.

    лабораторная работа , добавлен 18.03.2015

    Математическая модель задачи принятия решения в условиях риска. Нахождение оптимального решения по паре критериев. Построение реализационной структуры задачи принятия решения. Ориентация на математическое ожидание, среднеквадратичное отклонение.

    курсовая работа , добавлен 16.09.2013

    Сущность правил Вальда (крайний пессимизм) и Сэвиджа (минимальный риск) при принятии решений в условиях полной неопределенности. Правило максимизации среднего ожидаемого дохода и минимизации среднего риска. Риск как среднее квадратичное отклонение.