Моделирование конфликтных ситуаций в экономике Игры с природой.

Презентация:



Advertisements
Похожие презентации
Стохастические игры Игры с «природой». Основные определения К теории игр примыкает так называемая теория статистических решений. Зачастую принятие управленческих.
Advertisements

Лекция 6. Игры с природой: принятие решений в условиях риска
Лекция 5. Игры с природой Понятие игры с природой 5.2. Принятие решений в условиях неопределенности.
Моделирование конфликтных ситуаций в экономике Методы решения игровых задач.
Моделирование конфликтных ситуаций в экономике с применением математической теории игр.
Принятие решений в условиях неопределённости и риска Игры с природой. Принятие решений в условиях полной неопределенности Выполнил студент 245 гр. Пермяков.
Игры в смешанных стратегиях. Моделирование конфликтных ситуаций в экономике Рассмотрим две игры в чистых стратегиях A i \B j B1B1B1B1 B2B2B2B2 B3B3B3B3.
Модели принятия решений Богословский факультет ПСТГУ.
Теория игр Теория игр – это совокупность математических методов анализа и оценки конфликтных ситуаций. Задача теории игр состоит в выборе такой линии поведения.
ТЕМА 7. Применение теории игр в экономико-математическом моделировании 7.1. Основные понятия теории игр Поиск решения в игре Игры с природой.
СТАТИСТИЧЕСКИЕ ИГРЫ Выполнили: Петрук К. Черняк А. Чикиш Ю.
Тема 7. Игровое моделирование стратегий управления и принятия решений Лекции Учебные вопросы: 1. Понятие игрового моделирования. 2. Решение игр.
Нелинейное программирование Практическое занятие 6.
Критерий «максимакса»
Лекция 5 Метод максимального правдоподобия. ММП позволяет получить по крайней мере асимптотически несмещенные и эффективные оценки параметров распределения.
Математические модели Динамические системы. Модели Математическое моделирование процессов отбора2.
Теория игр Теория игр изучает и рассматривает методы определения оптимального поведения при управлении системами, в которых характерно наличие конфликтной.
Количественные характеристики случайных переменных Математическое ожидание (среднее значение) Математическое ожидание (среднее значение) Дисперсия и среднее.
Принятие решений в условиях неопределенности. Основано на том, что вероятности различных вариантов ситуаций развития событий субъекту, принимающему рисковое.
Принятие решений в условиях риска Методы принятия решений в условиях риска разрабатываются и обосновываются в рамках так называемой теории статистических.
Транксрипт:

Моделирование конфликтных ситуаций в экономике Игры с природой

Определение. Игра, в которой осознанно действует только один из игроков, называется игрой с природой. Природа может принимать одно из своих возможных состояний и не имеет целью получение выигрыша. Игра с природой представляется в виде платежной матрицы, элементы которой – выигрыши игрока А, но не являются проигрышами природы П. Имеем. Игрок А, S А ={p 1,p 2,…,p m }, F A (P,П j ) Природа П с состояниями S П ={п 1,п 2,…,п n } Природа П с состояниями S П ={п 1,п 2,…,п n }

Игры с природой A/П П1П1П1П1 П2П2П2П2 П3П3П3П3…. ПnПnПnПn A1A1A1A1 a 11 a 12 a 13 a 1n A2A2A2A2 a 21 a 22 a 23 a 2n …. AmAmAmAm a m1 a m2 a m3 a mn Каждый элемент платежной матрицы a ij – выигрыш игрока А при стратегии A i в состоянии природы П j С одной стороны, задача выбора оптимальной стратегии для игрока А упрощается С другой, задача осложняется из-за дефицита информации о поведении природы

Игры с природой Алгоритм решения задач остается прежним 1.Анализируется наличие доминирующей стратегии игрока А. Если она есть, то эта стратегия выбирается в качестве оптимальной 2. Производится редуцирование матрицы. При этом рассматриваются только строки, т.к. «Природа» действует не осознанно Замечание. Матрица выигрышей не всегда однозначно определяет выбор оптимальной стратегии На выбор стратегии оказывают влияние еще и показатели «удачности» или «неудачности» выбора Это условие называется «благоприятностью» природы

Игры с природой Определение. Показателем благоприятности состояния П j природы П для увеличения выигрыша называется наибольший выигрыш игрока А при этом состоянии природы, т.е. наибольший элемент в j-ом столбце платежной матрицы: β j =max(a ij ), j=1,2,…,n. Для характеристики «удачности» применения игроком стратегии A i в состоянии природы П j вводится понятие риска. Для характеристики «удачности» применения игроком стратегии A i в состоянии природы П j вводится понятие риска. Определение. Риском r ij игрока А при выборе стратегии А i называется разность между показателем благоприятности β j в состоянии природы П j и выигрышем а ij : r ij = β j -a ij. Риск – упущенная возможность получения максимального выигрыша в данном состоянии природы. Из определения следует: r ij 0.

Игры с природой Определение. Верхняя граница рисков для каждого состояния природы: w j =min(a ij ), j=1,2,…,n. Или W i –минимальный выигрыш при данном состоянии природы Колебание выигрыша в заданном состоянии природы: Δr j =β j -w j. Если a ij = W i – то риск является максимальным. Следовательно по критерию риска эта стратегия наихудшая Если a ij = β j (r jj =0), то стратегия A i - безрисковая Каждой платежной матрице игры можно поставить в соответствие матрицу рисков. Обратное не верно.

Игры с природой Ai\ПjAi\ПjAi\ПjAi\Пj П1П1П1П1 П2П2П2П2 П3П3П3П3 П4П4П4П4 П5П5П5П5 A1A1A1A A2A2A2A A3A3A3A βjβjβjβj98583 Пример. Матрица игры Матрица рисков Если игрок выбирает стратегию А 3, то игрок получает одинаковый выигрыш при состояниях природы П 1 и П 3 : a 31 =a 33 =4 Однако, эти выигрыши не равноценны в смысле рисков, т.к. удачность стратегии А 3 к этим состояниям природы различно. Благоприятность β 1 =9, а β 3 =5 соответственно риски r 31 =5, а r 33 =1 Ai\ПjAi\ПjAi\ПjAi\Пj П1П1П1П1 П2П2П2П2 П3П3П3П3 П4П4П4П4 П5П5П5П5 A1A1A1A A2A2A2A A3A3A3A351101

Игры с природой Пример. (Продолжение) Ai\ПjAi\ПjAi\ПjAi\Пj П1П1П1П1 П2П2П2П2 П3П3П3П3 П4П4П4П4 П5П5П5П5 A1A1A1A A2A2A2A A3A3A3A βjβjβjβj98583 Матрица игры Матрица рисков Ai\ПjAi\ПjAi\ПjAi\Пj П1П1П1П1 П2П2П2П2 П3П3П3П3 П4П4П4П4 П5П5П5П5 A1A1A1A A2A2A2A A3A3A3A Может быть и другая ситуация. Выигрыши a 21 =a 31 =4 при этом риски у стратегий при состоянии природы П 1 одинаковы r 21 =r 31 =5 Стратегии, у которых при одинаковых состояниях природы равны риски, называются равноценными относительно этих состояний природы

Игры с природой Различают два вида задач в играх с природой: 1.Задача о принятии решений в условиях риска, когда известны вероятности, с которыми природа принимает каждое из возможных состояний 2. Задачи о принятии решений в условиях неопределенности, когда нет возможности получить информацию о вероятностях появления состояний природы

Принятие решений в условиях риска Пусть имеем игру с природой в условиях риска относительно выигрышей A/П П1П1П1П1 П2П2П2П2 П3П3П3П3…. ПnПnПnПn A1A1A1A1 a 11 a 12 a 13 a 1n A2A2A2A2 a 21 a 22 a 23 a 2n …. AmAmAmAm a m1 a m2 a m3 a mn qjqjqjqj q1q1q1q1 q2q2q2q2 q3q3q3q3…. qnqnqnqn Игрок А имеет m возможных чистых стратегий Природа – n возможных состояний Каждое состояние появляется с вероятностью q i Задача. Выбрать оптимальную стратегию поведения игрока А в заданных условиях В понятие оптимальности вкладываются различные соображения, которые составляют содержание различных критериев

Критерий Бейса в принятии решений в условиях риска Определение. Показателем эффективности чистой стратегии игрока – среднее значение выигрыша игрока при применении i-ой стратегии: (8.1) Определение. Оптимальной по Бейсу чистой стратегией игрока относительно выигрышей считается такая стратегия, которая имеет максимальный показатель эффективности (8.1) (8.2)

Критерий Бейса в принятии решений в условиях риска Замечание. Стратегия, выбранная по критерию Бейса, является оптимальной не в каждом применении, а в среднем Критерий Бейса можно распространить и на случай игры в смешанных стратегиях Пусть P={p 1,p 2,…,p m } смешанная стратегия игрока А, тогда выигрыш игрока есть (8.3) Тогда показатель эффективности смешанной стратегии P есть: (8.4) Показатель эффективности по Бейсу относительно выигрышей – среднее взвешенное значение показателей эффективности чистых стратегий по тому же критерию

Критерий Бейса в принятии решений в условиях риска Определение. Пусть S A – множество всех стратегий игрока А. Оптимальной среди всех стратегий из множества S A – называется стратегия Р 0, показатель эффективности которой максимален: Теорема. Стратегия A i 0 оптимальная среди всех чистых стратегий игрока А по критерию Бейса относительно выигрышей, является оптимальной по тому же критерию критерию среди всех смешанных стратегий S A Теорема говорит о том, что при принятии решения в условиях риска по критерию Бейса относительно выигрышей, можно обойтись только чистыми стратегиями

Критерий Бейса в принятии решений в условиях риска Пример. Найти оптимальную стратегию предприятия при выпуске продукции, если платежная матрица имеет вид: Ai\ПjAi\ПjAi\ПjAi\Пj П1П1П1П1 П2П2П2П2 П3П3П3П3 aiaiaiai A1A1A1A A2A2A2A A3A3A3A A4A4A4A qjqjqjqj Для удобства решения задач платежная матрица дополняется столбцом a i и строкой q i Оптимальной стратегией предприятия по критерию Бейса относительно выигрышей является А 4 а 1 = 0.5* * *0.4=0.31

Критерий Бейса относительно рисков A/П П1П1П1П1 П2П2П2П2 П3П3П3П3…. ПnПnПnПn A1A1A1A1 r 11 r 12 r 13 …. r 1n A2A2A2A2 r 21 r 22 r 23 …. r 2n ….….….….….…. AmAmAmAm r m1 r m2 r m3 …. r mn qjqjqjqj q1q1q1q1 q2q2q2q2 q3q3q3q3…. qnqnqnqn Пусть имеем игру относительно рисков в условиях риска Определение. Показателем неэффективности стратегии A i по критерию Бейса относительно рисков называется средне взвешенное значение риска в i-ой строке: Определение. Оптимальной по критерию Бейса в игре относительно рисков является стратегия A i, показатель неэффективности которой минимальный

Критерий Бейса относительно рисков Риск смешанной стратегии P={p 1,p 2,…,p m }, принадлежащей множеству S A, при состоянии природы П J, определяется как: Показатель неэффективности смешанной стратегии P{p 1,p 2,…p m }, принадлежащей множеству S A, относительно рисков определяется как средне взвешенное рисков по строке Оптимальной среди всех смешанных стратегий по критерию Бейса относительно рисков считается та стратегия, для которой показатель неэффективности имеет минимальное значение Теорема. Если стратегия A i 0 – оптимальная по критерию Бейса относительно рисков среди всех чистых стратегий, то она является оптимальной по тому же критерию среди всех смешанных стратегий

Критерий Бейса относительно рисков Ai\ПjAi\ПjAi\ПjAi\Пj П1П1П1П1 П2П2П2П2 П3П3П3П3 aiaiaiai A1A1A1A A2A2A2A A3A3A3A A4A4A4A βjβjβjβj qjqjqjqj Ai\ПjAi\ПjAi\ПjAi\Пj П1П1П1П1 П2П2П2П2 П3П3П3П3 riririri A1A1A1A A2A2A2A A3A3A3A A4A4A4A qjqjqjqj Исходная матрица Матрица рисков Часто принимают, что q i =Const, т.к. у игрока нет информации о законе распределения состояний природы Принятие гипотезы о равновероятном распределении вероятностей состояний природы называется принципом недостаточного основания Лапласса (q i =1/n) Пример.

Принятие решения в условиях неопределенности Особенность задачи – отсутствие информации о вероятностях появления состояний природы Для решения задачи Гурвиц предложил следующий подход От платежной матрицы перейти к вспомогательной, которая формируется из платежной матрицы путем сортировки элементов каждой строки по возрастанию Вспомогательную матрицу будем обозначать как В В этой матрице в 1-ом столбце сгруппированы элементы с минимальными выигрышами при всех стратегиях игрока и всех состояниях природы В последнем столбце наоборот содержатся максимальные выигрыши при всех стратегиях и состояниях природы

Принятие решения в условиях неопределенности Для учета возможности появления выигрышей вводится набор коэффициентов λ 1, λ 2, …,λ n, которые обладают свойством λ 1 + λ 2 + …+λ n =1 Величина: называется показателем эффективности стратегии A i по Гурвицу Величина (8.5) учитывает все выигрыши возможные при i – ой стратегии и зависит от значений коэффициентов λ 1, λ 2, …,λ n, которые выступают в качестве весов вклада каждой стратегии в показатель эффективности (8.5)

Принятие решения в условиях неопределенности Определение. Обобщенным критерием пессимизма- оптимизма Гурвица с коэффициентами λ 1, λ 2, …,λ n относительно выигрышей называется критерий, по которому оптимальной среди чистых стратегий является стратегия A i с максимальным показателем эффективности (8.5) Числа называются показателями пессимизма и оптимизма соответственно называются показателями пессимизма и оптимизма соответственно Коэффициенты λ 1, λ 2, …,λ n выбираются субъективно

Критерий Вальда (критерий крайнего пессимизма) Критерий Вальда является частным случаем обобщенного критерия Гурвица относительно выигрышей со специальными значениями коэффициентов: λ 1 =1, λ 2 =λ 3 =…=λ n =0 Подставляя значения коэффициентов в показатель эффективности (8.5) получим: (8.6) W i представляет собой минимальный выигрыш при каждой стратегии, а оптимальной считается стратегия с максимальным значением показателя эффективности W i

Критерий Вальда (критерий крайнего пессимизма Другими словами, оптимальной среди чистых стратегий по критерию Вальда считается та чистая стратегия, при которой минимальный выигрыш является максимальным среди минимальных выигрышей всех чистых стратегий. По критерию Вальда показатель пессимизма λ р =1, а показатель оптимизма λ о =0 Критерий Вальда ориентирует игрока на неблагоприятные для него состояния природы Отсюда название «Критерий крайнего пессимизма»

Критерий крайнего оптимизма Данный критерий является противоположностью критерия Вальда Предполагается, что λ 1 =λ 2 =…=λ n-1 =0, λ n =1, тогда Оптимальной среди чистых стратегий по критерию максимального оптимизма будет стратегия A 0, для которой справедливо условие: В этом случае λ р =0, λ о =1

Критерий пессимизма-оптимизма Гурвица Данный критерий является некоторым обобщением критериев крайнего пессимизма и крайнего оптимизма и также представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей при следующем допущении: λ 1 =1-λ, λ 2 =λ 3 =…=λ n-1 =0, λ n =λ, где 0λ1 λ 1 =1-λ, λ 2 =λ 3 =…=λ n-1 =0, λ n =λ, где 0λ1 Тогда показатель эффективности стратегии A i по Гурвицу есть: Оптимальной стратегией A i 0 считается стратегия с максимальным значением показателя эффективности (8.7) (8.7)

Критерий пессимизма-оптимизма Гурвица Показатели пессимизма и оптимизма при этом равны соответственно λ p =1-λ, λ o =λ Показатель эффективности (8.7) соответствует показателю эффективности крайнего пессимизма при λ=0 и крайнего оптимизма при λ=1 При λ=0.5 (реалистичная ситуация) λ p =0.5, λ o =0.5 Замечание. Рассмотренные критерии не учитывают всех возможных состояний природы. Принятие решения производится на основании только крайних значений выигрыша Только обобщенный критерий Гурвица позволяет учесть весь спектр возможных выигрышей!

Обобщенный критерий Гурвица относительно выигрышей Т.к. в матрице В все элементы по строкам упорядочены в порядке возрастания, это свойство положено в основу определения значений неизвестных коэффициентов λ j Введем следующие обозначения: Сумма выигрышей по j-ому столбцу матрицы В Среднее значение выигрыша по J-ому столбцу матрицы В Общая сумма выигрышей по всей матрице b 1 b 2 …b n и b 1 b 2 …b n

Обобщенный критерий Гурвица относительно выигрышей Игроку предлагаются два подхода к выбору оптимальной стратегии: - более осторожный, при котором коэффициенты λ убывают с ростом средних значений выигрышей по столбцам - более оптимистичный, при котором значения коэффициентов λ возрастают с ростом средних значений выигрышей по столбцам Выбор подхода (оценка реальной ситуации опасная/безопасная) возлагается на игрока

Обобщенный критерий Гурвица относительно выигрышей Безопасная ситуация (оптимистичный подход) λ 1 :λ 2 :λ 3 :…:λ n = b 1 :b 2 :b 3 :…:b n λ 1 :λ 2 :λ 3 :…:λ n = b 1 :b 2 :b 3 :…:b n Опасная ситуация (пессимистический подход) λ 1 :λ 2 :λ 3 :…:λ n = b n :b n-1 :b n-2 :…:b 1 λ 1 :λ 2 :λ 3 :…:λ n = b n :b n-1 :b n-2 :…:b 1 (8.8) (8.9)

Пример игры с природой Задача. «Покупка акций» Пусть инвестор может купить акции трех компаний К 1, К 2 и К 3, руководствуясь показателем доходности акций. Ситуация на фондовом рынке меняется со временем, что сказывается на показателях доходности Тогда в качестве игрока можно принять инвестора, а в качестве природы – ситуацию на рынке в различные моменты времени Пусть известны показатели доходности акций за 4-ре последовательных месяца «январь» - «апрель» Вопрос. Какие акции целесообразно купить акционеру?

Пример игры с природой ПЯнварьФевральМартАпрель АП1П1 П2П2 П3П3 П4П4 А1А А2А А3А Таким образом, в распоряжении игрока имеется матрица игры, в которой представлены показатели доходностей акций при каждом состоянии природы и вспомогательная матрица, полученная путем упорядочивания показателей доходностей в каждой строке Матрица игры J 1234 А А1А А2А А3А Вспомогательная матрица В

Пример игры с природой J 1234WiWi MiMi G i(опт) G i(пес) А А1А А2А А3А Стратегии оптимальные с позиций критериев Вальда и крайнего оптимизма находятся очень просто Найдем оптимальные стратегии по критерию пессимизма – оптимизма Гурвица Подход пессимиста. λ выбирается из условия невозрастания среднего: G 1 (λ)=λ 1 *W 1 +λ 4 *M 1 =0.696* *20=8.86 G 2 (λ)=0.696* *7=7; G 3 (λ)=0.696* *0.696=7.82 Подход оптимиста. λ выбирается из условия неубывания среднего B j λ=λ 1 =b 4 /(b 1 +b 4 )=0.696 λ 4 =(1-λ)=0.304 λ=λ 1 =b 4 /(b 1 +b 4 )=0.696 λ 4 =(1-λ)=0.304

Пример игры с природой Найдем оптимальные стратегии по обобщенному критерию Гурвица Опасная ситуация. Коэффициенты λ вычисляются по (8.9) b= =102 b= =102 λ 1 =39/109; λ 2 =25/102; λ 3 =21/102; λ 4 =17/102 λ 1 =39/109; λ 2 =25/102; λ 3 =21/102; λ 4 =17/102 Показатели эффективности по Гурвицу по (8.5)