Использование теории игр в экономике. Математическая теория игр
Использование математических методов, к числу которых относится теория игр, в анализе экономических процессов позволяет выявить такие тенденции, взаимосвязи, которые остаются скрытыми при применении других методов.
В экономической действительности на каждом шагу встречаются ситуации, когда отдельные люди, фирмы или целые страны пытаются обойти друг друга в борьбе за первенство. Такими ситуациями и занимается ветвь экономического анализа, называемая "теория игр".
"Теория игр изучает то, каким образом двое или более игроков выбирают отдельные действия или целые стратегии. Название этой теории настраивает на несколько отвлеченный лад, поскольку оно ассоциируется с игрой в шахматы и бридж или с ведением войн. На самом деле выводы этой дисциплины весьма глубоки. Теория игр была разработана выходцем из Венгрии, гениальным математиком Джоном фон Нейманом (1903-1957). Эта теория сравнительно молодая математическая дисциплина.
В дальнейшем теория игр была дополнена такими разработками, как равновесие Нэша (по имени математика Джона Нэша). Равновесие по Нэшу возникает, когда ни один из игроков не может улучшить своего положения, если его противники не изменят своих стратегий. Стратегия каждого игрока является лучшим ответом на стратегию его противника. Иногда равновесие по Нэшу называют также некооперативным равновесием, поскольку участники совершают свой выбор, не вступая ни в какие соглашения друг с другом и не принимая во внимание никаких других соображений (интересы общества или интересы других сторон), кроме собственной выгоды.
Равновесие совершенно конкурентного рынка также является равновесием по Нэшу, или некооперативным равновесием, при котором каждая фирма и каждый потребитель принимают решения исходя из уже существующих цен как не зависящих от его воли. Мы уже знаем, что в условиях, когда каждая фирма стремится максимизировать прибыль, а каждый потребитель - полезность, равновесие возникает, когда цены равны предельным издержкам, а прибыль - нулю. " Мамаева Л.Н. Институциональная экономика: Курс лекций - М.: Издательско-торговая корпорация «Дашков и К», 2012. - 200 с.
Вспомним концепцию "невидимой руки" Адама Смита: "Преследуя собственные интересы, он (индивид) часто в большей степени способствует процветанию общества, чем если бы он к этому сознательно стремился" Смит А. Исследование о природе и причинах богатства народов // Антология экономической классики. - М.: Эконов-ключ, 19931. Парадокс "невидимой руки" заключается в том, что, хотя каждый и действует как самостоятельная сила, в конечном итоге общество остается в выигрыше. При этом конкурентное равновесие является равновесием по Нэшу еще и в том смысле, что ни у кого нет повода изменять свою стратегию, если и все остальные придерживаются своей. В условиях совершенно конкурентной экономики некооперативное поведение является экономически эффективным с точки зрения интересов общества.
Напротив, когда члены некоторой группы решают кооперироваться и совместно прийти к монопольной цене, такое поведение нанесет ущерб экономической эффективности. Государство вынуждено создавать антимонопольное законодательство и тем самым урезонивать тех, кто пытается завысить цены и поделить рынок. Однако не всегда разобщенность в поведении является экономически эффективной. Соперничество между фирмами ведет к низким ценам и конкурентному объему производства. "Невидимая рука" оказывает почти волшебное воздействие на совершенно конкурентные рынки: эффективное распределение ресурсов происходит в результате действий индивидов, стремящихся к максимизации прибыли.
Однако во многих случаях некооперативное поведение приводит к экономической неэффективности или даже представляет угрозу для общества (например, гонка вооружений). Некооперативное поведение как со стороны США, так и со стороны СССР заставляло обе стороны вкладывать огромные средства в военную область и привело к созданию арсенала, состоящего из почти 100000 ядерных боеголовок. Существует также опасение, что чрезмерная доступность оружия в Америке может стать причиной своего рода внутренней гонки вооружений. Одни люди вооружают себя против других - и этот "бег наперегонки" может продолжаться до бесконечности. Здесь в действие вступает вполне "видимая рука", направляющая это разрушительное состязание и не имеющая ничего общего с "невидимой рукой" Адама Смита. Еще один важный экономический пример - "игры в загрязнения" (окружающей среды). Здесь объектом нашего внимания станет такой вид побочных эффектов, как загрязнение. Если бы фирмы никогда и никого не спрашивали о том, как им поступить, любая из них скорее предпочла бы создавать загрязнения, чем устанавливать дорогостоящие очистители. Если же какая-нибудь фирма из благородных побуждений решилась бы уменьшить вредные выбросы, то издержки, а следовательно, и цены на ее продукцию, возросли бы, а спрос упал. Вполне возможно, эта фирма просто обанкротилась бы. Живущие в жестоком мире естественного отбора, фирмы скорее предпочтут оставаться в условиях равновесия по Нэшу Ни одной фирме не удастся повысить прибыль, уменьшая загрязнение.
Вступив в смертоносную экономическую игру, каждая неконтролируемая государством и максимизирующая прибыль сталелитейная фирма будет производить загрязнения воды и воздуха. Если какая-либо фирма попытается очищать свои выбросы, то тем самым она будет вынуждена повысить цены и потерпеть убытки. Некооперативное поведение установит равновесие по Нэшу в условиях высоких выбросов. Правительство может предпринять меры, с тем чтобы равновесие переместилось. В этом положении загрязнение будет незначительным, прибыли же останутся теми же. Мамаева Л.Н. Институциональная экономика: Курс лекций - М.: Издательско-торговая корпорация «Дашков и К», 2012. - 203 с.
Игры в загрязнения - один из случаев того, как механизм действия "невидимой руки" не срабатывает. Это ситуация, когда равновесие по Нэшу неэффективно. Иногда подобные неконтролируемые игры становятся угрожающими, и здесь может вмешаться правительство. Установив систему штрафов и квот на выбросы, правительство может побудить фирмы выбрать исход, соответствующий низкому уровню загрязнения. Фирмы зарабатывают ровно столько же, сколько и прежде, при больших выбросах, мир же становится несколько чище.
Теория игр применима и к макроэкономической политике. Экономисты и политики в США часто поругивают существующую денежно-кредитную и налогово-бюджетную политику: дефицит федерального бюджета слишком велик и уменьшает национальные сбережения, тогда как кредитно-денежная политика порождает такие процентные ставки, которые ограничивают инвестиции. Более того, этот "бюджетно-денежный синдром" является свойством макроэкономического "ландшафта" уже более десяти лет. Почему же Америка так упорно проводит оба вида политики, хотя ни один из них нежелателен?
Можно попытаться объяснить этот синдром с точки зрения теории игр. Стало привычным в современной экономике разделять данные разновидности политики. Центральный банк Америки - Федеральная резервная система - определяет независимо от правительства денежно-кредитную политику, назначая процентные ставки. Налогово-бюджетной политикой, налогами и расходами - заведуют законодательные и исполнительные власти. Однако каждый из этих видов политики имеет разные цели. Центральный банк стремится ограничить рост предложения денег и обеспечить низкие темпы инфляции.
Артур Берне, специалист по экономическим циклам и бывший глава ФРС, писал: "Чиновники центрального банка склонны, в силу традиции, а возможно, и в силу личного склада, держать цены в узде. Их ненависть к инфляции еще более разгорается после общения с единомышленниками из частных финансовых кругов". Власти же, заведующие налогово-бюджетной политикой, больше озабочены такими вопросами, как полная занятость, собственная популярность, сохранение низких налогов и грядущие выборы.
Лица, проводящие налогово-бюджетную политику, предпочитают минимально возможную величину безработицы, увеличение государственных расходов в сочетании с понижением налогов и не заботятся об инфляции и частных инвестициях.
В бюджетно-денежной игре кооперативная стратегия приводит к умеренной инфляции и безработице в сочетании с большим объемом инвестиций, стимулирующим экономический рост. Однако желание уменьшить безработицу и реализовать социальные программы побуждает руководство страны прибегать к увеличению бюджетного дефицита, тогда как неприятие инфляции заставляет центральный банк поднимать процентные ставки. Некооперативное равновесие означает наименьший возможный объем инвестиций.
Они выбирают "большой бюджетный дефицит". С другой стороны, центральный банк пытается уменьшить инфляцию, не подвержен влиянию профсоюзов и лоббирующих группировок и выбирает "высокие процентные ставки". Результатом является некооперативное равновесие с умеренными величинами инфляции и безработицы, но с низким уровнем инвестиций.
Возможно, что именно благодаря "бюджетно-денежной игре" президент Клинтон выдвинул экономическую программу по уменьшению бюджетного дефицита, снижению процентных ставок и расширению объема инвестиций.
Существуют разные способы описания игр. Один из них состоит в том, что рассматриваются все возможные стратегии игроков и определяются платежи, соответствующие любой возможной комбинации стратегий игроков. Игра, описанная таким способом, называется игрой в нормальной форме.
Нормальная форма игры двух участников состоит из двух платежных матриц, показывающих, какую сумму получит каждый из игроков при любой из возможных пар стратегий. Обычно эти матрицы выражают в форме единой матрицы, которую называют биматрицей. Элементами биматрицы являются пары чисел, первое из которых определяет величину выигрыша первого игрока, а второе - величину выигрыша второго. Первый игрок (государство) выбирает одну из m стратегий, при этом каждой стратегии соответствует строка матрицы I (i= 1,…,m). Второй игрок (бизнес) выбирает одну из n стратегий, при этом каждой стратегии соответствует столбец матрицы j (j= 1,…,n). Пара чисел на пересечении строки и столбца, которые соответствуют стратегиям, выбранным игроками, показывает величину выигрыша каждого из них. В общем случае, если игрок I выбирает стратегию i а игрок II - стратегию j, то выигрыши первого и второго игроков соответственно равны и (i= 1,…,m; j= 1,…,n), где m,n - число конечных стратегий соответственно игроков I и II. Предполагается, что каждому из игроков известны все элементы биматрицы выигрышей. В этом случае их стратегия называется определенной и имеет конечное число вариантов.
Если игроку неизвестны какие-либо варианты стратегий противника (элементы матрицы), то игра называется неопределенной и может иметь бесконечное число вариантов (стратегий).
Существуют и другие классы игр, где игроки выигрывают и проигрывают одновременно.
Антагонистические игры двух лиц связаны с тем, что один из игроков выигрывает ровно столько, сколько проигрывает другой. В таких играх интересы ее игроков прямо противоположны друг другу.
В качестве примера рассмотрим игру, в которой участвуют два игрока, каждый из них имеет по две стратегии. Выигрыши каждого из игроков определяются такими правилами: если оба игрока выбирают стратегии с одинаковыми номерами (игрок I - , игрок II -), то первый игрок выигрывает, а второй проигрывает (государство повышает налоги - бизнес платит их, т.е. выигрыш государства определяет проигрыш бизнеса); если оба игрока выбирают разные стратегии (игрок I - і 1 игрок II - j 2 то первый проигрывает, а второй выигрывает (государство повышает налоги на бизнес - бизнес уклоняется от них; проигрыш государства - выигрыш бизнеса).
Теория игр есть теория математических моделей таких явлений, в которых участники ("игроки") имеют различные интересы и располагают для достижения своих целей более или менее свободно выбираемыми путями (стратегиями). В большинстве работ по теории игр предполагается, что интересы участников игры поддаются количественному измерению и являются вещественными функциями ситуаций, т.е. набором стратегий, получаемых при выборе каждым из игроков некоторой своей стратегии. Для получения результатов необходимо рассматривать те или иные классы игр, выделенные некоторыми ограничительными предположениями. Такие ограничения можно накладывать несколькими путями.
Можно выделить несколько способов (путей) наложения ограничений.
1. Ограничения возможностей взаимоотношений игроков между собой. Простейшим случаем является такой, когда игроки действуют совершенно разобщено и не могут сознательно помогать или мешать друг другу действием или бездействием, информацией или дезинформацией. Такое положение дел неизбежно наступает, когда в игре участвуют только два игрока (государство и бизнес), имеющие диаметрально противоположные интересы: увеличение выигрыша одного из них означает уменьшение выигрыша другого, и притом на ту же сумму, при условии, что выигрыши обоих игроков выражаются в одинаковых единицах измерения. Не нарушая общности, можно принять суммарный выигрыш обоих игроков равным нулю и трактовать выигрыш одного из них как проигрыш другого.
Эти игры называют антагонистическими (или играми с нулевой суммой, или нулевыми играми двух лиц). Они предполагают, что никаких взаимоотношений между игроками, никаких компромиссов, обменов информацией и другими ресурсами не может быть по самой своей природе вещей, по сути игры, поскольку каждое сообщение, получаемое игроком о намерениях другого, может лишь увеличить выигрыш первого игрока и тем самым увеличить проигрыш его противника.
Таким образом, сделаем вывод, что в антагонистических играх игрокам можно не иметь непосредственных взаимоотношений и вместе с тем находиться в состоянии игры (противостоянии) по отношению друг к другу.
2. Ограничения или упрощающие предположения на множестве стратегий игроков. В наиболее простом случае эти множества стратегий конечны, что устраняет ситуации, связанные с возможными совпадениями (сходимостями) в множествах стратегий, избавляет от необходимости вводить на множествах какую-либо технологию.
Игры, в которых множества стратегий каждого из игроков конечны, называются конечными играми.
3. Предложения о внутреннем строении каждой стратегии, т.е. о ее содержании. Так, например, в качестве стратегий можно рассматривать функции времени (непрерывного или дискретного), значениями которых являются действия игрока в соответствующий момент. Эти и подобные им игры принято называть динамическими (позиционными).
Ограничениями стратегий игроков могут быть и их целевые функции, т.е. определение тех целей, на реализацию которых направлена та или иная стратегия. Можно предположить, что ограничения на стратегию связаны и со способами достижения этих целей в тех или иных временных интервалах, например стремление бизнеса добиться снижения размеров обязательных продаж валютной выручки в течение ближайших трех месяцев (или одного года). Если же предположений о природе стратегий не делается, то они считаются некоторым абстрактным множеством. Такого рода игры в самой простой постановке вопроса называются играми в нормальной форме.
Конечные антагонистические игры в нормальной форме называются матричными. Это название объясняется возможностью следующей интерпретации игр такого типа. Будем понимать стратегии первого игрока (игрок I - государство) как строки некоторой матрицы, а стратегии второго игрока (игрок II - бизнес) - как ее столбцы. Для краткости стратегиями игроков называют не сами строки или столбцы матрицы, а их номера. Тогда ситуациями игры оказываются клетки этой матрицы, стоящие на пересечениях каждой строки с каждым из столбцов. Заполнив эти клетки-ситуации числами, описывающими выигрыши игрока I в этих ситуациях, мы завершим задание игры. Полученная матрица называется матрицей выигрыша игры, или матрицей игры. Ввиду антагонистичности матричной игры выигрыш игрока II в каждой ситуации вполне определяется выигрышем игрока I в этой ситуации, отличаясь от него только знаком. Поэтому дополнительных указаний о функции выигрыша игрока II в матричной игре не требуется.
Матрицу, имеющую m строк и n столбцов, называют (m*n) - матрицей, а игру с этой матрицей - (m*n) - игрой.
Процесс (m*n) - игры с матрицей можно представить следующим образом:
Игрок I фиксирует номер строки i, а игрок II - номер столбца j, после чего первый игрок получает от своего противника сумму
Целью игрока I в матричной игре является получение максимального выигрыша, цель игрока II состоит в том, чтобы дать игроку I минимальный выигрыш.
Пусть игрок I (государство) выбирает некоторую свою стратегию i. Тогда в наихудшем случае он получит выигрыш min . В теории игр игроки предполагаются осторожными, рассчитывающими на наименее благоприятный для себя поворот событий.
Такое наименее благоприятное для игрока I положение дел может наступить, например, в том случае, когда стратегия i станет известной игроку II (бизнес). Предвидя такую возможность, игрок I должен выбирать свою стратегию так, чтобы максимизировать этот минимальный выигрыш:
min = max min (I)
Значение, стоящее в правой части равенства, является гарантированным выигрышем игрока I. Игрок II (бизнес) должен выбрать такую стратегию, что
max = min max (II)
Значение, стоящее в правой части равенства, является выигрышем игрока I, больше которого он при правильных действиях противника получить не может.
Фактический выигрыш игрока I должен при разумных действиях партнеров находиться в интервале между значениями выигрыша в первом и втором случаях. Если эти значения равны, то выигрыш игрока I является вполне определенным числом, сами игры называются вполне определенными. Выигрыш игрока I называется значением игры, и он равен элементу матрицы.
У игроков могут быть дополнительные возможности - выбор своих стратегий случайно и независимо друг от друга (стратегии соответствуют строкам и столбцам матрицы). Случайный выбор игроком своих стратегий называется смешанной стра тегии этого игрока. В (m*n) - игрё смешанные стратегии игрока I определяются наборами вероятностей: X = (,…), с которыми этот игрок выбирает свои первоначальные, чистые стратегии.
В основе теории матричных игр лежит теорема Неймана активных стратегиях: "Если один из игроков придерживается своей оптимальной стратегии, то выигрыш остается неизменным и равным цене игры независимо от того, что делает другой игрок, если он не выходит за пределы своих активных стратегий (т.е. пользуется любой из них в чистом виде или смешивает их в любых пропорциях" Neumann J. Contributions to the theory of games. 1995.. - 155 с.). Отметим, что активной называется чистая стратегия игрока, входящая в его оптимальную смешанную стратегию с отличной от нуля вероятностью.
Главная цель игры - нахождение оптимальной стратегии для обоих игроков, если не с максимальным выигрышем одного из них, то тогда с минимальным проигрышем для обоих. Метод нахождения оптимальных стратегий дает часто больше, чем это необходимо для практических целей. В матричной игре не обязательно, чтобы игрок знал все свои оптимальные структуры, поскольку они все взаимозаменяемы и игроку для успешной игры, достаточно знать одну из них. Поэтому применительно к матричным играм актуальным является вопрос о нахождении хотя бы одной оптимальной стратегии для каждого из игроков.
Основная теорема о матричных играх устанавливает существование значения игры и оптимальных смешанных стратегий для обоих игроков. Оптимальная стратегия не обязана быть единичной. Это очень важный вывод, полученный на основе теории игр.
Для играющего в матричную игру субъекта характерны следующие качества:
элементы матрицы интерпретируются как денежные платежи и соответственно их выигрыш и проигрыш оцениваются в денежной форме;
каждый из игроков применяет к этим элементам функцию полезности;
в игре каждый игрок действует так, как если бы функция полезности его оппонента оказывала на матрицу точно такое же воздействие, т.е. каждый смотрит на игру "со своей колокольни".
Эти предположения приводят к играм с нулевой суммой, в которых возникают отношения кооперирования, торгов и другого типа взаимодействий между игроками как до начала игры, так и в ее процессе. Мамаева Л.Н. Институциональная экономика: Курс лекций - М.: Издательско-торговая корпорация «Дашков и К», 2012. - 210 - 211с.
Обобщение теории игр, имеющее целью включение в нее других возможностей анализа, приводит к интересным, но достаточно трудным задачам. При развитии теории игр необходимо применять функцию полезности не только к денежным исходам, но и к суммам с ожидаемыми будущими исходами. Эти предположения являются спорными, но они существуют. В данном случае мы исходим из того, что это предположение о подобной операции имеет сходство с поведением игроков в определенных ситуациях принятия решений и допускает возможность, что способ ведения игры данным игроком зависит от состояния его капитала во время ведения им игры.
Рассмотрим это на следующем примере. Пусть первый игрок к моменту начала игры G обладает капиталом в x долларов. Тогда его капитал в конце игры будет равен + x, где - получаемый им от игры фактический выигрыш. Полезность, которую он приписывает такому исходу, равна f (+ х), где f - функция полезности.
Эти несколько примеров иллюстрируют только часть огромного разнообразия результатов, которые можно получить, используя теорию игр. Данный раздел экономической теории является чрезвычайно полезным (для экономистов и других представителей общественных наук) инструментом анализа ситуаций, при которых небольшое число людей хорошо информировано и пытается перехитрить друг друга на рынках, в сфере политики или в военных действиях.
экспериментальной экономики
И других методов анализа
Как и любая другая не полностью конвенциальная наука, институциональная экономика применяет разные методы анализа. К ним относятся традиционный микроэкономический инструментарий, эконометрические методы, анализ статистической информации и др. В данном разделе кратко рассмотрим применение теории игр, экспериментальной экономики и других методов, адаптированных к институциональному анализу.
Теория игр . Теория игр – аналитический метод, получивший развитие после второй мировой войны и используемый для анализа ситуаций, в которых индивидуумы стратегически взаимодействуют. Шахматы – это прототип стратегической игры, так как результат зависит от поведения противника, так же как и от поведения собственно игрока. Из-за аналогий, найденных между стратегическими играми и формами политического и экономического взаимодействия, теории игр уделяется повышенное внимание в общественных науках. Современная теория игр начинается с работы Д. Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (1944, русский вариант – 1970). Теория исследует взаимодействие индивидуальных решений при некоторых допущениях, касающихся принятия решения в условиях риска, общего состояния окружающей среды, кооперативного или некооперативного поведения других индивидов. Очевидно, что рациональному индивиду приходится принимать решения в условиях неопределенности и взаимодействия. Если выигрыш одного индивида является проигрышем другого, то это игра с нулевой суммой. Когда каждый из индивидов может выиграть от решения одного из них, то имеет место игра с ненулевой суммой. Игра может быть кооперативной, когда возможен сговор, и некооперативной, когда преобладает антагонизм. Одним из известных примеров игры с ненулевой суммой является дилемма заключенного (ДЗ). Этот пример показывает, что, вопреки утверждениям либерализма, преследование индивидом собственного интереса ведет к решению менее удовлетворительному, чем возможные альтернативы.
Предельная теорема Ф.И. Эджуорта рассматривается как ранний пример кооперативной игры n участников. Теорема утверждает, что по мере увеличения числа участников в экономике чистого обмена сговор становится менее полезным, а множество возможных равновесных относительных цен (ядро) уменьшается. Если число участников стремится к бесконечности, то остается только одна система относительных цен, соответствующая ценам общего равновесия.
Понятие оптимального (равновесного) по Нэшу решения является одним из ключевых в теории игр. Оно было введено в 1951 г. американским экономистом-математиком Джоном Ф. Нэшем.
В данном контексте достаточно рассмотреть это понятие применительно к теоретико-игровой модели двух лиц 25 . В этой модели каждый из участников располагает некоторым непустым множеством стратегий S i , i = 1, 2. При этом выбор конкретных стратегий из числа доступных игроку осуществляется таким образом, чтобы максимизировать значение собственной функции выигрыша (полезности) u i , i = 1, 2. Значения функции выигрыша заданы на множестве упорядоченных пар стратегий игроков S 1 ´ S 2 , элементами которого выступают всевозможные сочетания стратегий игроков (s 1 , s 2) (упорядоченность пар стратегий заключается в том, что в каждом из сочетаний на первом месте стоит стратегия первого игрока, на втором – второго), т.е. u i = u i (s 1 , s 2), i = 1, 2. Иными словами, выигрыш каждого игрока зависит не только от выбираемой им самим стратегии, но и от стратегии, принятой его противником.
Оптимальным по Нэшу решением признается пара стратегий (s 1 *, s 2 *), s i *Î S i , i = 1, 2, обладающая следующим свойством: стратегия s 1 * обеспечивает игроку 1 максимальный выигрыш, когда игрок 2 выбирает стратегию s 2 *, и симметрично s 2 * доставляет максимальное значение функции выигрыша игрока 2 , когда игроком 1 принимается стратегия s 1 *. Пара стратегий приводит к равновесию по Нэшу, если выбор, сделанный игроком 1 , оптимален при данном выборе игрока 2 , а выбор, сделанный игроком 2, оптимален при данном выборе игрока 1 . Понятие оптимальности по Нэшу очевидным образом обобщается на случай игры n лиц. Следует заметить, что существование равновесия по Нэшу не означает его Парето-оптимальности, а Парето-оптимальный набор стратегий не обязательно должен удовлетворять равновесию по Нэшу. В 1994 г. Дж. Ф. Нэшу, Р. Зельтену и Дж. Ч. Харшани была присуждена Премия памяти А. Нобеля по экономике за их вклад в разработку теории игр и ее приложение к экономике.
Обращение к этому методу опирается на его явную силу в освещении причин и последствий институционального изменения. Способность теории игр помочь анализировать последствия изменения правил бесспорна; ее сила в раскрытии причин неоднозначна. Любой теоретико-игровой анализ должен предполагать предшествующее определение основных правил игры. Так, О. Моргенштерн в 1968 г. писал: «Игры описаны путем определения возможного поведения в пределах правил игры. Правила являются в каждом случае однозначными; например, в шахматах определенные ходы разрешены для специфических фигур, но запрещены для других. Правила также ненарушаемы. Когда социальная ситуация рассматривается как игра, правила даны физической и юридической окружающей средой, в пределах которой имеют место действия индивидуумов» 26 .
Если эта точка зрения принимается, нельзя ожидать, что теория игр объяснит причину изменения в фундаментальных правилах организации экономической, политической и социальной жизни: определение таких правил, очевидно, является предварительным условием для проведения такого анализа.
Для понимания значения институтов используются модели координационной игры и дилеммы заключенных.
Рассмотримпроблему чистой и обобщенной координации . Чистая координационная игра показывает, что экономические агенты не могут гарантированно реализовать взаимные выгоды кооперации, даже если отсутствует конфликт интересов. Другими словами, в ситуации «чистой» координации имеется множественное равновесие, которое одинаково предпочитается каждой стороной. В этом случае нет конфликта интересов, но нет гарантии, что все будут стремиться к одному равновесному результату. Известный пример – выбор стороны дороги (правой или левой), по которой люди должны ездить (рис. 2.1). Данная игра имеет два равновесия по Нэшу, соответствующих наборам стратегий (левая, левая) и (правая, правая). Никто заранее не возражает ездить справа или слева, но достижение скоординированного результата при большом количестве участников переговоров потребует высоких трансакционных издержек. Необходим институт, который бы выполнил функцию фокальной точки, т.е. ввел согласованное решение. Таким институтом может быть результат общего знания, полученного на основе однотипного анализа ситуации, а может быть и государство, которое вмешивается, чтобы ввести правило координации и сократить трансакционные издержки. В целом институты выполняют координационную функцию, снижая неопределенность.
Обобщенная проблема координации существует, если матрица выигрышей такова, что в любой точке равновесия никто из игроков не имеет стимула изменить свое поведение при данном поведении других игроков, но и никто из игроков не желает, чтобы какой-либо другой игрок изменил его. В этом случае каждый предпочел бы скоординированный результат не скоординированному, но, возможно, каждый захочет предпочесть особый скоординированный результат (рис. 2.2). Например, два производителяА и Б используют различную технологию X и Y , но хотят ввести национальный стандарт изделия, который вызовет сетевые внешние эффекты. Производитель А больше выиграет, если стандартом станет технология Х , а производитель Б – технология Y . Выигрыш оказывается распределенным асимметрично. Итак, производитель А (Б ) предпочтет, чтобы стандартом стала X (Y )-технология, но оба предпочтут любой из скоординированных результатов не скоординированному. Трансакционные издержки в этой модели будут выше, чем в предыдущей (особенно при участии большого количества сторон), так как налицо столкновение интересов. Замена частных попыток координации государственным вмешательством позволила бы уменьшить трансакционные издержки в экономике. Примерами являются государственное введение технологических стандартов, стандартов измерения и качества и т.д. Обобщенная координационная модель иллюстрирует важность не только координационной функции институтов, но и распределительной, от которой зависит способ, ограничивающий возможные альтернативы игроков, и в конечном счете результативность взаимодействия.
Дилемма заключенного часто приводится как пример проблемы установления кооперации между индивидами. В игре участвуют два игрока, два заключенных, которые разделены своими надзирателями. У каждого есть два выбора: кооперироваться, т.е. хранить молчание, или отказаться от кооперации, т.е. предать другого. Каждый должен действовать, не зная, что предпримет другой. Каждому говорят, что признание, если другой молчит, ведет к свободе. Отказ от признания в случае предательства другого означает смерть. Если оба признаются, то проведут вместе несколько лет в тюрьме. Если каждый из них откажется от признания, то будет на короткое время арестован и затем освобожден. Предполагая, что тюрьма предпочтительнее смерти, а свобода – наиболее желаемое состояние, заключенные сталкиваются с парадоксом: хотя они оба предпочли бы не предавать друг друга и провести недолгое время в тюрьме, каждый окажется в лучшем положении, предав другого, не считаясь с тем, что предпримет другой. Аналитически способность заключенных установить связь находится на заднем плане, так как стимулы к предательству остаются одинаково сильными при наличии или без наличия связи. Предательство остается доминирующей стратегией.
Этот анализ помогает объяснить, почему эгоистично-максимизирующие агенты не могут рационально приходить к кооперативному результату или поддерживать его (парадокс индивидуальной рациональности). Он полезен в объяснении ex post распада картеля или другого кооперативного соглашения, но не объясняет, каким способом сформирован картель или кооперативное соглашение. Если заключенные способны достичь соглашения, то проблема исчезает: они договариваются не предавать друг друга и прийти к тому, чтобы максимизировать совместные выигрыши. Итак, достаточно вступить в соглашение, которое совместно желательно, но делает каждого в отдельности потенциально более уязвимым к ущербу, чем в отсутствие такого соглашения. Этот анализ обращает внимание на институты, которые с индивидуальной точки зрения могут превратить такие соглашения в менее рискованные.
В теоретической литературе дается различие между анализом кооперативных и некооперативных игр. Как уже описано, игроки способны заключать связывающие их соглашения. Гарант таких соглашений – неявный. Многие теоретики игр настаивают на том, что обман и разрыв соглашений – общие черты человеческих взаимоотношений, поэтому такое поведение должно оставаться внутри стратегического пространства. Они пытаются объяснить возникновение и сохранение кооперации в модели некооперативных игр, особенно в модели бесконечно повторяющейся последовательности игр ДЗ. Конечная последовательность игр не даст результата, потому что с момента, когда доминирующая стратегия в последней игре станет явно отступнической, и с момента, когда она станет ожидаемой, то же самое будет верно для предпоследней игры и так далее, до первой игры. В бесконечных сериях игр при определенных предположениях о дисконтировании выигрышей может появиться кооперация как равновесная стратегия. Таким образом, некооперативный анализ не избегает потребности принять основные правила игры как часть описания стратегического пространства. Он просто предполагает отличный и менее ограничительный набор правил. В отличие от кооперативного анализа соглашения могут быть разорваны по желанию. С другой стороны, выход из непрерывной игры ограничен. Ни один подход не избегает потребности определять правила игры, перед тем как начать анализ.
Одним из наиболее интересных недавних достижений в исследовании ДЗ была организация турниров между предопределенными стратегиями для проведения конечно повторяющихся игр ДЗ с двумя участниками. Первый из них был организован Робертом Аксельродом (описан в 1984 г.) и включал игру последовательностью в 200 партий. Опытными в ДЗ участниками были предложены компьютерные программы, и которые затем состязались друг с другом.
Р. Аксельрод сообщил игрокам, что стратегии будут оценены не по числу побед, а согласно сумме очков против всех других стратегий, причем три очка каждый получает за взаимную кооперацию, одно очко за взаимное отступничество и выигрыш 5 к 0 за отступничество/кооперацию. Как отмечено ранее, аналитически ясно, что отступничество – доминирующая стратегия последней игры и, следовательно, каждой предыдущей игры.
Рассмотрим матрицу выигрышей в ДЗ, анализируемую Р. Аксельродом 27 (рис. 2.3). Независимо от того, что делает другой игрок, предательство дает более высокое вознаграждение, чем кооперация. Если первый игрок думает, что другой игрок будет молчать, то ему выгоднее предать ($5>$3). С другой стороны, если первый игрок думает, что другой предаст, ему все равно выгоднее предать самому ($1 лучше, чем ничего). Следовательно, искушение склоняет к предательству. Но если оба предают, то оба получают меньше, чем в ситуации кооперации ($1+$1<$3+$3).
Второй игрок |
|||
Кооперируется |
|||
Первый игрок | |||
Кооперируется |
Рис. 2.3 . Матрица выигрышей в дилемме заключенного
Дилемма заключенного – знаменитая проблема в экономике – показывает: то, что рационально или оптимально для одного агента, может не быть рациональным или оптимальным для группы индивидов, рассматриваемых совместно. Эгоистичное поведение индивида может быть вредным или разрушительным для группы. В повторяющихся играх ДЗ соответствующая стратегия неочевидна. Чтобы найти хорошую стратегию, и были организованы турниры. Если выигрыш был бы получен строго на основе победа–проигрыш, то каждый участник турнира должен был предложить непрерывное отступничество. Однако правила выигрыша дали понять, что организация некоторой кооперации могла бы привести к более высоким общим результатам. К удивлению многих, победила простая стратегия «зуб за зуб», предложенная А. Рапопортом: игрок кооперируется на первом шаге и затем делает тот ход, который другой игрок делал на предыдущем шаге.
Во втором турнире участвовало гораздо больше игроков, в том числе профессионалов, а также тех, кто знал о результатах первого раунда. Итогом была еще одна победа стратегии копирования («зуб за зуб»).
Анализ результатов турниров выявил четыре свойства, приводящие к успешной стратегии: 1) стремление избежать ненужного конфликта и кооперироваться так долго, как это делает другой; 2) способность к вызову перед лицом ничем не вызванного предательства другого; 3) прощение после ответа на вызов; 4) ясность поведения, чтобы другой игрок мог распознать и адаптироваться к образу действия первого.
Р. Аксельрод показал, что кооперация может начаться, развиваться и стабилизироваться в ситуациях, которые в противном случае являются экстраординарными, не обещая ничего хорошего. Можно согласиться с тем, что стратегия «зуб за зуб» в аналитическом смысле иррациональна в конечно повторяющейся игре, но эмпирически, очевидно, нет. Если бы стратегия «зуб за зуб» состязалась с другими аналитическими стратегиями, все из которых состояли из непрерывных отступничеств, она не смогла бы победить в турнире.
Теория игр может быть важным инструментом для изучения человеческого взаимодействия в ограниченных правилами обстоятельствах. Благодаря своим возможностям изучать последствия разных институциональных соглашений она также может быть полезна с точки зрения государственной политики при проектировании новых институциональных соглашений. Теория игр использовалась в анализе общественных благ, олигополии, картеля и сговоров на рынках товаров и труда. При всех своих достоинствах теория игр обладает и относительными слабостями. Некоторые авторы высказали сомнения относительно применения модели дилеммы заключенного в социальной науке. Например, М. Тейлор в 1987 г. предположил, что такие игры соответствуют обстоятельствам обеспечения общественными благами. В 1985 г. Н. Шофилд утверждал, что агенты должны формировать согласованные понятия об убеждениях и желаниях других агентов, включая проблемы познания и интерпретации, которые не просты для моделирования 28 . Многие экономисты отмечали, что использование теории игр без оговорок может свести экономическую деятельность к слишком статичной схеме. В частности, нобелевский лауреат Р. Стоун в 1948 г. писал: «Главная черта, благодаря которой теория игр впадает в противоречие с живой действительностью, заключается в том, что объект исследования ограничен во времени – игра имеет начало и конец. Об экономической действительности этого не скажешь. Именно в возможности обособить партию от игры и заключается глубокое расхождение теории с реальностью, а это расхождение ограничивает ее применение» 29 . Однако с тех пор неоценимо много сделано для сглаживания этого расхождения и расширения применения теории игр в экономике.
Экспериментальная экономика . Другим методическим подходом, использующимся для проверки постулатов экономической теории и смежных наук, а также объяснения институциональных проблем является экспериментальная экономика . Влияние проектируемых институтов на эффективность размещения ресурсов не всегда можно предсказать ex ante. Один из вариантов экономии на издержках ех post – имитация работы институтов в лабораторных условиях.
Вообще экономический эксперимент – это воспроизведение экономического явления или процесса с целью изучения в наиболее благоприятных условиях и дальнейшего практического изменения. Эксперименты, которые осуществляются в реальных условиях, называются естественными, или полевыми, а эксперименты, проводимые в искусственных условиях, – лабораторными. Последние зачастую требуют использования экономико-математических методов и моделей. Естественные эксперименты могут проводиться на микроуровне (эксперименты Р. Оуэна, Ф. Тейлора, по внедрению хозрасчета на предприятии и т.п.) и на макроуровне (варианты экономической политики, свободные экономические зоны и пр.). Лабораторные эксперименты – это искусственно воспроизведенные экономические ситуации, некие экономические модели, чья среда (условия протекания эксперимента) контролируется исследователем в лаборатории.
Американский экономист Эл. Рот, с конца 70-х гг. работающий в области экспериментальной экономики, отмечает ряд преимуществ лабораторных экспериментов перед «полевыми» 30 . В лабораторных условиях возможен полный контроль экспериментатора над средой и поведением субъектов, в то время как при «полевых» экспериментах можно контролировать лишь ограниченное число факторов среды и почти невозможно – поведение экономических субъектов. Именно благодаря этому лабораторные эксперименты позволяют более точно определять условия, при которых можно ожидать повторения отдельных явлений. Кроме того, естественные эксперименты дорогостоящи, и в случае неудачи затрагивают судьбы многих людей.
Область интересов экспериментальной экономики достаточно обширна: положения теории игр, теории отраслевых рынков, модель рационального выбора, феномен рыночного равновесия, проблемы общественных благ и др.
Для примера остановимся на результатах исследования сравнительной эффективности институтов рынка, которые опубликованы Ч.А. Холтом и представлены А.Е. Шаститко 31 . В исследовании сопоставляются выводы теоретической и экспериментальной моделей рынка, полученные с помощью контролируемых экспериментов. Результаты поведения агентов измеряются с помощью коэффициента исчерпания суммы потенциальных рент покупателя и продавца, что соответствует эффективности обмена. Коэффициент исчерпания – отношение фактически (экспериментально) полученной ренты к максимально возможной величине – изменяется от 0 до 1. Сравнение проводилось по следующим формам рынка: двусторонний аукцион, торговля на основе ценовых заявок одной из сторон, расчетная палата, децентрализованные переговоры о цене, торговля на основе заявок с последующими переговорами. Наиболее интересные результаты экспериментов получены разными группами исследователей по двум первым формам рынка (табл. 2.1).
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ЭКОНОМИЧЕСКИЙ ФАКУЛЬТЕТ
КАФЕДРА …
Теория игр и ее применение в экономике
Курсовой проект
студента 2 курса
отделения «Менеджмент»
Научный руководитель
Минск, 2010
1. Введение. стр.3
2. Основые понятия теории игры стр.4
3. Представление игр стр. 7
4. Типы игр стр.9
5. Применение теории игр в экономике стр.14
6. Проблемы практического применения в управлении стр.21
7. Заключение стр.23
Список использованной литературы стр.24
1. ВВЕДЕНИЕ
На практике часто появляется необходимость согласования действий фирм, объединений, министерств и других участников проектов в случаях, когда их интересы не совпадают. В таких ситуациях теория игр позволяет найти лучшее решение для поведения участников, обязанных согласовывать действия при столкновении интересов. Теория игр все шире проникает в практику экономических решений и исследований. Ее можно рассматривать как инструмент, помогающий повысить эффективность плановых и управленческих решений. Это имеет большое значение при решении задач в промышленности, сельском хозяйстве, на транспорте, в торговле, особенно при заключении договоров с иностранными партнерами на любых уровнях. Так, можно определить научно обоснованные уровни снижения розничных цен и оптимальный уровень товарных запасов, решать задачи экскурсионного обслуживания и выбора новых линий городского транспорта, задачу планирования порядка организации эксплуатации месторождений полезных ископаемых в стране и др. Классической стала задача выбора участков земли под сельскохозяйственные культуры. Метод теории игр можно применять при выборочных обследованиях конечных совокупностей, при проверке статистических гипотез.
Теория игр - математический метод изучения оптимальных стратегий в играх. Под игрой понимается процесс, в котором участвуют две и более сторон, ведущих борьбу за реализацию своих интересов. Каждая из сторон имеет свою цель и использует некоторую стратегию, которая может вести к выигрышу или проигрышу - в зависимости от поведения других игроков. Теория игр помогает выбрать лучшие стратегии с учётом представлений о других участниках, их ресурсах и их возможных поступках.
Теория игр - это раздел прикладной математики, точнее - исследования операций. Чаще всего методы теории игр находят применение в экономике, чуть реже в других общественных науках - социологии, политологии, психологии, этике и других. Начиная с 1970-х годов её взяли на вооружение биологи для исследования поведения животных и теории эволюции. Очень важное значение она имеет для искусственного интеллекта и кибернетики, особенно с проявлением интереса к интеллектуальным агентам.
Теория игр берёт своё начало из неоклассической экономики. Впервые математические аспекты и приложения теории были изложены в классической книге 1944 года Джона фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение» (англ. Theory of Games and Economic Behavior).
Эта область математики нашла некоторое отражение в общественной культуре. В 1998 году американская писательница и журналистка Сильвия Назар издала книгу о судьбе Джона Нэша, нобелевского лауреата по экономике и учёного в области теории игр; а в 2001 по мотивам книги был снят фильм «Игры разума». Некоторые американские телевизионные шоу, например, «Friend or Foe», «Alias» или «NUMB3RS», периодически ссылаются на теорию в своих эпизодах.
Нематематический вариант теории игр представлен в работах Томаса Шеллинга, нобелевского лауреата по экономике 2005г.
Нобелевскими лауреатами по экономике за достижения в области теории игр стали: Роберт Ауманн, Райнхард Зелтен, Джон Нэш, Джон Харсаньи, Томас Шеллинг.
2. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР
Ознакомимся с основными понятиями теории игр. Математическая модель конфликтной ситуации называется игрой, стороны, участвующие в конфликте, - игроками, а исход конфликта – выигрышем. Для каждой формализованной игры вводятся правила, т.е. система условий, определяющая: 1) варианты действий игроков; 2) объём информации каждого игрока о поведении партнёров; 3) выигрыш, к которому приводит каждая совокупность действий. Как правило, выигрыш (или проигрыш) может быть задан количественно; например, можно оценить проигрыш нулём, выигрыш – единицей, а ничью - ½.
Игра называется парной, если в ней участвуют два игрока, и множественной, если число игроков больше двух.
Игра называется игрой с нулевой суммой, или антагонистической, если выигрыш одного из игроков равен проигрышу другого, т. е. для полного задания игры достаточно указать величину одного из них. Если обозначить а – выигрыш одного из игроков, b – выигрыш другого, то для игры с нулевой суммой b = -а, поэтому достаточно рассматривать, например а.
Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока. Ходы могут быть личными и случайными. Личный ход – это сознательный выбор игроком одного из возможных действий (например, ход в шахматной игре). Случайный ход – это случайно выбранное действие (например, выбор карты из перетасованной колоды). В дальнейшем мы будем рассматривать только личные ходы игроков.
Стратегией игрока называется совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся ситуации. Обычно в процессе игры при каждом личном ходе игрок делает выбор в зависимости от конкретной ситуации. Однако в принципе возможно, что все решения приняты игроком заранее (в ответ на любую сложившуюся ситуацию). Это означает, что игрок выбрал определённую стратегию, которая может быть задана в виде списка правил или программы. (Так можно осуществить игру с помощью ЭВМ). Игра называется конечной, если у каждого игрока имеется конечное число стратегий, и бесконечной – в противном случае.
Для того чтобы решить игру, или найти решение игры, следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получать максимальный выигрыш, когда второй придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии. Такие стратегии называются оптимальными. Оптимальные стратегии должны также удовлетворять условию устойчивости, т. е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.
Если игра повторяется достаточно много раз, то игроков может интересовать не выигрыш и проигрыш в каждой конкретной партии, а средний выигрыш (проигрыш) во всех партиях.
Целью теории игр является определение оптимальной стратегии для каждого игрока. При выборе оптимальной стратегии естественно предполагать, что оба игрока ведут себя разумно с точки зрения своих интересов. Важнейшее ограничение теории игр – естественность выигрыша как показателя эффективности, в то время как в большинстве реальных экономических задач имеется более одного показателя эффективности. Кроме того, в экономике, как правило, возникают задачи, в которых интересы партнёров не обязательно антагонистические.
3. Представление игр
Игры представляют собой строго определённые математические объекты. Игра образуется игроками, набором стратегий для каждого игрока и указания выигрышей, или платежей, игроков для каждой комбинации стратегий. Большинство кооперативных игр описываются характеристической функцией, в то время как для остальных видов чаще используют нормальную или экстенсивную форму.
Экстенсивная форма
Игра «Ультиматум» в экстенсивной форме
Игры в экстенсивной, или расширенной, форме представляются в виде ориентированного дерева, где каждая вершина соответствует ситуации выбора игроком своей стратегии. Каждому игроку сопоставлен целый уровень вершин. Платежи записываются внизу дерева, под каждой листовой вершиной.
На рисунке слева - игра для двух игроков. Игрок 1 ходит первым и выбирает стратегию F или U. Игрок 2 анализирует свою позицию и решает - выбрать стратегию A или R. Скорее всего первый игрок выберет U, а второй - A (для каждого из них это оптимальные стратегии); тогда они получат соответственно 8 и 2 очка.
Экстенсивная форма очень наглядна, с её помощью особенно удобно представлять игры с более чем двумя игроками и игры с последовательными ходами. Если же участники делают одновременные ходы, то соответствующие вершины либо соединяются пунктиром, либо обводятся сплошной линией.
Нормальная форма
Игрок
2 |
Игрок
2 |
|
Игрок
1 |
4 , 3 |
–1 , –1 |
Игрок
1 |
0 , 0 |
3 , 4 |
Нормальная форма для игры с 2 игроками, у каждого из которых по 2 стратегии. |
Игроки выбирали стратегии с максимальным для себя результатом, но проиграли, из-за незнания хода другого игрока. Обычно в нормальной форме представляются игры, в которых ходы делаются одновременно, или хотя бы полагается, что все игроки не знают о том, что делают другие участники. Такие игры с неполной информацией будут рассмотрены ниже.
Характеристическая формула
В кооперативных играх с трансферабельной полезностью, то есть возможностью передачи средств от одного игрока к другому, невозможно применять понятие индивидуальных платежей. Вместо этого используют так называемую характеристическую функцию, определяющую выигрыш каждой коалиции игроков. При этом предполагается, что выигрыш пустой коалиции равен нулю.
Основания такого подхода можно найти ещё в книге фон Неймана и Моргенштерна. Изучая нормальную форму для коалиционных игр, они рассудили, что если в игре с двумя сторонами образуется коалиция C, то против неё выступает коалиция N \ C. Образуется как бы игра для двух игроков. Но так как вариантов возможных коалиций много (а именно 2N, где N - количество игроков), то выигрыш для C будет некоторой характеристической величиной, зависящей от состава коалиции. Формально игра в такой форме (также называемая TU-игрой) представляется парой (N, v), где N - множество всех игроков, а v: 2N → R - это характеристическая функция.
Подобная форма представления может быть применена для всех игр, в том числе без трансферабельной полезности. В настоящее время существуют способы перевести любую игру из нормальной формы в характеристическую, но преобразование в обратную сторону возможно не во всех случаях.
4. Типы игр
Кооперативные и некооперативные.
Игра называется кооперативной, или коалиционной, если игроки могут объединяться в группы, беря на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя. Развлекательные игры редко являются кооперативными, однако такие механизмы нередки в повседневной жизни.
Часто предполагают, что кооперативные игры отличаются именно возможностью общения игроков друг с другом. В общем случае это неверно. Существуют игры, где коммуникация разрешена, но игроки преследуют личные цели, и наоборот.
Из двух типов игр, некооперативные описывают ситуации в мельчайших деталях и выдают более точные результаты. Кооперативные рассматривают процесс игры в целом. Попытки объединить два подхода дали немалые результаты. Так называемая программа Нэша уже нашла решения некоторых кооперативных игр как ситуации равновесия некооперативных игр.
Гибридные игры включают в себя элементы кооперативных и некооперативных игр. Например, игроки могут образовывать группы, но игра будет вестись в некооперативном стиле. Это значит, что каждый игрок будет преследовать интересы своей группы, вместе с тем стараясь достичь личной выгоды.
В практической деятельности часто приходится принимать решения в условиях противодействия другой стороны, которая может преследовать противоположные или иные цели, препятствовать теми или иными действиями или состояниями внешней среды достижению намеченной цели. Причем, эти воздействия противоположной стороны могут носить пассивный или активный характер. В таких случаях приходится учитывать возможные варианты поведения противоположной стороны, ответные действия и их возможные последствия.
Возможные варианты поведения обеих сторон и их исходов для каждого сочетания вариантов и состояний часто представляют в видематематической модели,которую называют игрой .
Если в качестве противодействующей стороны выступает неактивная, пассивная сторона, которая сознательно не противодействует достижению намеченной цели, то такую игру называют игрой с «природой». Под природой понимают обычно совокупность обстоятельств, в которых приходится принимать решения (неясность погодных условий, неизвестность поведения клиентов в коммерческой деятельности, неопределенность реакции населения на новые виды товаров и услуг и т. д.)
В других ситуациях противоположная сторона активно, сознательно противостоит достижению намеченной цели. В подобных случаях происходит столкновение противоположных интересов, мнений, идей. Такие ситуации называются конфликтными , а принятие решений в конфликтной ситуации затрудняется из-за неопределенности поведения противника. Известно, что противник сознательно стремится предпринять наименее выгодные для вас действия, чтобы обеспечить себе наибольший успех. Неизвестно, в какой мере противник умеет оценить обстановку и возможные последствия, как он оценивает ваши возможности и намерения. Обе стороны не могут предсказать взаимные действия. Несмотря на такую неопределенность, принимать решение приходится каждой стороне конфликта
В экономике конфликтные ситуации встречаются очень часто и имеют многообразный характер. К ним относятся, например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом и т. д. Во всех этих примерах конфликтная ситуация порождается различием интересов партнеров и стремлением каждого из них принимать оптимальные решения. При этом каждому приходится считаться не только со своими целями, но и с целями партнера и учитывать неизвестные заранее его возможные действия.
Необходимость обоснования оптимальных решений в конфликтных ситуациях привела к возникновению теории игр.
Теория игр - это математическая теория конфликтных ситуаций . Исходными положениями этой теории являются предположение о полной «идеальной» разумности противника и принятие при разрешении конфликта наиболее осторожного решения.
Конфликтующие стороны называются игроками , одна реализация игры – партией , исход игры – выигрышем или проигрышем . Любое возможное для игрока действие (в рамках заданных правил игры) называется его стратегией .
Смысл игры состоит в том, что каждый из игроков в рамках заданных правил игры стремится применить оптимальную для него стратегию, то есть стратегию, которая приведет к наилучшему для него исходу. Одним из принципов оптимального (целесообразного) поведения является достижение равновесной ситуации, в нарушении которой не заинтересован ни один из игроков.
Именно ситуация равновесия может быть предметом устойчивых договоров между игроками. Кроме того, ситуации равновесия являются выгодными для каждого игрока: в равновесной ситуации каждый игрок получает наибольший выигрыш, в той мере, в какой это от него зависит.
Математическая модель конфликтной ситуации называется игрой , стороны, участвующие в конфликте, называются игроками.
Для каждой формализованной игры вводятся правила. В общем случае правилами игры устанавливаются варианты действий игроков; объем информации каждого игрока о поведении партнеров; выигрыш, к которому приводит каждая совокупность действий.
Развитие игры во времени происходит последовательно, по этапам или ходам. Ходом в теории игр называют выбор одного из предусмотренных правилами игры действия и его реализацию. Ходы бывают личные и случайные. Личным ходом называют сознательный выбор игроком одного из возможных вариантов действия и его осуществление. Случайным ходом называют выбор, осуществляемый не волевым решением игрока, а каким-либо механизмом случайного выбора (бросание монеты, пасовка, сдача карт и т. д.).
В зависимости от причин, вызывающих неопределенность исходов, игры можно разделить на следующие основные группы:
Комбинированные игры, в которых правила дают в принципе возможность каждому игроку проанализировать все разнообразные варианты своего поведения и, сравнив эти варианты, избрать тот из них, который ведет к наилучшему для этого игрока исходу. Неопределенность исхода связана обычно с тем, что количество возможных вариантов поведения (ходов) слишком велико и игрок практически не в состоянии их всех перебрать и проанализировать.
Азартные игры , в которых исход оказывается неопределенным в силу влияния различных случайных факторов. Азартные игры состоят только из случайных ходов, при анализе которых применяется теория вероятностей. Азартными играми математическая теория игр не занимается.
Стратегические игры , в которых полная неопределенность выбора обоснована тем, что каждый из игроков, принимая решение о выборе предстоящего хода, не знает, какой стратегии будут придерживаться другие участники игры, причем незнание игрока о поведении и намерениях партнеров носит принципиальный характер, так как отсутствует информация о последующих действиях противника (партнера).
Существуют игры, сочетающие в себе свойства комбинированных и азартных игр, стратегичность игр может сочетаться с комбинаторностью и т. д.
В зависимости от числа участников игры подразделяются на парные и множественные. В парной игре число участников равно двум, во множественной игре число участников более двух. Участники множественной игры могут образовывать коалиции. В этом случае игры называют коалиционными . Множественная игра обращается в парную, если ее участники образуют две постоянные коалиции.
Одним из основных понятий теории игр является стратегия. Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры.
Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры, содержащей личные и случайные ходы, обеспечивает игроку максимально возможный средний выигрыш или минимально возможный проигрыш независимо от поведения противника.
Игра называется конечной , если число стратегий игроков конечно, и бесконечной , если хотя бы у одного из игроков число стратегий является бесконечным.
В многоходовых задачах теории игр понятия «стратегия» и «вариант возможных действий» существенно отличаются друг от друга. В простых (одноходовых) игровых задачах, когда в каждой партии игры каждый игрок может сделать по одному ходу, эти понятия совпадают, а, следовательно, совокупность стратегий игрока охватывает все возможные действия, которые он может предпринять в любой возможной ситуации и при любой возможной фактической информации.
Различают игры и по сумме выигрыша. Игра называется игрой с нулевой суммо й , если каждый игрок выигрывает за счет других, а сумма выигрыша одной стороны равна сумме проигрыша другой. В парной игре с нулевой суммой интересы игроков прямо противоположны. Парная игра с нулевой суммой называется антагонистической игрой .
Игры, в которых выигрыш одного игрока и проигрыш другого не равны между собой, называются играми с ненулевой суммой .
Существует два способа описания игр: позиционный и нормальный . Позиционный способ связан с развернутой формой игры и сводится к графу последовательных шагов (дереву игры). Нормальный способ заключается в явном представлении совокупности стратегий игроков и платежной функции . Платежная функция в игре определяет для каждой совокупности выбранных игроками стратегий выигрыш каждой из сторон.
3.4.1. Основные понятия теории игр
В настоящее время многие решения проблем в производственной,экономической или коммерческой деятельности зависят от субъективных качеств лица, принимающего решение. При выборе решений в условиях неопределенности всегда неизбежен элемент произвола, а следовательно, и риска.
Задачами о принятии решений в условиях полной или частичной неопределенности занимается теория игр и статистических решений. Неопределенность может принимать форму противодействия другой стороны, которая преследует противоположные цели, препятствует теми или другими действиями или состояниями внешней среды. В таких случаях приходится учитывать возможные варианты поведения противоположной стороны.
Возможные варианты поведения обеих сторон и их исходов для каждого сочетания альтернатив и состояний можно представить в виде математической модели, которая называется игрой. Обе стороны конфликта не могут точно предсказать взаимные действия. Несмотря на такую неопределенность, принимать решения приходится каждой стороне конфликта.
Теория игр - это математическая теория конфликтных ситуаций. Основными ограничениями этой теории являются предположение о полной ("идеальной") разумности противника и принятие при разрешении конфликта наиболее осторожного " перестраховочного" решения.
Конфликтующие стороны называются игроками , одна реализация игры – партией, исход игры – выигрышем или проигрышем.
Ходом в теории игр называется выбор одного из предусмотренных правилами действия и его реализацию.
Личным ходом называют сознательный выбор игроком одного из возможных вариантов действия и его осуществление.
Случайным ходом называют выбор игроком, осуществляемый не волевым решением игрока, а каким либо механизмом случайного выбора (бросание монеты, сдача карт и т.п.) одного из возможных вариантов действия и его осуществление.
Стратегией игрока называется совокупность правил, определяющих выбор варианта действия при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры
Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры, содержащей личные и случайные ходы, обеспечивает игроку максимально возможный средний выигрыш (или, что то же самое, минимально возможный средний проигрыш).
В зависимости от причин, вызывающих неопределенность исходов, игры можно разделить на следующие основные группы:
- Комбинаторные игры, в которых правила в принципе дают возможность каждому игроку проанализировать все разнообразные варианты поведения и, сравнив эти варианты выбрать из них наилучший. Неопределенность здесь состоит в слишком большом количестве вариантов, которые надо проанализировать.
- Азартные игры, в которых исход оказывается неопределенным в силу влияния случайных факторов.
- Стратегические игры, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение, не знает, какой стратегии будут придерживаться другие участники игры, так как отсутствует информация о последующих действиях противника (партнера).
- Игра называется парной , если в игре участвуют два игрока.
- Игра называется множественной , если в игре участвуют больше двух игроков.
- Игра называется с нулевой суммой , если каждый игрок выигрывает за счет других, а сумма выигрыша и проигрыша одной стороны равны другой.
- Парная игра с нулевой суммой называется антагонистической игрой.
- Игра называется конечной , если у каждого игрока имеется только конечное число стратегий. В противном случае - игра бесконечная.
- Одношаговые игры, когда игрок выбирает одну из стратегий и делает один ход.
- В многошаговых играх игроки для достижения своих целей делают ряд ходов, которые могут ограничиваться правилами игры или могут продолжаться до тех пор, пока у одного из игроков не останется ресурсов для продолжения игры.
- Деловые игры имитируют организационно-экономические взаимодействия в различных организациях и предприятиях. Преимущества игровой имитации перед реальным объектом таковы:
Наглядность последействий принимаемых решений;
Переменный масштаб времени;
Повторение имеющегося опыта с изменением установок;
Переменный охват явлений и объектов.
Элементами игровой модели являются:
- Участники игры.
- Правила игры.
- Информационный массив, отражающий состояние и движение моделируемой системы.
Проведение классификации и группировки игр позволяет для однотипных игр найти общие методы поиска альтернатив в принятии решения, выработать рекомендации по наиболее рациональному образу действий в ходе развития конфликтных ситуаций в различных сферах деятельности.
3.4.2. Постановка игровых задач
Рассмотрим конечную парную игру с нулевой суммой. Игрок А имеет m стратегий (А 1 А 2 А m), а игрок В – n стратегий (В 1 , В 2 Вn). Такая игра называется игрой размерностью m х n. Пусть а ij - выигрыш игрока А в ситуации, когда игрок А выбрал стратегию А i , а игрок В выбрал стратегию В j . Выигрыш игрока в данной ситуации обозначим b ij . Игра с нулевой суммой, следовательно, а ij = - b ij . Для проведения анализа достаточно знать выигрыш только одного из игроков, допустим А.
Если игра состоит только из личных ходов, то выбор стратегии (А i , В j),однозначно определяет исход игры. Если игра содержит также случайные ходы, то ожидаемый выигрыш – это среднее значение (математическое ожидание).
Предположим, что значения а ij известны для каждой пары стратегий(А i , В j). Составим прямоугольную таблицу, строки которой соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В. Эта таблица называется платежной матрицей .
Цель игрока А максимизировать свой выигрыш, а цель игрока В минимизировать свой проигрыш.
Таким образом, платежная матрица имеет вид:
Задача состоит в определении:
1) Наилучшей (оптимальной) стратегии игрока А из стратегий А 1 А 2 А m ;
2) Наилучшей (оптимальной) стратегии игрока В из стратегий В 1 , В 2 Вn.
Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.
3.4.3. Методы решения игровых задач
Принцип минимакса
Проанализируем последовательно каждую стратегию игрока А. Если игрок А выбирает стратегию А 1 , то игрок В может выбрать такую стратегию В j , при которой выигрыш игрока А будет равен наименьшему из чисел a 1j . Обозначим его a 1:
то есть a 1 – минимальное значение из всех чисел первой строки.
Это можно распространить на все строки. Поэтому игрок А должен выбрать ту стратегию, для которой число a i - максимально.
Величина a - гарантированный выигрыш, который может обеспечить себе игрок а при любом поведении игрока В. Величина a называется нижней ценой игры.
Игрок В заинтересован в том, чтобы уменьшить свой проигрыш, то есть обратить выигрыш игрока А в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце и среди них выбрать наименьшее.
Обозначим через b j максимальное значение в каждом столбце:
Наименьшее значение b j обозначим b.
b = min max a ij
b называется верхней границей игры. Принцип, диктующий игрокам выбор игрокам соответствующих стратегий, называется принципом минимакса.
Существуют матричные игры, для которых нижняя цена игры равна верхней, такие игры называются играми с седловой точкой. В этом случае g=a=b называется чистой ценой игры, а стратегии А * i , В * j , позволяющие достичь этого значения - оптимальными. Пара (А * i , В * j)называется седловой точкой матрицы, так как элемент a ij .= g одновременно является минимальным в i-строке и максимальным в j- столбце. Оптимальные стратегии А * i , В * j , и чистая цена являются решением игры в чистых стратегиях, т. е. без привлечения механизма случайного выбора.
Пример 1.
Пусть дана платежная матрица. Найти решение игры, т. е. определить нижнюю и верхнюю цены игры и минимаксные стратегии.
Здесь a 1 =min a 1 j =min(5,3,8,2) =2
a =max min a ij = max(2,1,4) =4
b = min max a ij =min(9,6,8,7) =6
таким образом, нижней цене игры (a=4) соответствует стратегия А 3 .Выбирая эту стратегию, игрок А достигнет выигрыша не менее 4 при любом поведении игрока В. Верхней цене игры (b=6) соответствует стратегия игрока В. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен 4 (a 33).
Пример 2.
Дана платежная матрица. Найти нижнюю и верхнюю цены игры.
a =max min a ij = max(1,2,3) =3
b = min max a ij =min(5,6,3) =3
Следовательно, a =b=g=3. Седловой точкой является пара (А * 3 , В * 3). Если матричная игра содержит седловую точку, то ее решение находится по принципу минимакса.
Решение игр в смешанных стратегиях
Если платежная матрица не содержит седловой точки (aсмешанной стратегией .
Для применения смешанных стратегий требуются следующие условия:
1) В игре отсутствует седловая точка.
2) Игроками используется случайная смесь чистых стратегий с соответствующими вероятностями.
3) Игра многократно повторяется в одних и тех же условиях.
4) При каждом из ходов игрок не информирован о выборе стратегии другим игроком.
5) Допускается усреднение результатов игр.
В теории игр доказано, что любая парная игра с нулевой суммой имеет по крайней мере одно решение в смешанных стратегиях, отсюда следует, что каждая конечная игра имеет цену g. g - средний выигрыш, приходящийся на одну партию, удовлетворяющий условию a<=g<=b . Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии.
Стратегии игроков в их оптимальных смешанных стратегиях называются активными.
Теорема об активных стратегиях.
Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш(или минимальный средний проигрыш), равный цене игры g, независимо от того, какие действия предпринимает другой игрок, если он только не выходит за пределы своих активных стратегий.
Введем обозначения:
Р 1 Р 2 … Р m - вероятности использования игроком А стратегий А 1 А 2 ….. А m ;
Q 1 Q 2 …Q n вероятности использования игроком В стратегий В 1 , В 2….. Вn
Смешанную стратегию игрока А запишем в виде:
А 1 А 2 …. А m
Р 1 Р 2 … Р m
Смешанную стратегию игрока B запишем в виде:
B 1 B 2 …. B n
Зная платежную матрицу А, можно определить средний выигрыш (математическое ожидание) М(А,P,Q):
М(А,P,Q)=S Sa ij Р i Q j
Средний выигрыш игрока А:
a =max minМ(А,P,Q)
Средний проигрыш игрока В:
b = min maxМ(А,P,Q)
Обозначим через Р А * и Q В * векторы, соответствующие оптимальным смешанным стратегиям, при которых выполняется:
max minМ(А,P,Q) = min maxМ(А,P,Q)= М(А,P А * ,Q В *)
При этом выполняется условие:
maxМ(А,P,Q В *) <=maxМ(А,P А * ,Q В *)<= maxМ(А,P А * ,Q)
Решить игру – это означает найти цену игры и оптимальные стратегии.
Геометрический метод определения цены игры и оптимальных стратегий
(Для игры 2Х2)
На оси абсцисс откладывается отрезок длиной 1.Левый конец этого отрезка соответствует стратегии А 1 , правый – стратегии А 2 .
По оси ординат откладываются выигрыши а 11 и а 12 .
По линии, параллельной оси ординат из точки 1 откладываются выигрыши а 21 и а 22 .
Если игрок В применяет стратегию В 1 , то соединяем точки а 11 и а 21 , если – В 2, то – а 12 и а 22 .
Средний выигрыш изображается точкой N, точка пересечения прямых В 1 В 1 и В 2 В 2 .Абсцисса этой точки равна Р 2 , а ордината цене игры - g.
По сравнению с прежней технологией выигрыш составляет 55%.