Как стратегия на основе теории игр улучшает процесс принятия решений

Теория игр, изучающая процесс принятия стратегических решений, объединяет разрозненные дисциплины, такие как математика, психология и философия. Теория игр была изобретена Джоном фон Нейманом и Оскаром Моргенштерном в 1944 году и с тех пор прошла долгий путь. О важности теории игр для современного анализа и принятия решений можно судить по тому факту, что с 1970 года 12 ведущих экономистов и ученых были удостоены Нобелевской премии по экономическим наукам за их вклад в теорию игр.

Теория игр применяется во многих областях, включая бизнес, финансы, экономику, политологию и психологию. Понимание стратегий теории игр — как популярных, так и некоторых относительно менее известных уловок — важно для улучшения навыков рассуждения и принятия решений в сложном мире.

Ключевые выводы

  • Теория игр — это основа для понимания выбора в ситуациях между конкурирующими игроками.
  • Теория игр может помочь игрокам достичь оптимального принятия решений, когда они сталкиваются с независимыми и конкурирующими субъектами в стратегической обстановке.
  • Распространенной формой «игры», которая появляется в экономических и деловых ситуациях, является дилемма заключенного, когда отдельные лица, принимающие решения, всегда имеют стимул сделать выбор таким образом, который создает менее чем оптимальный результат для отдельных лиц как группы.
  • Существует несколько других форм игры. Практическое применение этих игр может быть ценным инструментом для анализа отраслей, секторов, рынков и любого стратегического взаимодействия между двумя или более участниками.

Дилемма заключенного

Одна из самых популярных и основных стратегий теории игр — дилемма заключенного. Эта концепция исследует стратегию принятия решений, принятую двумя людьми, которые, действуя в своих личных интересах, в конечном итоге получают худшие результаты, чем если бы они изначально сотрудничали друг с другом.

В дилемме заключенного двое подозреваемых, задержанных за преступление, содержатся в разных комнатах и ​​не могут общаться друг с другом. Прокурор информирует подозреваемого 1 и подозреваемого 2 по отдельности, что, если он признается и даст показания против другого, он может быть освобожден, но если он не будет сотрудничать, а другой подозреваемый сделает это, он будет приговорен к трем годам тюремного заключения. Если оба признаются, они будут приговорены к двум годам лишения свободы, а если ни один из них не признается, они будут приговорены к одному году лишения свободы.

Хотя сотрудничество — лучшая стратегия для двух подозреваемых, когда они сталкиваются с такой дилеммой, исследования показывают, что наиболее рациональные люди предпочитают признаться и свидетельствовать против другого человека, чем хранить молчание и рисковать, когда другая сторона признается.

Краткий обзор

Предполагается, что игроки в игре рациональны и будут стремиться максимизировать свои выигрыши в игре.

Дилемма заключенного закладывает основу для передовых стратегий теории игр, среди которых самые популярные:

Соответствующие пенни

Это игра с нулевой суммой, в которой два игрока (назовите их Игрок A и Игрок B) одновременно кладут пенни на стол, при этом выплата зависит от того, совпадают ли пенни. Если оба пенни — орел или решка, игрок A выигрывает и сохраняет пенни игрока B. Если они не совпадают, игрок B выигрывает и сохраняет пенни игрока A.

Тупик

Это сценарий социальной дилеммы, такой как дилемма заключенного, в которой два игрока могут либо сотрудничать, либо дезертировать (то есть не сотрудничать). В тупике, если игрок A и игрок B оба сотрудничают, каждый из них получает выигрыш 1, а если они оба отказываются, каждый получает выигрыш 2. Но если игрок A сотрудничает, а игрок B отказывается, то A получает выплату. 0 и B получает выигрыш 3. На приведенной ниже диаграмме выплат первая цифра в ячейках (a) — (d) представляет выигрыш игрока A, а вторая цифра — выигрыш игрока B:

Тупик отличается от дилеммы заключенного тем, что действие с наибольшей взаимной выгодой (то есть оба недостатка) также является доминирующей стратегией. Доминирующая стратегия для игрока определяется как та, которая дает самый высокий выигрыш из всех доступных стратегий, независимо от стратегий, используемых другими игроками.

Часто упоминаемый пример тупика — это попытка двух ядерных держав достичь соглашения об уничтожении своих арсеналов ядерных бомб. В этом случае сотрудничество подразумевает соблюдение соглашения, а дезертирство означает тайный отказ от соглашения и сохранение ядерного арсенала. К сожалению, лучший выход для любой из стран — это отказаться от соглашения и сохранить ядерный вариант, в то время как другая нация ликвидирует свой арсенал, поскольку это даст первой огромное скрытое преимущество перед вторым, если между ними когда-либо вспыхнет война. Второй лучший вариант для обеих сторон — отказаться от сотрудничества или отказаться от сотрудничества, поскольку это сохраняет их статус ядерных держав.

Конкурс Курно

Эта модель также концептуально похожа на дилемму заключенного и названа в честь французского математика Огюстена Курно, который представил ее в 1838 году. Наиболее распространенное применение модели Курно — описание дуополии или двух основных производителей на рынке.

Например, предположим, что компании A и B производят идентичный продукт и могут производить большие или маленькие количества. Если они оба будут сотрудничать и соглашаться производить на низком уровне, то ограниченное предложение приведет к высокой цене продукта на рынке и значительной прибыли для обеих компаний. С другой стороны, если они дефектят и производят на высоком уровне, рынок будет захламлен, что приведет к низкой цене продукта и, следовательно, к снижению прибыли для обоих. Но если один сотрудничает (т. Е. Производит на низком уровне), а другой — дефект (т.е. тайно производит на высоком уровне), то первый просто выходит на уровень безубыточности, в то время как второй получает более высокую прибыль, чем если бы они оба сотрудничали.

Показана матрица выплат для компаний A и B (цифры представляют прибыль в миллионах долларов). Таким образом, если A сотрудничает и производит на низком уровне, в то время как B производит дефекты и производит на высоком уровне, выигрыш будет таким, как показано в ячейке (b) — безубыточность для компании A и 7 миллионов долларов прибыли для компании B.

Координационная игра

При согласовании игроки получают более высокие выплаты, если выбирают тот же образ действий.

В качестве примера рассмотрим двух технологических гигантов, которые выбирают между внедрением радикально новой технологии в микросхемах памяти, которая может принести им сотни миллионов прибыли, или пересмотренной версией старой технологии, которая принесет им гораздо меньше. Если только одна компания решит внедрить новую технологию, степень ее принятия потребителями будет значительно ниже, и в результате она будет зарабатывать меньше, чем если бы обе компании приняли одинаковый курс действий. Матрица выплат приведена ниже (цифры представляют прибыль в миллионах долларов).

Таким образом, если обе компании решат внедрить новую технологию, они будут зарабатывать по 600 миллионов долларов за штуку, а внедрение обновленной версии старой технологии принесет им по 300 миллионов долларов каждая, как показано в ячейке (d). Но если компания A решит самостоятельно внедрить новую технологию, она заработает всего 150 миллионов долларов, даже если компания B заработает 0 долларов (предположительно, потому что потребители могут не захотеть платить за ее устаревшую технологию). В этом случае обеим компаниям имеет смысл работать вместе, а не по отдельности.

Сороконожка игра

Это обширная игра, в которой два игрока поочередно получают шанс получить большую долю из медленно увеличивающегося денежного фонда. Игра сороконожка последовательна, поскольку игроки делают ходы один за другим, а не одновременно; Каждый игрок также знает стратегии, выбранные игроками, игравшими до него. Игра завершается, как только игрок берет тайник, причем этот игрок получает большую часть, а другой игрок — меньшую часть.

В качестве примера предположим, что игрок А идет первым и должен решить, должен ли он «взять» или «передать» тайник, который в настоящее время составляет 2 доллара. Если он берет, то A и B получают по 1 доллару каждый, но если A проходит, решение о принятии или пасе теперь должно быть принято игроком B. Если B берет, он получает 3 доллара (т. Е. Предыдущий тайник в размере 2 + 1 доллар) и A получает 0 долларов. Но если B проходит, A теперь решает, брать или пасовать, и так далее. Если оба игрока всегда решают пасовать, каждый из них получает выплату в размере 100 долларов в конце игры.

Смысл игры в том, что если A и B оба сотрудничают и продолжают пасовать до конца игры, они получают максимальную выплату в размере 100 долларов каждый. Но если они не доверяют другому игроку и ожидают, что они «возьмут» при первой возможности,  равновесие по Нэшу предсказывает, что игроки получат наименьшее возможное требование (в данном случае 1 доллар). Однако экспериментальные исследования показали, что такое «рациональное» поведение (предсказываемое теорией игр) редко проявляется в реальной жизни. Это неудивительно, учитывая крошечный размер начальной выплаты по сравнению с последней. Подобное поведение подопытных также проявлялось в дилемме путешественника.

Дилемма путешественника

Эта игра с ненулевой суммой, в которой оба игрока пытаются максимизировать свои выплаты независимо от друг друга, была изобретена экономистом Каушиком Басу в 1994 году. Например, в дилемме путешественника авиакомпания соглашается выплатить двум путешественникам компенсацию за повреждение идентичных предметов. Тем не менее, два путешественника должны отдельно оценить стоимость предмета, минимум 2 и максимум 100 долларов. Если оба запишут одинаковую стоимость, авиакомпания возместит каждому из них эту сумму. Но если значения различаются, авиакомпания заплатит им меньшую стоимость с бонусом в 2 доллара для путешественника, записавшего это меньшее значение, и штрафом в 2 доллара для путешественника, записавшего более высокое значение.

Уровень равновесия по Нэшу, основанный на обратной индукции, в этом сценарии равен 2 долларам. Но, как и в игре с сороконожкой, лабораторные эксперименты постоянно демонстрируют, что большинство участников, наивно или нет, выбирают число, намного превышающее 2 доллара.

Дилемма путешественника может применяться для анализа множества реальных жизненных ситуаций. Процесс обратной индукции, например, может помочь объяснить, как две компании, участвующие в беспощадной конкуренции, могут неуклонно снижать цены на продукцию, стремясь получить долю рынка, что может привести к тому, что они несут все большие убытки в этом процессе.

Битва полов

Это еще одна форма координационной игры, описанная ранее, но с некоторой асимметрией выигрыша. По сути, это связано с тем, что пара пытается скоординировать свой вечер. Хотя они договорились встретиться либо на игре с мячом (предпочтение мужчины), либо на игре (предпочтение женщины), они забыли то, что решили, и, что усугубляет проблему, не могут общаться друг с другом. Куда им идти? Матрица выплат показана ниже с цифрами в ячейках, представляющими относительную степень удовольствия от мероприятия для женщины и мужчины, соответственно. Например, ячейка (а) представляет собой выигрыш (с точки зрения уровней удовольствия) для женщины и мужчины в игре (ей это нравится намного больше, чем ему). Ячейка (d) — это выигрыш, если оба доберутся до игры с мячом (ему это нравится больше, чем ей). Ячейка (c) представляет собой неудовлетворенность, если оба отправляются не только в неправильное место, но и на мероприятие, которое им нравится меньше всего — женщина играет в мяч, а мужчина — в игру.

Диктаторская игра

Это простая игра, в которой игрок A должен решить, как разделить денежный приз с игроком B, который не участвует в принятии решения игроком A. Хотя сама по себе эта стратегия не является теорией игр, она дает некоторые интересные сведения о поведении людей. Эксперименты показывают, что около 50% держат все деньги при себе, 5% делят их поровну, а остальные 45% дают другому участнику меньшую долю. Игра в диктатор тесно связана с игрой в ультиматум, в которой Игроку А дается определенная сумма денег, часть которой должна быть отдана Игроку Б, который может принять или отклонить данную сумму. Загвоздка в том, что если второй игрок отклоняет предложенную сумму, ни A, ни B ничего не получают. Игры с диктатором и ультиматумом преподают важные уроки для таких вопросов, как благотворительность и филантропия.

Мир-война

Это разновидность дилеммы заключенного, в которой решения «сотрудничать или отступать» заменяются «миром или войной». В качестве аналогии можно привести две компании, ценовая война резко снизит выплаты (ячейка d). Однако, если A участвует в снижении цен (т. Е. «Войне»), а B — нет, A будет иметь более высокий выигрыш в размере 4, поскольку он может захватить значительную долю рынка, и этот более высокий объем будет компенсировать более низкие цены на продукцию.

Дилемма волонтера

В дилемме волонтера кто-то должен взять на себя рутинную работу или работу для общего блага. Наихудший возможный исход будет реализован, если никто не станет добровольцем. Например, рассмотрим компанию, в которой широко распространено мошенничество в области бухгалтерского учета, но высшее руководство не подозревает об этом. Некоторые младшие сотрудники бухгалтерии знают о мошенничестве, но не решаются сообщить об этом высшему руководству, потому что это приведет к увольнению сотрудников, причастных к мошенничеству, и, скорее всего, к судебному преследованию.

Признание разоблачителем  также может иметь определенные последствия в будущем. Но если никто не станет добровольцем, крупномасштабное мошенничество может привести к банкротству компании и потере всех рабочих мест.

Часто задаваемые вопросы

В какие «игры» играют в теории игр?

Это называется теорией игр, поскольку теория пытается понять стратегические действия двух или более «игроков» в данной ситуации, содержащей установленные правила и результаты. Хотя теория игр используется во многих дисциплинах, она чаще всего используется в качестве инструмента при изучении бизнеса и экономики. Таким образом, «игры» могут включать в себя то, как две конкурирующие фирмы отреагируют на снижение цен другой, если одна фирма приобретет другую, или как трейдеры на фондовом рынке могут отреагировать на изменение цен. Теоретически эти  игры можно разделить на категории,  похожие на дилеммы заключенного, игру диктатора, ястреба и голубя и битву полов, а также несколько других разновидностей.

Чему учит нас дилемма заключенного?

Дилемма заключенного показывает, что простое сотрудничество не всегда отвечает его интересам. Фактически, при покупке дорогостоящего предмета, такого как автомобиль, торг — это предпочтительный образ действий с точки зрения потребителей. В противном случае автосалон может придерживаться политики негибкости в переговорах о ценах, максимизируя свою прибыль, но в результате потребители будут переплачивать за свои автомобили. Понимание относительной выгоды сотрудничества и отказа может побудить вас вступить в серьезные  переговоры о цене,  прежде чем совершить крупную покупку.

Что такое равновесие по Нэшу в теории игр?

Равновесие по Нэшу в теории игр — это ситуация, в которой игрок будет продолжать придерживаться своей выбранной стратегии, не имея стимула отклоняться от нее, после принятия во внимание стратегии противника.

Как компании могут использовать теорию игр, соревнуясь друг с другом?

Конкуренция Курно, например, представляет собой экономическую модель, описывающую структуру отрасли, в которой конкурирующие компании, предлагающие идентичный продукт, конкурируют за объем производимой продукции, независимо и в то же время. По сути, это дилемма заключенного.

Суть

Теорию игр можно очень эффективно использовать в качестве инструмента для принятия решений, будь то в состязательной, деловой или личной обстановке.