0

Теория игр

Теория игр — это математическая теория стратегий, которая предполагает, что есть минимум два игрока и результат игры определяется их выбором. Если среди игроков есть конфликт предпочтений, этот конфликт не обязательно должен быть тотальным. В отличие от спортивных игр, если один игрок выигрывает, то другой не обязательно оказывается проигравшим. Конфликт интересов может быть частичным, и оба игрока могут выигрывать и проигрывать одновременно. Теория игр фокусируется на равновесных стратегиях игроков.

Слово «игра» не должно вводить в заблуждение. Это понятие в теории игр трактуется шире, чем в повседневной жизни. Ситуация стратегического взаимодействия может быть описана в виде модели, которую и называют игрой. Таким образом, в теории игр игрой будет считаться не только игра в шахматы, но и голосование в Совете Безопасности ООН, и торг продавца с покупателем на рынке.

История исследований

Теорию игр придумали венгерский математик Джон фон Нейман и немецкий экономист Оскар Моргенштерн, которые в конце 1930-х годов переехали в США. Они встретились в Институте перспективных исследований Принстонского университета в 1940-х годах и написали книгу «Теория игр и экономическое поведение» (1944). Книга была переиздана в 1947 и в 1953 годах.

До этого, в 1928 году, Джон фон Нейман написал статью, в которой вывел теорему о минимаксе, считающуюся фундаментальной в теории игр. В Принстоне он работал с Моргенштерном над тем, чтобы применить теорию игр к экономике, а также к салонным играм вроде покера.

В своей книге фон Нейман и Моргенштерн смоделировали упрощенную версию покера и проанализировали оптимальные стратегии, которые выбирают игроки. Но спустя годы многие люди нашли их идеи полезными для экономики, биологии и в особенности для политологии. Более того, теория игр стала применяться в спорте и даже в таких дисциплинах, как философия. Теория игр предлагает структуру принятия решений и в условиях конфликта, и в условиях сотрудничества для игр, в которых два игрока или более.

Другие ученые также внесли немалый вклад в развитие теории игр. Среди них — Джон Нэш, который знаменит благодаря равновесию Нэша, и несколько математиков и экономистов, которые в разное время получили Нобелевскую премию по экономике за свои труды.

Равновесие Нэша

Равновесие Нэша определяется как исход, в котором есть два игрока, и ни один из игроков не отказывается от своей стратегии, потому что иначе он пострадает. Но это не означает обязательное наличие выгодного исхода для обоих игроков. Есть знаменитая игра, которая называется «Дилемма заключенного». В этой игре два игрока выбирают оптимальные стратегии, но результат получается не совсем выгодным для обоих. Есть более выгодный исход для обоих игроков, но этот исход нестабилен, и он не находится в равновесии Нэша. Появляется конфликт между выбором оптимальной стратегии и получением наилучшего результата.

Рассмотрим другие игры на предмет равновесия. Например, в «Камне, ножницах, бумаге» нет равновесия по Нэшу: во всех ее вероятных исходах нет варианта, в котором оба участника были бы довольны своим выбором. Тем не менее, существует Чемпионат мира и World Rock Paper Scissors Society, собирающее игровую статистику. Очевидно, что вы можете повысить свои шансы на победу, если будете что-то знать об обычном поведении людей в этой игре.

По данным World RPS Society, камень является самым часто выбираемым ходом (37,8%). Бумагу ставят 32,6%, ножницы — 29,6%. Теперь вы знаете, что нужно выбирать бумагу. Однако, если вы играете с тем, кто тоже это знает, вам уже не надо выбирать бумагу, потому что от вас ожидается то же самое. Есть знаменитый случай: в 2005 году два аукционных дома Sotheby“s и Christie”s решали, кому достанется очень крупный лот — коллекция Пикассо и Ван Гога со стартовой ценой в 20 миллионов долларов. Собственник предложил им сыграть в «Камень, ножницы, бумагу», и представители домов отправили ему свои варианты по электронной почте. Sotheby“s, как они позже рассказали, особо не задумываясь, выбрали бумагу. Выиграл Christie”s. Принимая решение, они обратились к эксперту — 11-летней дочери одного из топ-менеджеров. Она сказала: «Камень кажется самым сильным, поэтому большинство людей его выбирают. Но если мы играем не с совсем глупым новичком, он камень не выбросит, будет ожидать, что это сделаем мы, и сам выбросит бумагу. Но мы будем думать на ход вперед, и выбросим ножницы».

Таким образом, вы можете думать на ход вперед, но это не обязательно приведет вас к победе, ведь вы можете не знать о компетенции вашего соперника. Поэтому иногда вместо чистых стратегий правильнее выбирать смешанные, то есть принимать решения случайно. Так, в «Камне, ножницах, бумаге» равновесие, которое мы до этого не нашли, находится как раз в смешанных стратегиях: выбирать каждый из трех вариантов хода с вероятностью в одну третью. Если вы будете выбирать камень чаще, соперник скорректирует свой выбор. Зная это, вы скорректируете свой, и равновесия не выйдет. Но никто из вас не начнет менять поведение, если каждый просто будет выбирать камень, ножницы или бумагу с одинаковой вероятностью. Все потому что в смешанных стратегиях по предыдущим действиям невозможно предугадать ваш следующий ход.

Дилемма заключенного

История о дилемме заключенного следующая. Два преступника находятся в раздельных камерах. Каждого спрашивают, виновен ли он в определенном преступлении. Если оба признают, что виновны, каждый получит относительно тяжелое наказание — скажем, пять лет тюремного заключения. Но если оба откажутся признать вину, то получат относительно хороший результат — например, один год тюремного заключения. Но если один заключенный признает вину, а другой не признает, то результат будет очень печальным для того, кто признал вину, — десять лет в тюрьме. Его признают виновным, а второй преступник выйдет на свободу за то, что помог определить настоящего виновного.

Оба заключенных получают относительную выгоду (кооперативный исход — 1 год в тюрьме), если никто не сознается. Но у каждого есть соблазн предать другого заключенного. Если один признается, а другой нет, тот, что признался, избежит наказания, в то время как второй получит 10 лет лишения свободы. Но если оба признаются, то им тоже будет плохо (некооперативная игра — 5 лет лишения свободы). Это и называется дилеммой. Непонятно, что должны делать заключенные: должны ли они выбрать некооперативную игру и сознаться или они должны попытать удачу и не признаваться, сильно рискуя?

Кажется, что самое разумное решение для игроков — сотрудничество. Но это нестабильный исход, потому что у каждого игрока есть стимул не сотрудничать, а, наоборот, предать другого игрока. Хороший пример такой дилеммы — гонка вооружений между Советским Союзом и США в 1950–1990-х годах. В течение 45 лет две страны вели некооперативную игру, тратили много денег на вооружение, чтобы обойти другую сторону. Обе страны выиграли бы от того, чтобы не тратить столько средств на вооружение, а потратить их на социально полезные блага. Но каждая страна не доверяла другой, поэтому обе стороны продолжали производить оружие, и никто от этого не выигрывал.

Сommitment device

Во многих ситуациях одному из участников игры может понадобиться инструмент, который убедит остальных, что тот не блефует. Он называется commitment device. Например, закон некоторых стран запрещает платить выкуп похитителям людей, чтобы снизить мотивацию преступников. Однако это законодательство часто не работает. Если вашего родственника захватили, и у вас есть возможность спасти его, обойдя закон, вы это сделаете. Представим ситуацию, что закон можно обойти, но родственники оказались бедными и выкуп им платить нечем. У преступника в этой ситуации два пути: отпустить или убить жертву. Убивать он не любит, но тюрьму он не любит больше. Отпущенный пострадавший, в свою очередь, может либо дать показания, чтобы похититель был наказан, либо молчать. Самый лучший исход для преступника: отпустить жертву, которая его не сдаст. Жертва же хочет быть отпущенной и дать показания.

Равновесие здесь в том, что террорист не хочет быть пойманным, а значит, жертва погибает. Существует вариант, при котором всем лучше — жертва на свободе хранит молчание. Но для этого надо сделать так, чтобы молчать ей было выгодно. Где-то я прочитал вариант, когда она может попросить террориста устроить эротическую фотосессию. Если преступника посадят, его подельники выложат фотографии в интернет. Теперь, если похититель останется на свободе — это плохо, но фотографии в открытом доступе — еще хуже, поэтому получается равновесие. Для жертвы это способ остаться в живых.

Другие модели и эффекты:

  • Модель Бертрана

Раз уж мы говорим об экономике, рассмотрим экономический пример. В модели Бертрана два магазина продают один и тот же товар, покупая его у производителя по одной цене. Если цены в магазинах одинаковы, то примерно одинакова и их прибыль, ведь тогда покупатели выбирают магазин случайно. Единственное равновесие по Нэшу здесь — продавать товар по себестоимости. Но магазины хотят зарабатывать. Поэтому если один поставит цену 10 рублей, второй снизит ее на копейку, увеличив тем самым свою выручку вдвое, так как к нему уйдут все покупатели. Поэтому участникам рынка выгодно снижать цены, распределяя тем самым прибыль между собой.

  • Разъезд на узкой дороге

Рассмотрим примеры выбора между двумя возможными равновесиями. Представьте, что Петя и Маша едут навстречу друг другу по узкой дороге. Дорога настолько узкая, что им обоим нужно съехать на обочину. Если они решат повернуть налево или направо от себя, они просто разъедутся. Если же один повернет направо, а другой налево от себя, или наоборот, случится авария. Как выбрать, куда съехать? Чтобы помогать искать равновесие в подобных играх, существуют, например, правила дорожного движения. В России каждому нужно повернуть направо.

В забаве Chiken, когда два человека едут на большой скорости навстречу друг другу, тоже есть два равновесия. Если оба сворачивают на обочину, возникает ситуация, которая называется Chiken out, если оба не сворачивают, то погибают в страшной аварии. Если я знаю, что мой соперник едет прямо, мне выгодно съехать, чтобы выжить. Если я знаю, что мой соперник съедет, то мне выгодно ехать прямо, чтобы после получить 100 долларов. Сложно предсказать, что случится на самом деле, однако, у каждого из игроков есть свой метод выиграть. Представьте, что я закрепил руль так, что его нельзя повернуть, и показал это своему сопернику. Зная, что у меня нет выбора, соперник отскочит.

  • QWERTY-эффект

Иногда бывает очень сложно перейти из одного равновесия в другое, даже если оно означает пользу для всех. Раскладка QWERTY была создана, чтобы замедлить скорость печати. Поскольку если бы все печатали слишком быстро, головки печатной машинки, которые бьют по бумаге, цеплялись бы друг за друга. Поэтому Кристофер Шоулз разместил часто стоящие рядом буквы на максимально далеком расстоянии. Если вы зайдете в настройки клавиатуры на своем компьютере, вы сможете выбрать там раскладку Dvorak и печатать гораздо быстрее, так как сейчас нет проблемы аналоговых печатных машин. Дворак рассчитывал, что мир перейдет на его клавиатуру, но мы по-прежнему живем с QWERTY. Конечно, если бы мы перешли на раскладку Дворака, будущее поколение было бы нам благодарно. Все мы приложили бы усилия и переучились, в результате вышло бы равновесие, в котором все печатают быстро. Сейчас мы тоже в равновесии — в плохом. Но никому не выгодно быть единственным, кто переучится, потому что за любым компьютером, кроме личного, работать будет неудобно.

Источник: Телеграм Канал «НЕискусственный интеллект»

Теория игр в экономике (бонус)

Ана

Добавить комментарий