ВОЛШЕБНЫЕ КОВРЫ
Настоящие империи развиваются и гибнут не только во времени, но и в пространстве. Когда-то границы Римской империи простирались от Португалии до Черного моря и от Шотландии до Северной Африки. Империя Карла Великого включала в себя Францию, Германию, Италию и Балканы, а Оттоманская империя простиралась от Трансильвании до Египта. История человечества описывается географическими картами с причудливо изменяющимися во времени границами. Эпоха империй давно кончилась, но нынешние границы НАТО и Европы продолжают смещаться, а карта Восточной Европы за последнее десятилетие изменилась сильнее, чем за весь предшествующий период после Второй мировой войны. Естественно, многих исследователей заинтересовал вопрос, нельзя ли использовать «Дилемму заключенного» для лучшего понимания очень сложных проблем, связанных с изменениями национальных и региональных границ?
С математической точки зрения введение элементов пространства в теорию игр является нетривиальной задачей, поскольку оно накладывает ограничения на возможность взаимодействия игроков, что, в свою очередь, может серьезно повлиять на конечный результат. В описанных ранее компьютерных турнирах все игроки встречались друг с другом, и, например, кооператоры извлекали совместную выгоду из сотрудничества. Но если такие игроки разнесены в пространстве, то они не могут черпать силы в обоюдном сотрудничестве и оказываются бессильными перед натиском соседей-обманщиков. Таким образом, пространственная изоляция сама по себе может работать против сотрудничества. Например, кажется очевидным, что именно географическая изолированность Израиля в кольце враждебных исламских государств во многом способствует тому, что его граждане рассматривают свою страну в качестве осажденной крепости и считают, что из-за этого она не может проводить миролюбивую политику, которую могут позволить себе европейские державы.
Очевидно, что игроки с фиксированным расположением должны быть принуждаемы к сотрудничеству самими обстоятельствами расположения, которые диктуют им необходимость постоянных контактов с одними и теми же игроками. Круговые турниры, где каждый встречается с каждым, можно рассматривать как аналог непрерывной миграции. Главной проблемой путешествующих людей является то, что у них мало возможностей для установления истинно доверительных отношений с попутчиками. Над ними не довлеет «тень будущего», недостаточно длинная и накрывающая только постоянных соседей.
Возможности применения «Дилеммы заключенного» к проблемам формирования границ между государствами первым начал рассматривать Аксельрод в начале 1980-х годов. Он предложил модель, где каждый игрок в исходном состоянии занимает одну клетку на доске типа шахматной (или одну ячейку на регулярной решетке) и взаимодействует лишь с четырьмя ближайшими соседями. После каждого раунда, включающего игры со всеми соседями, игроки «эволюционировали» — меняли свои стратегии на более успешные, исходя из лучшего результата среди соседей.
Вначале Аксельрод хотел применить эту плоскостную модель для изучения конкретных ситуаций, связанных с распределением стратегий. Подход позволяет визуально моделировать процессы захвата, обороны, образования границ и т.д., что представлялось интересным и наглядным. Аксельроду удалось показать, что при некоторых значениях размера выигрыша даже один обманщик способен распространить свое влияние на все сообщество TFT-игроков, т.е. навязать всем игрокам новый тип стратегий, основанных на обмане. Интересно, что образующиеся при этом колонии обманщиков имеют правильную и довольно сложную геометрическую форму, напоминающую снежинки (рис. 18.3).

Используя различные комбинации стратегий, можно было бы построить огромное количество разнообразных колоний, но Аксельрод выбрал иной подход. Он просто распределил случайным образом 252 игрока (каждые четыре со своей стратегией, итого 63 разных стратегии) на решетке размером 14х18, дал им возможность взаимодействовать с четырьмя ближайшими соседями, а затем проследил эволюцию всей системы. В процессе игры все «противные», склонные к обману стратегии постепенно погибали, а решетка оказывалась заполненной несколькими типами игроков с «приятными» стратегиями. При этом устанавливалось равновесие: поскольку все игроки сотрудничают друг с другом, никто не выигрывает и не проигрывает, и границы сохраняются.
Интересно, что стратегия TFT (номер 1) не является доминирующей на решетке, хотя именно она выходила победительницей при организации турниров по круговой системе. Этот факт можно считать твердо установленным, поскольку игра проводилась многократно (с различным исходным распределением игроков), и во всех случаях возникали значительные территории, занятые другими стратегиями (одно из таких распределений приведено на рис. 18.4). В игре на плоскости выживали и менее успешные стратегии, занимавшие в круговом турнире низкие места, что объясняется удачным начальным распределением, когда в ближайшие соседи к ним попадают менее эффективные игроки. Для объяснения низкого результата игроков со стратегией TFT стоит напомнить, что она побеждает в круговом турнире по общему числу очков, а в конкретных ситуациях не выглядит агрессивной и напористой, по сути, стратегия TFT не стремится захватывать территории, уже занятые «приятными» стратегиями, а лишь вытесняет обманщиков.

Разумеется, результаты можно интерпретировать как еще одно доказательство отсутствия «абсолютно» победной стратегии в играх такого типа, которые в данном случае можно считать аналогией отношений между нациями. Более того, конечное распределение всегда зависит от исходного, случайного распределения положений игроков, что вновь напоминает нам о ситуациях, когда история процесса сама является фактором развития.
В 1992 году Мартин Новак и Роберт Мэй из Оксфордского университета придумали еще один, более простой вариант пространственной игры, связанной с сотрудничеством игроков. В их модели было только два типа игроков: беспринципные обманщики и убежденные кооператоры. Но игрок мог менять свою «ориентацию», если это сулило ему выгоду. Игра проводилась на квадратной решетке, каждый игрок мог взаимодействовать с восемью ближайшими соседями — к четырем соседям по граням ячейки добавлялись четыре на вершинах. Игрок менял стратегию в соответствии с наилучшими результатами, достигнутыми собой и этими соседями, то есть становился кооператором или обманщиком, подчиняясь ближайшему окружению. В некотором смысле эта картина напоминает описанную в главе 5 решеточную модель Изинга взаимодействующих частиц в статистической физике, способных находиться в двух энергетических состояниях.
Характер игры, естественно, во многом зависит от размера выигрыша, т.е. от вознаграждения, которое игрок имеет шанс получить при правильном выборе между сотрудничеством или обманом ожиданий партнера. Незначительность выигрыша при обмане по сравнению с сотрудничеством способствует сотрудничеству, но и в этом случае остается определенная группа обманщиков, покрывающая сетью всю решетку (рис. 18.5, а). При значительном выигрыше обман становится основной стратегией игры, хотя и в этом случае на решетке возникают и исчезают островки территорий, образованных сотрудничающими игроками (рис. 18.5, б). Доля кооператоров при этом быстро достигает постоянного среднего значения, не зависящего от исходных условий и конфигурации, что подтверждает мысль, что в обществе всегда найдется небольшая часть неукротимых и неугомонных кооператоров, способных функционировать даже в условиях крайнего эгоизма окружающих. Таким образом, общая картина остается довольно сложной: кооператоры и обманщики вовсе не уничтожают друг друга, а продолжают сосуществовать в системе сколь угодно долго, образуя паттерны, которые различаются в деталях, но имеют вполне предсказуемые усредненные характеристики.

Рис. 18.5. Состояния, описывающие эволюцию системы из безусловных кооператоров (черные точки) и безусловных обманщиков (серые точки), очень сильно зависят от размера выигрыша при обмане по сравнению с сотрудничеством. При малом выигрыше доминирует сотрудничество (а). (Здесь белые точки соответствуют «перебежчикам» из кооператоров в обманщики в последнем раунде, т. е. эти точки указывают направления смещения границ.) При увеличении выигрыша при обмане картина меняется, и обманщики начинают доминировать, хотя островки кооператоров возникают и исчезают по всей решетке (б). Одинокий обманщик может эксплуатировать целое сообщество кооператоров, постепенно создавая сообщество обманщиков. В силу взаимного отталкивания обманщики не могут образовывать целостные структуры, а создают лишь разреженный узор (в)
Процессы распространения областей обмана и сотрудничества значительно различаются. Кооператоры лучше работают в плотных кластерах, извлекая прибыль из взаимного доверия и поддержки, что заставляет вспомнить об Эдмунде Берке, который еще в 1770-х годах писал: «Хорошие люди должны объединяться перед лицом союза дурных людей, для того, чтобы не погибнуть один за другим в безжалостной борьбе»3. Обманщикам гораздо выгоднее действовать в среде кооператоров, а не в среде подобных себе жуликов. Обман порождает обман, но и доверие порождает доверие, в результате чего обманываемые поддерживают друг друга, сообщество обманщиков представляет собой тонкую сеть, наброшенную на островки сотрудничества.
Новак и Мэй показали, что распространение стратегии обмана при появлении одного обманщика в колонии кооператоров создает на решетке картину (рис. 18.5, в), весьма напоминающую симметричные фигуры, полученные ранее Аксельродом. Мы вновь видим «волшебные ковры» со странными узорами, которые возникают в результате «отталкивания» между самими обманщиками, что не позволяет им создавать плотные структуры. Каждый обманщик предпочитает обрабатывать собственную «делянку», удаленную как можно дальше от его сотоварищей.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОК