ПОД УПРАВЛЕНИЕМ РАЗУМА?
Стратегия TFT и ее более продвинутые варианты позволяют нам понять процесс развития сотрудничества внутри сообществ. И хотя после внедрения сотрудничества стратегия TFT может смениться как более «приятными» стратегиями, так и оппортунистическим «Павловым», до сих пор не придумано ничего лучше для инициирования сотрудничества в жестоком мире Гоббса, чем принцип «зуб за зуб».
С этой точки зрения для западного общественного мнения кажутся естественными любые жесткие действия против «плохих парней» типа бомбардировки Белграда или вторжения в Ирак. Карл Поппер, имеющий репутацию либерала, озвучил эту мысль с шокирующей откровенностью: «То, что происходит в Боснии, является доказательством несостоятельности, малодушия и слепоты Запада. Эти события еще раз продемонстрировали, что мы не усвоили одного из главных уроков этого столетия: война предотвращается войной»4.
Идея «превентивной войны» восходит как минимум к Канту, который отстаивал ее в эссе Вечный мир. Несомненно, превентивные войны были всегда, другое дело, что короли и князья в далеком прошлом не нуждались ни в каких философских обоснованиях военных действий. Анализ стратегий в «Дилемме заключенного» убедительно доказывает, что мягкий или отложенный ответ, например, в варианте «зуб за два зуба», далеко не лучший в смешанных популяциях. Само по себе это говорит в пользу бомбардировок, а не санкций.
Но как мы видели, стратегия «зуб за зуб» имеет свои недостатки. Яркими иллюстрациями этого являются конфликт между палестинцами и израильтянами и ситуация в Северной Ирландии, где подобные ответные действия отбрасывают назад процесс установления мира и сотрудничества и разрушают хрупкое доверие между народами. Для установления каких-то новых отношений между игроками в таких условиях, конечно, необходимо выработать новые правила, подавляющие механизмы эскалации взаимного недоверия. Примерами подобных «умиротворяющих» линий поведения могут служить уже упомянутые стратегии «великодушной» TFT (GTFT), «кающейся» TFT (CTFT) или «умеренной» TFT, в которой наказание чуть менее жестоко, чем вызвавшее его действие.
Вообще говоря, отношения отдельных людей или групп населения складываются по постоянно усложняющейся схеме стратегии TFT. Проблема заключается в том, что при компьютерном моделировании, с которого и начались эти исследования, программы не обладают «злопамятностью», т.е. принимают решения, исходя из действий партнера в последнем раунде. В реальной жйзни отношения формируются по гораздо более сложным механизмам, поскольку люди и общины зачастую десятилетиями находятся в состоянии вражды и отсутствия контактов. Отказ от сотрудничества при этом приобретает не только затяжной, но и самовоспроизводящийся характер, когда после любого конфликта восстановление контактов становится почти невозможным. В качестве наглядного примера можно привести отношения между разведенными супругами. Недавно в США рассматривалась возможность лишения разведенных отцов права видеться со своими детьми, если эти отцы не оплачивают (по разным причинам) расходы по их воспитанию. Не вдаваясь в экономические аспекты проблемы, легко понять, что любое судебное решение такого рода провоцирует в будущем множество семейных конфликтов в следующих поколениях. Другой вариант — выплата алиментов автоматически прекращается при ограничении возможностей общения с детьми — также приводит к взаимным обидам и недоразумениям. Дети становятся разменной монетой в конфликте родителей. Судьи и сами родители проявляют в этих ситуациях крайнюю близорукость, поскольку сиюминутная экономическая выгода в дальнейшем оборачивается неспособностью детей к установлению отношений сотрудничества с другими людьми. Возможно, проявление благоразумного великодушия в таких ситуациях позволило бы избежать множества осложнений в будущем.
От бытовых ситуаций можно легко перейти к глобальным. Проблема доверия вышла на первый план в мировой политике после появления ядерного оружия, когда войны между сверхдержавами стали смертельно опасными для обеих сторон. С другой стороны, мир между странами, обладающими ядерным оружием, оказался возможным лишь при условии полной готовности к нападению противника. Карл Поппер писал по этому поводу: «Мы должны понять, что мир на планете может быть сохранен только военной силой. Даже внутри отдельной страны нельзя обеспечивать мир за счет компромисса с преступниками»5.
Это может быть справедливо для обычных войн, но для атомной войны, особенно с учетом концепции «холодной войны» о гарантированном взаимном уничтожении, жесткая стратегия в духе «зуб за зуб» не является оптимальной. Стратег Герман Кан с обескураживающей откровенностью описывал примеры сумбурного и иррационального мышления, с которыми он сталкивался в «РЭНД Корпорэйшн» в первые годы «холодной войны»:
Во многих своих выступлениях за последние 20-30 лет я предлагал аудитории следующий мысленный эксперименты. Предположим, говорил я, президенту США сообщают, что противник сбросил на Нью-Йорк муль- тимегатонную бомбу. Как он должен реагировать на такое сообщение? В середине 1950-х годов аудитория единодушно отвечала, что президент обязан немедленно «нажать на все кнопки для запуска ракет и идти домой». Далее обычно следовал следующий краткий диалог:
К а н: А что, собственно, произойдет дальше?
Аудитория: Советы, конечно, сделают то же самое!
К а н: А что дальше?
Аудитория:А ничего дальше не будет. Стороны уничтожат друг друга! Кан: Так зачем президенту нажимать на кнопки?
После некоторых споров и размышлений аудитория приходила к выводу, что, возможно, президенту и не следует сразу нажимать на кнопки, приводя в действие чудовищную машину уничтожения всего мира, включая его собственную страну6.
Эту же идею несколько короче выразил политолог Брайан Скирмс: «Нельзя считать правильной стратегию, которая при своем применении приводит к явному нарушению интересов использовавшего ее агента»7. Было бы, конечно, верхом наивности предполагать, что в международной политике игроки следуют правилам строгой логики, подобно программам в описанных идеализированных компьютерных турнирах. Никакая теория так называемого гарантированного ядерного возмездия не позволяет логически понять многие события «холодной войны», и поэтому специалистам-поли- тологам, включая того же Поппера, остается только ожесточенно спорить, действительно ли Хрущев в 1962 году планировал нанести удар по США. По- видимому, сейчас невозможно определить, являлась ли секретная установка ракет на Кубе реальной подготовкой к агрессии или служила разменной монетой в политических отношениях двух стран, но можно быть уверенным, что именно стратегия возмездия создала условия для нарастания кризиса. По тем же причинам практически невозможно объяснить позицию тех деятелей, которые ранее агитировали за одностороннее ядерное разоружение США, а потом стали сторонниками развития стратегической противоракетной обороны, которая подрывает саму идею разоружения. Возможность взаимного уничтожения действительно служит фактором поддержания мира, так что опасность войны может возрасти после того, как из этого условия выпадет слово «взаимного». Мировая политика постоянно демонстрирует нам, что формальная логика теории игр играет весьма незначительную роль в реальных геополитических событиях, развитие которых диктуется идеологией, целесообразностью и хитростью.
Еще одной, очень неприятной особенностью стратегии TFT выступает то, что соперники стараются всячески продемонстрировать друг другу свою непреклонность. Они начинают вести себя подобно уличным хулиганам, непрерывно доказывая готовность к самым решительным действиям, что довольно быстро приводит их к военным авантюрам и «дипломатии канонерок». Например, в худшие времена «холодной войны» США чуть не развязали мировую войну ради демонстрации своей «жесткости» в борьбе с коммунизмом. Это можно проследить по меморандуму8, который в 1960-х годах Джон Макнафтон, заместитель секретаря Совета национальной безопасности, направил министру обороны США Роберту Макнамаре. Перечисляя цели американской политики во Вьетнаме и оценивая их значимость, Макнафтон отмечает, что «на 70% эти цели определяются необходимостью утверждения репутации США как гаранта» (курсив автора книги) и лишь на 10% — «стремлением обеспечить свободу и процветание народа Южного Вьетнама».
Другими словами, стратегия TFT побуждает соперников к воинственности (или хотя бы ее имитации). В то же время неучет возможного жесткого ответа противника может привести к гибельным последствиям. Это в присущей ему сардонической манере изобразил Стэнли Кубрик в своем классическом художественном воплощении реалий «холодной войны». В конце фильма доктор Стренджлав кричит по телефону кому-то из советских руководителей: «Вы идиоты! На кой ляд вам сдалась эта Машина Судного дня, если вы никому не сказали, что она у вас есть!»
Конечно, пока не может быть и речи об использовании результатов игры в «Дилемму заключенного» для выработки политики, прежде всего из-за огромного числа факторов, играющих роль в реальной жизни. Эта игра, как я неоднократно подчеркивал, построена на очень упрощенном представлении о природе человека. С одной стороны, поведение человека в ней предполагается слишком разумным и рациональным, хотя мы прекрасно знаем, что людьми часто управляют иррациональные страсти и побуждения, не говоря уже об элементарной глупости. С другой — эта модель недооценивает положительного влияния моральных принципов на наши поступки и решения. Жизненный опыт и эволюционная биология убедительно демонстрируют, что очень многие люди инстинктивно стремятся к сотрудничеству друг с другом, без всяких доказательств чувствуя необходимость и важность совместных действий. Впрочем, жизнь столь же убедительно показывает, что всегда есть некоторое количество людей, патологически не способных принимать требования общества и постоянно отклоняющих сотрудничество с другими людьми даже в тех случаях, когда необходимость такого сотрудничества представляется очевидной.
Кроме того, ценность теоретических результатов снижается еще и тем обстоятельством, что по условиям игры «заключенные» не имеют возможности переговариваться друг с другом, и им приходится угадывать мотивы поведения партнеров только на основе результатов игры. Такая обстановка способствует развитию подозрительности (даже у компьютерных программ), между тем как в реальной жизни многие проблемы и конфликты решаются именно в результате прямых переговоров и объяснений.
Однако даже с учетом вышесказанного нельзя не признать, что стратегия ответного воздаяния (зло на зло, добро на добро) — лучший путь к установлению сотрудничества. Специалист по теории игр Карл Зигмунд говорит в этой связи:
Конечно, было бы глупым считать, что все огромное разнообразие человеческих отношений и взаимодействий может быть сведено лишь к итеративному варианту игры в «Дилемму заключенного», или отрицать роль высшей власти в цивилизованном обществе. Но при всех этих ограничениях нельзя не заметить и того, что очень простой и жесткий принцип зеркального воздаяния создает в обществе эгоистов мощный стимул к сотрудничеству, в то время как самые возвышенные проповеди и призывы, не сопровождающиеся актами возмездия, лишь разрушают сотрудничество... Иногда кажется, что этот примитивный и грубый закон возмездия лежит в основании многих, или даже всех, устойчивых общественных образований, созданных человечеством9.
Я рискну задать вопрос, который биологу-эволюционисту покажется бессмыслицей или тавтологией: насколько морально такое поведение? Принцип «зуб за зуб» коробит чувствительных либералов. «Приступая к проекту, — писал Роберт Аксельрод в 1984 году, — я чувствовал, что его результаты рано или поздно вызовут у многих гнев и раздражение. Однако я вынужден повторить, что результаты компьютерного турнира программ, играющих в «Дилемму заключенного», действительно доказывают, что наилучшей реакцией на любую провокацию является быстрый симметричный ответ».10
История человечества знает множество пацифистов, от святого Франциска до Ганди, утверждавших, что нельзя отвечать насилием на насилие, поскольку любые насильственные действия разрушают психику человека. К этому же, безусловно, сводится основной смысл Нового Завета, где содержится призыв возлюбить даже врагов и прямо утверждается, что «блаженны кроткие, ибо наследуют землю». Многие пацифисты утверждают, что философия непротивления возникает не из холодных логических построений, а из высших моральных императивов типа библейской заповеди «не убий». Сталкиваясь с реальными проявлениямйжестокости и дикости, такие люди начинают испытывать мучительные сомнения в правоте своих пацифистских воззрений. Добросовестный и беспристрастный историк Второй мировой войны Дэвид Джонс выразил эту дилемму в следующей форме: «Чем больше я узнавал о чудовищных преступлениях немцев, тем больше страданий доставляла мне собственная позиция беспристрастного наблюдателя. Реальную боль приносила даже не война, а необходимость поиска объяснений и оправданий вместо прямого участия в борьбе»11.
Сесил Дэви, родственная душа в том же конфликте, счел этот вопрос неразрешимым:
Вильфред Оуэн говорил, что он быЛ беспристрастным наблюдателем с больной совестью, и мне кажется, что у большинства людей, старающихся быть беспристрастными наблюдателями, начинает болеть совесть. Например, я до сих считаю, что правильно и беспристрастно описывал события Второй мировой войны, то есть я делал то, что считал правильным в тот момент, когда я это делал, но возможно, если бы я знал о Холокосте, мое поведение могло бы измениться.... Жизнь — непростая штука12.
Все так, и «Дилемма заключенного» лишний раз убеждает нас в этом. Однако на основании ее результатов трудно избавиться от ощущения, что в рамках собственных правил теории игр стратегия возмездия является «моральной», хотя бы потому, что служит приумножению добра. Стратегия «зуб за зуб» не только защищает самого игрока от эксплуатации обманщиков, но и служит укреплению безопасности всего сообщества. Заметим, что в компьютерных экспериментах более мягкие формы стратегии TFT способствуют появлению обманщиков и оппортунистов-«павловцев», угрожающих всему сообществу в целом. Безусловная готовность к сотрудничеству более благородная и добрая форма взаимодействия, но она перекладывает тяготы защиты сообщества на другие плечи,— все той же TFT, которой трудно найти замену.
Описанный в этой главе подход выглядит плодотворным. Но при его использовании надо проявлять осторожность, поскольку его результаты легко извратить или неверно интерпретировать. Например, кто-то может наивно заключить, что TFT оправдывает смертную казнь за убийство — это при том, что исполнителем наказания выступает государство, а не индивид. На самом деле такая постановка вопроса в рамках «Дилеммы заключенного» лишена смысла. Эта игра всего лишь обучает игроков сотрудничеству при помощи простых и повторяющихся раундов игры с условиями, поощряющими совместные действия и заставляющих даже убежденных обманщиков обращаться к сотрудничеству просто потому, что такое поведение более выгодно. Аналог смертной казни в этой игре — удаление игрока, но при этом становятся невозможными следующие раунды, и игра останавливается. Кроме того, ничто в «Дилемме заключенного» не предполагает возможности обучения игроков за счет чужого опыта, так что удаление одного обманщика не может повлиять на умонастроение других обманщиков. Таким образом, успех стратегии TFT не имеет никакого отношения к проблеме отмены или введения смертной казни.
Примерно то же самое можно сказать о проблемах, связанных с накоплением ядерных арсеналов во время «холодной войны». Теория игр и игра в «Дилемму заключенного» были тогда очень популярны в Пентагоне, но все отдавали себе отчет в том, что стратегия «зуб за зуб» приносит успех лишь при многократном проигрывании ситуаций, а при единичных столкновениях, характерных для военных действий, она может привести и к поражению.
Джон Локк выражал надежду, что стратегия «зуб за зуб», применимая, по его мнению, в «естественном» состоянии человечества, будет изжита в цивилизованном обществе, и на смену ей придут закон и правосудие, которые избавят индивида от необходимости брать на себя миссию мстителя за личную обиду. Члены варварского общества не имели возможности оградить себя от обидчиков мягкими методами, например, изолировав их, вследствие чего единственным ответом на насилие оставалось само насилие. Таким образом, наказания для нарушителей социальных норм необходимы для установления общественного мира и спокойствия. В этом свете результаты экспериментов со стратегией TFT представляются естественными и ожидаемыми, однако повторю, что эта простая модель не помогает (и не может помочь) в решении проблем, связанных с формой наказаний. Разумеется, она не может подсказать нам и способы перевоспитания грешников.
Полезность игры в «Дилемму заключенного» для нас обусловлена прежде всего тем, что она позволяет избавиться от мрачного пессимизма Гоббса, не прибегая к малообоснованным оптимистическим доводам Локка. Модель еще раз доказывает, что сотрудничество вполне возможно даже в жестоком мире, лишенном альтруистических начал и принципов. В этом смысле она позволяет нам увереннее вглядываться в наше будущее и не впадать в отчаяние при размышлениях о природе человека. Мне бы хотелось закончить эту главу высказыванием Карла Поппера: «Мы должны двигаться к истине медленно и осторожно подобно тараканам, тщательно ощупывающим землю на их пути»13.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОК