当前位置:走进德成 > 德成动态

从重复博弈看苏轼跌宕起伏的人生 原创 甘德安 北京德成智库

发布日期:2024-04-12 来源: 作者:北京德成经济研究院 加入收藏

苏轼是中华民族最伟大的文学家之一。我以为,苏轼在中国伟大文学家群体中的地位,如同牛顿与爱因斯坦在伟大自然科学家群体中的地位。没有苏轼,中国文学史与精神生活缺少最精彩的篇章;此外,苏轼跌宕起伏的人生,为中国传统知识分子身处逆境提供了一个精神的榜样。

本文则是给苏轼跌宕起伏的人生做一个囚徒困境重复博弈的解读。本文分三个部分:第一部分,从作者的视角给苏轼一个非专业的评价;第二部分,从囚徒困境的重复博弈看苏轼跌宕起伏的人生,主要借助囚徒困境重复博弈的ALLC、ALLD与“一报还一报”等策略,分析苏轼与司马光、王安石与章惇的关系,并根据这个分析找出苏轼持续被贬的原因;第三部分,作者指出,在皇权时代,我们不仅要学苏轼,更学博弈思维,在坚持自己道德底线的前提下,寻找个人合作与不合作的最佳策略。

一、从作者的视角给苏轼一个非专业的评价

我喜欢苏轼的诗词,也敬仰他面对逆境的风骨。我不是文学评论家,也不是学文学专业的,没有能力对苏轼作全面、专业的评价,仅用四个关键词概括苏轼的四个特征:睿智、豪迈、多情与洒脱;而每个关键词,都借用苏轼诗句为证。

一是“睿智”,这可从《题西林壁》诗中体现出来:“横看成岭侧成峰,远近高低各不同。不识庐山真面目,只缘身在此山中。”这首诗表现出苏轼对生活的深刻洞察和睿智的思考。

二是豪迈,这可从《念奴娇·赤壁怀古》词中体现出来:“大江东去,浪淘尽,千古风流人物。故垒西边,人道是,三国周郎赤壁。乱石穿空,惊涛拍岸,卷起千堆雪。”这首词展现了苏轼的豪情壮志、英雄气概和奔放激情。

三是“多情”,这可从《江城子》词中体现出来:“十年生死两茫茫,不思量,自难忘”等句。这首词深情地描绘了苏轼对亡妻的生死离别之痛和思念之情,展现了苏轼多情的一面。

四是“洒脱”,这可从《定风波·莫听穿林打叶声》词中体现出来:“竹杖芒鞋轻胜马,谁怕?一蓑烟雨任平生。料峭春风吹酒醒,微冷,山头斜照却相迎。”在这首词中,展现了苏轼面对生活困顿时的洒脱与超然。

为了避免评价的错误,我还是借助林语堂先生的部分评语。林语堂先生认为,苏轼是一个多才多艺、性格独特的人物、一个无可救药的乐天派、一个伟大的人道主义者、一个百姓的朋友、一个大文豪、一位在政治上专唱反调的人。林语堂先生还认为,苏轼的作品充满了智慧和幽默感,既表达了个人的情感,也反映了社会现实,体现了对人民生活的深切关怀;苏轼的人格构成了他名气的骨干,他的风格文章之美则构成了他精神之美的骨肉。[1]

1712904767749.png

二、从重复博弈看苏轼跌宕起伏的人生

我们可以将苏轼跌宕起伏的人生概括成三点。一是崭露头角的进士科考及两次制科考试,策论文章深得宋仁宗的赞赏,被赞誉为“文章为天下所宗”;二是苏轼的“三起三落”的人生;三是苏轼用“心似已灰之木,身如不系之舟。问汝平生功业,黄州惠州儋州。”概括自己跌宕起伏的人生。我们制成下图,简要概括。

下面,我们从囚徒困境重复博弈的视角,看苏轼与司马光、王安石与章惇之间的重复博弈。在分析之前,我们简单介绍囚徒困境与囚徒困境重复博弈的四种策略。

囚徒困境是1950年由美国普林斯顿大学的数学家阿尔伯特·塔克(Albert Tucker)提出的。囚徒困境的基本思想是:个体合作得益大于不合作的得益,但个体最终选择了不合作。囚徒困境揭示了集体面临的困境:合作有利于个体,也有利于群体,但个体还是选择不合作,个人做出理性选择却导致集体的非理性。

上面讲的是一次囚徒困境,如果囚徒重复多次博弈呢?会有什么结果?博弈论专家通过实验,发现了囚徒困境重复博弈的四种策略。

第一种是ALLC策略(All-or-nothing-cooperate-strategy),即不论对方是否选择合作或者说合作过程中是否选择背叛,自己永远选择合作。

第二种是ALLD策略(ALL-or-lose-Decision-making-strategy),就是在与合作者重复博弈中总是选择不合作策略。

第三种是TFT策略(Titfor tat)可以称为“一报还一报”策略。“一报还一报”策略是美国博弈论专家罗伯特·阿克塞尔罗德在《合作的进化》一书中首先提出的,其基本思想是:首轮选择合作,然后根据对方的策略做出相同的回应。如果对方选择合作,则自己继续合作;如果对方选择不合作/背叛,则自己选择不合作/背叛。罗伯特·阿克塞尔罗德通过大量的实验和分析,发现“一报还一报”策略具有四大优点:善良性(不首先背叛)、可激怒性(对方背叛后实施惩罚)、宽容性(对方回归合作后立刻恢复合作)以及清晰性(行为方式容易识别)。“一报还一报”策略通过“重复囚徒困境计算机程序博弈竞赛”得到验证,被认为在囚徒困境的重复博弈中是最好的策略。[2]

第四种是GTS策略(Grim-Trigger-strategy),也称为触发策略:首轮选择合作,如果合作方选择不合作/背叛,则自己永远选择不合作。

1712904809955.png

我们知道,中国历朝历代中,众多王朝亡于党争。比如,东汉士大夫和贵族与宦官的党争,导致董卓进京,成为压倒东汉灭亡的最后一根稻草;再如,唐朝牛李四十年党争,导致唐朝的政治生态造成了严重破坏;又如,北宋末期“新党”“旧党”之争,四十年导致北宋覆灭;还如,明朝东林党、阉党等党争,为其最终灭亡埋下了伏笔。

我以为,苏轼的持续被贬,一是党争之果,是制度设计问题;二是人生使然,是自身策略之错。下面,我们通过苏轼与司马光、王安石与章惇看苏轼重复博弈策略的错误。

先看苏轼与司马光的重复博弈策略。苏轼与司马光同属“旧党”。司马光对苏轼的成长和仕途有一定的提携之恩,苏轼兄弟参加贤良科考试时,司马光是主考官。用“一报还一报”策略看,司马光首先选择了与苏轼合作的策略,但苏轼则抛弃了其父苏辙的合作策略,选择与司马光先合作后不合作的策略。比如,司马光主政,主张节流,强调通过节约开支来维护国家财政的稳定的政策,而苏轼先是站在司马光的一边,选择合作,反对王安石的变法;随后又反对司马光政策,选择与司马光不合作或者说“背叛”的策略。从囚徒困境重复博弈策略看,苏轼属于“旧党”成员,应该与“旧党”保持合作的策略,但苏轼是“旧党”,但与“旧党”既是合作者,又是不合作者或者说背叛者,这样, “旧党”最有效的策略就是ALLD策略了,就是坚持重复打击的策略;可见,苏轼被贬是逻辑的必然。

再看苏轼与王安石的重复博弈策略。我们知道,苏轼与王安石典型属于“两个阵营”,苏轼属于“旧党”,王安石属于“新党”。苏轼与王安石之争本质上是“新党”与“旧党”之争。根据囚徒困境重复博弈策略,在“党争”问题上的重复博弈策略应该是有明确预期的,但不明此理之人自然为“党争”所伤。比如,李商隐早期受到牛党重要人物令狐楚的赏识和提携,他的才华得到了令狐楚的充分认可;但李商隐却娶了李党成员王茂元的女儿。从囚徒困境的重复博弈看,就是牛党选择与李商隐合作,但李商隐则选择了背叛策略。牛党必然会选择ALLD策略,就是每次博弈都不合作,或者说,就是不给机会、就是打击,李商隐终生压抑与自己的重复博弈策略错误选择有关(他的诗词成就是另一个话题,此处不议)。

在指明苏轼持续被贬首先是党争之祸,再看苏轼与王安石党争中的策略之错。王安石变法包括青苗法、保甲法、农田水利法在内的改革措施;想法很好、效果极差。如同把国企做大做强愿望极好,效果极差,就是低效与腐败。苏轼采用反对变法的策略,无疑是“旧党”所希望的策略,自然自己成为新党打压和排挤的对象。问题在于,苏轼在这场囚徒困境的重复博弈中,既反对新党,选择不合作策略;但又不完全认同旧党某些做法,也采取不合作策略;这就导致“新党”“旧党”相继选择与苏轼不合作策略,持续被贬,“黄州惠州儋州”就是党争之恶与策略之错叠加导致的。

最后看苏轼与章惇重复博弈的策略。早年,章惇对苏轼极为推重,甚至曾致书苏轼劝诫他慎言,可见章惇是采用与苏轼合作的策略;在苏轼因乌台诗案面临可能被杀头的困境时,章惇挺身而出,四处奔走,怒怼宰辅王珪,为苏轼说话,可见章惇选择了ALLC的策略,就是持续与苏轼持续合作的策略。随后,章惇成为新党干将,特别在掌权后,对旧党人士采用ALLD的策略,就是对旧党进行无情打压,苏轼自然也是被打压对象。

三、在一个皇权时代,我们不仅要学苏轼,更要学博弈策略

历史上的党争主要是皇权政治的产物。在皇权政治下,皇帝拥有对全国资源的控制和管理权,包括行政、军事、立法、文教等大权。皇权必然形成不同的党派和利益集团。这些党派为了争取皇权的青睐和自身的利益,自然展开激烈的争斗,从而形成党争,就形成博弈,形成囚徒困境的重复博弈。此外,独裁者通常在追求个人权力最大化的同时,利用不同派系之间的斗争来削弱潜在的对手或分散反对者的注意力。

我们知道,博弈就是Game Theory,就是一个局。局就是王朝、就是皇上、就是独裁者。在这个局中,党争也好,新党旧党也好,司马光、王安石、章惇,还是苏轼也好,不过是这个局的棋子;如同体制内地成员都是体制内的棋子一样。

虽然在皇权或极权政治下,我们都是局中的棋子,但我们还是可以向苏轼学习很多。一是学习苏轼乐观豁达的人生态度。他一生经历了许多政治风波和人生坎坷,但始终保持着乐观向上的精神风貌;二是学习苏轼坚忍不拔的毅力。他一生都在追求真理和美好,不断超越自我,即使在遭受打击和困境时,他也没有放弃自己的梦想和追求,努力前行;三是学习苏轼的人性关怀。他关注民生疾苦,关心社会进步,具有强烈的社会责任感和使命感。

但是,在皇权或极权时代,我们仅仅学习苏轼的乐观豁达的人生态度、坚韧不拔的毅力与人性关怀是远远不够的。

我想,学习博弈思维,首先,可以处理好“道”与“术”的关系。中国传统的儒家知识分子都有“横渠四句”的情怀,但没有实现“横渠四句”的思维,而博弈思维正好是践行“横渠四句”的有效思维;其次,学习博弈思维,能有效地处理好人与人的关系,处理好自己与集体/团队的关系,在与合作者进行有效的竞争与合作中,在尊重合作者最大得益的前提下,寻求自身的最大利益;再次,学习博弈思维,特别是学习囚徒困境重复博弈策略,就是认识到囚徒困境是群体无法消除的困境,只能通过重复博弈才能逐步形成稳定的合作关系,而“一报还一报”则是最好的策略;最后,博弈思维就是制度分析与人性分析结合的思维,我们既要考虑制度的优化,也要考虑到一次博弈导致的人性之恶与重复博弈中的人性之善。特别要善于在不同制度环境下,面对不同的博弈方,采用囚徒困境重复博弈中的不同的策略。

参考文献:
[1]林语堂.苏东坡传[M]. 湖南人民出版社,2018年版。
[2] [美]罗伯特·阿克塞尔罗德.合作的进化[M].上海人民出版社,2016年版。


德成动态