说明:写这篇文章差不多是10年前的事吧。岁月的流逝真是让人惊心。
我一直有个愿望,想试验能否把一些看似最抽象深奥、层次最多、多样性最显著的真理体系(话语体系或文本)还原为一个通用的真理体系(话语体系或文本),这个试验也许可以从数学开始……

 

 

帮助善良的真理   

□刘县书
欧阳:生物学博士生,喜爱文学,阅读广泛。
刘县书:读书版编辑,有时略显沉闷,但是个好的倾听者。

   
窗外大雪纷飞,欧阳背靠着暖气片坐在我的对面,看上去他很惬意,为自己抢占的有利地势而得意。
   
我们有日子没见面了,为了他的博士论文欧阳奔波在滇西的大山和北京的实验室之间。不过今天是聊天的好日子,我终于可以和他聊聊我们最近都读过的几本好书:

   
刘(拿起一本书):”新约之科学十诫:1.你只可信仰一个且惟一的自然之律,宇宙之律……2.你应服从引力,因为你应在时空的自然构造中沿着一定的曲率移动。此种弯曲运动将构成引力……”《爱因斯坦的圣经》(以下简称《爱》)真是本有趣的书,有趣的是读它时我突然想起了另一本书《对策中的制胜之道:合作的进化》(以下简称《对》)。

   
欧:最有意思的是《爱》戏仿《圣经》布道的方式,宣讲当代科学对于宇宙起源、生命演变、人的进化、物质结构等世界基本问题的理解。它的结构是模仿《圣经》的,它的句子像上帝一样充满自信,又使用了大量神启般的比喻和类比,其晓畅和生动,做足了耶稣布道的功夫。尤其难得的是,译笔也深得《圣经》文字的气韵。但你为什么把这本书和《对》联系起来呢?它们似乎没什么关系。

   
刘:你有没有注意到《爱》书中的前言?其中将宗教与科学作了一番别致的类比,作者说宗教和科学都是对世界的一种解释,它们的目的也都是为拯救世人,也许它们的惟一区别在于科学规律是不断被发现和修正的,而像《圣经》中”当孝敬父母”、”不可作假见证”等戒律至今也是人们社会生活的道德准则。”三千年前正确和错误的东西,今天也近乎如此。道德真理
缺乏进化是令人吃惊的……这或许暗示着道德真理也许是普遍和绝对的”。果真如此吗?正是这段话让我想起了《对》。你知道《对》探讨”合作的进化”,即在自私自利的和没有集权的人群中合作如何可能出现并保持、如何演化?该书分析的正是合作的道德准则的基础。

   
欧:啊,《对》是一本值得讨论的好书,虽然出版者给它安上的中文书名容易使人误认作”办公室兵法”一类读物。该书的核心是作者组织的两轮”重复囚犯困境”游戏程序竞赛结果及分析,还有给出证明的8个推广命题。

   
(旁白:”囚犯困境”或曰”囚徒困境”是当代社会学的常用术语之一,设想两同犯被分别囚禁,面临审讯,他们互相不能确认对方将在审讯中如何供述,此时,如果双方保持默契、互相保护,自然双方得益(比如各得3分);而如果一犯供认不讳、另一犯”抗拒从严”,自然背叛默契者有利(得5分)而置另一人于不利(得零分);但如果双方都因担心对方背叛而出卖对方,则于双方都不利(各得1分)–此种面临两难抉择的情境即囚犯困境。注意:构成囚犯困境的条件要素之一是,双方合作时的收益之和(如3加3分)必须大于一方背叛时的收益(5分),即合作对群体是有利的,但个人必须冒被背叛而充当傻瓜的风险(傻瓜的收益为零)。重复囚犯困境指将多次对局的囚犯困境。)

   
刘:重复囚犯困境的游戏玩起来很简单,每人提交一个对策程序,然后进行捉对厮杀,你的程序只需每次选择合作或背叛,然后视对方的选择而得到不同分数,最后累计多步得分。艾克斯罗德先后两次向各国包括对策论专家在内的各色人征求竞赛程序,然后进行多轮循环比赛,统计每一程序的所有对局得分总和。结果是惊人的:从预赛到两次公开竞赛,都是同一个最简单的策略赢了,这个策略就是”一报还一报”!

   
(旁白:”一报还一报”的策略是,第1步选择合作,然后一直模仿对方的前一步选择合作或背叛。)
   
欧(兴奋地):更加让人称奇的是,得分排在前8名之内的那些策略都是”善良”的策略,而越是那些看似刁钻精明、占尽便宜的策略表现都很差!

   
刘:看把你高兴得!好像这证明好人必有好报、善良必胜邪恶?
   
欧:现实世界当然没那么简单,从理论上本书也一开始就证明了:在重复囚犯困境中不存在不必考虑对方策略的最优策略。但计算机竞赛的结果仍然是具启发性和让人鼓舞的。”一报还一报”这个最简单的对策其实不简单,作者分析它的成功来自其4种特质:善良性,宽容性,可激怒性,策略模式的明晰性……

   
刘:等等,还是先让我解释一下这些词汇在这里的含义吧,要不别人会把这本像《几何原本》一样冷静的著作当成道德书。此处一个策略的善良指它从不首先背叛,宽容度是指它在对方背叛之后加以报复或者说原谅的程度–“一报还一报”的做法是对一个背叛只报复一次,可激怒性指策略是否对首次背叛作出反应,明晰性指对方能否根据历史尽快识别你的对策原则。

   
欧:书中指出,”一报还一报”是善良的、可激怒的、明晰的,有着合适的宽容度,因此在不同策略争逐的生态环境中成为最后的胜者。其实提交程序参赛的选手都知道预赛中”一报还一报”是赢家,他们很多人提交的策略是对”一报还一报”的”改进”,比如试图首先背叛或偶尔突然背叛一下(占点对方便宜),或者报复性更强(对一次背叛报以多次报复),但结果都是”聪明反被聪明误”。仿佛电脑和数学也懂得帮助君子、打击小人!根据实验和数学证明,作者给出了在重复囚犯困境中促进合作、通向成功的4条建议:1.不要嫉妒(对方的成功);2.不要首先背叛;3.对合作和背叛都要给以回报;4.不要耍小聪明。

   
刘:听起来真是振聋发聩……(未完待续)

 

“报应”创造美好世界
——续“帮助善良的真理”
□刘县书
   
(上期我们谈到《对策中的制胜之道:合作的进化》中一个发人深省的发现:在重复囚犯困境的游戏中,是最简单的“一报还一报”策略以其善良性、宽容性、报复性和明晰性赢得比赛。作者从中总结出4条经验教训:不要嫉妒;不要首先背叛;对合作和背叛都要给以回报;不要耍小聪明……)
   
刘:这些从数学实验与推导中得出的东西,竟然大致和传统中“好人”相传的做人法则相似。其中“对合作和背叛都要给以回报”这一条比较特别,近乎“以其人之道还治其人之身”。这使我想起前不久读到的对二战后日本和德国比较研究的资料(参见师杰著《与彼为邻——中国告诉日本》及彭玉龙著《谢罪与翻案》)。人们发现,战后同盟国成员和以色列人对德国纳粹战犯穷追不舍、清算到底,相应地德国人自觉反省过去、努力追求和平;相反,在
“以德报怨”的宽容中,战后日本反而缺乏谢罪诚意,不时为侵略翻案、为扩张武力找借口。
   
欧:国际政治有时确实就是一种重复囚犯困境游戏,《对》的作者艾克斯罗德正是美国著名的国际关系专家。我感觉美国人在涉及本国切身利益的国际事务中信奉的正是“一报还一报”策略,动用导弹或经济制裁施以报复时毫不手软。

   
刘:社会生活中人与人的交往与交易也常类似囚犯困境,那么据《对》的论证,合作和宽容的善良策略应当立于不败之地。但在现实中小人得志并不少见……

   
欧:现实中小人得志通常是一时的或者另有原因,其中最重要的一类原因便是良性报应机制的缺失。
   
刘:什么意思?“良性报应机制的缺失”?
   
欧:在重复囚犯困境的游戏中,企图首先背叛的不善良策略为什么都失败了呢?因为它的背叛会遭到其他策略(无论善良或不善良的)的报复,结果往往两败俱伤;而善良策略相逢善良策略时,总是能够维持合作取得双赢——这样博弈的总体结果便是善良策略胜过不善良者,善良策略群体更胜于不善良群体。问题是,在现实社会中,一个不善良策略(小人)的背叛(投机)未必遭到及时的报复——我们通常称为“报应”。举个例子,假如在一个售票口一伙人规规矩矩排队,这时一个凶恶的插队者径直上前买票——没有人敢反对,没有警察维持秩序,插队者(背叛排队规则者)最后扬长而去,看起来他自然是赢了。

   
刘:对这种人你不可能总跟他干仗吧?如果警察不管,排队的人还能有什么报复办法?况且他买完票就走了。
   
欧:对,这个例子有点特殊,插队者与排队者很可能只打一次交道,在这种条件下合作确实很难进行。艾克斯罗德也证明了,只有当未来足够重要时,善良的策略群体才能抵御背叛策略的入侵和破坏;反言之,当人们不必顾虑将来的相处,背叛策略便会占上风——就像一粒老鼠屎坏一锅粥、像劣币驱逐良币那样,一个插队者的出现会使整列人排队的秩序崩溃。接触的一次性也可视为报应机制的一种缺失。更常见的一种报应机制缺失是,你自己往往没有能力对插队者给予报复。对这两类缺失,本来人类已经发明了文明机制来补偿,比如法制,它具有超越时空和个体的报复能力。

   
刘:比如在排队时,如果有警察替我们代行对插队者应有的报复,那么这个游戏中获胜的就是良民了。
   
欧:当没有执法者或者执法者不公正时,这是最严重的报应机制缺失,善良的策略便很难在这种生态环境中生存壮大。这时人们便幻想出虚拟的报应机制,很多宗教就是这么干的。而我还想说,即使可能由于种种现实报应机制的缺失,导致不善良策略在一群体中似乎频频得胜,但结果必然逐步导致此群体的整体效益下降,其中的每一个体都将遭受报应,这种最后的报应谁也逃不掉。当我在大山和都市间、在猴群和人群中来回观察,有时一个问题就会涌上心头:为什么大自然选择出来的物种往往都是善于合作的呢?最高级的灵长类人类之间虽然存在那么多背叛,但他们的合作也是世界上最高级的,我认为这是人类物种之所以称雄世界的最大的本钱。

   
这时窗外的雪下得更大了。两只麻雀缩着脖子在光秃秃的柳树上发呆,一辆煤车开过,欧阳把后背更紧地贴向暖气片,对我敲诈道:“请我涮火锅去!”