自私的基因第十二章好人终有好报

“老实人探测器”与“愧疚探测器”也偶尔采取“背叛”，但这种行为是主动起意挑衅，属于恶意策略。这场竞赛中15个策略中，有8个属于“善良”策略。令人吃惊是，策略中前8名也是这8个善意策略。“针锋相对”平均分504.5分，是们600分基准分中84%，个很好分数。其他“善良”策略所得分数要比“针锋相对”少些，从83.4%到78.6%不等。排名中接下来分数则是由格雷斯卡普（Graaskamp）所获得66.8%，与高分们有很大差距，而这已经是所有恶意策略中最高分。令人信服结果表明，好人在这个博弈中可以胜出。

阿克塞尔罗德另个术语则是“宽容”。个宽容策略只有短期记忆。虽然它也采取报复行为，但它会很快遗忘对手劣迹。“针锋相对”便是个宽容策略，面对背叛时它毫不手软，但之后则“过去让它过去”。第十章中“斤斤计较者”则是个完全相反例子。它记忆持续整个博弈，永不宽恕曾经背叛过它对手。在阿克塞尔罗德竞赛中，有个策略与“斤斤计较者”完全相同，由位名叫弗里德曼（Friedman）选手提供。这个“善良”而绝不宽恕策略结果并不算佳，成绩在所有“善良”策略里排倒数第二。即便对手已经有悔改之意，它不愿意打破相互背叛恶性循环，因此无法取得很高分数。

“针锋相对”并不是最宽容策略。们还可以设计个“两报还报”（TitforTwoTats）策略，允许对手连续两次背叛后才开始报复，这似乎显得过分大度坦荡。阿克塞尔罗德算出，只要在竞赛中有“两报还报”策略存在，它便定会获得冠军，因为它可以有效避免长期互相伤害。

于是，们算出赢家策略两个特点：善良与宽容。这几乎是个乌托邦式结论：善良与宽容能得到好报。许多专家曾试图在恶意策略里耍点儿花招，认为这可能得到高分。即使那些提交“善良”策略专家，也未曾敢如“针锋相对”般宽容。所有人都对这个结论十分惊讶。

阿克塞尔罗德又举办第二次竞赛。这次他收到62个策略，再加上随机策略，总共便有63个策略。这次，博弈中回合数不再固定为200，而改为开放式不定数（之后会解释这做理由）。们依然将得分评判为基准分“永远合作”分数百分比，不过现在基准分需要更为复杂计算，并不再是固定600分。

第二次竞赛程序员们都得到第次竞赛结果，还收到阿克塞尔罗德对“针锋相对”与善良与宽容策略获胜分析。这做是为让参赛者们能从某种方向上解比赛背景信息，来权衡自己判断。事实上，这些参赛者分成两种思路。第种参赛者认为，已经有足够证据证明善良与宽容确实

第十二章好人终有好报 · 2（3 / 5）

你比北京美丽

苍白爱情

秋以为期

你却爱着一个烧饼

相爱未遂

职业替身