“老实人探测器”与“愧疚探测器”也偶尔采取“背叛”,但这种行为是主动起意挑衅,属于恶意策略。这场竞赛中15个策略中,有8个属于“善良”策略。令人吃惊是,策略中前8名也是这8个善意策略。“针锋相对”平均分504.5分,是们600分基准分中84%,个很好分数。其他“善良”策略所得分数要比“针锋相对”少些,从83.4%到78.6%不等。排名中接下来分数则是由格雷斯卡普(Graaskamp)所获得66.8%,与高分们有很大差距,而这已经是所有恶意策略中最高分。令人信服结果表明,好人在这个博弈中可以胜出。
阿克塞尔罗德另个术语则是“宽容”。个宽容策略只有短期记忆。虽然它也采取报复行为,但它会很快遗忘对手劣迹。“针锋相对”便是个宽容策略,面对背叛时它毫不手软,但之后则“过去让它过去”。第十章中“斤斤计较者”则是个完全相反例子。它记忆持续整个博弈,永不宽恕曾经背叛过它对手。在阿克塞尔罗德竞赛中,有个策略与“斤斤计较者”完全相同,由位名叫弗里德曼(Friedman)选手提供。这个“善良”而绝不宽恕策略结果并不算佳,成绩在所有“善良”策略里排倒数第二。即便对手已经有悔改之意,它不愿意打破相互背叛恶性循环,因此无法取得很高分数。
“针锋相对”并不是最宽容策略。们还可以设计个“两报还报”(TitforTwoTats)策略,允许对手连续两次背叛后才开始报复,这似乎显得过分大度坦荡。阿克塞尔罗德算出,只要在竞赛中有“两报还报”策略存在,它便定会获得冠军,因为它可以有效避免长期互相伤害。
于是,们算出赢家策略两个特点:善良与宽容。这几乎是个乌托邦式结论:善良与宽容能得到好报。许多专家曾试图在恶意策略里耍点儿花招,认为这可能得到高分。即使那些提交“善良”策略专家,也未曾敢如“针锋相对”般宽容。所有人都对这个结论十分惊讶。
阿克塞尔罗德又举办第二次竞赛。这次他收到62个策略,再加上随机策略,总共便有63个策略。这次,博弈中回合数不再固定为200,而改为开放式不定数(之后会解释这做理由)。们依然将得分评判为基准分“永远合作”分数百分比,不过现在基准分需要更为复杂计算,并不再是固定600分。
第二次竞赛程序员们都得到第次竞赛结果,还收到阿克塞尔罗德对“针锋相对”与善良与宽容策略获胜分析。这做是为让参赛者们能从某种方向上解比赛背景信息,来权衡自己判断。事实上,这些参赛者分成两种思路。第种参赛者认为,已经有足够证据证明善良与宽容确实
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。