同伙,以将所有犯罪证据栽赃于对方。他们结果将取决于两个囚徒行为,而双方都不知道对方选择。如果彼得森将所有罪过都推向莫里亚蒂,而莫里亚蒂始终保持沉默(与他从前朋友、现在叛徒合作),莫里亚蒂将接受重罚,而彼得森则得以无罪释放,享受背叛诱惑。如果两人互相背叛,便都将获罪,但可以因为供认不讳而得到轻判,这便是互相背叛惩罚。如果两人互相与对方而不是当局合作,闭口不谈过往,所得证据将不足以把两人判以重罪,则两人也都将得到轻判,得到互相合作奖赏。虽然将牢狱刑罚称为“奖赏”有点儿奇怪,但比起漫长铁窗生涯,犯人们肯定会将此看做奖赏。你可以发现,虽然这里回报不是美元而是牢狱刑罚,这个博弈主要特征依然保存着(看看四个结果可取性排列顺序)。如果你将自己放在任何个囚徒位置上,假设两人都以理性自利益为动机,你将看到两人都只能背叛对方,而同样接受沉重刑罚。
有没有逃离困境方法呢?双方都知道,无论对方如何选择,他们能做出最好选择都是“背叛”。但他们也都知道,如果双方都选择合作,任何方都可以得到更多好处。如果……如果……如果能有个办法让他们达成共识,能有个办法让双方都坚信对方可以被信任,不至于奔向那个自私奖赏,能有个方法来维持双方共识……
在“囚徒困境”这个简单博弈里,没有任何方法可以达成信任。除非其中方是个虔诚傻瓜,善良得根本不可能适应这个世界,这个博弈注定将以相互背叛、相互损伤而告终。然而,这个博弈还有另个版本:“重复博弈”“囚徒困境”。这个“重复博弈”更为复杂,但这个复杂性里孕育着希望。
这个“重复博弈”只是简单将上述博弈与同个对手无限次重复。你再次在“银行家”面前左右相对,再次拥有手中两张牌:“合作”与“背叛”,们再次各自打出张牌,由银行家根据上述规则给出奖赏与惩罚。但这次对弈不再是博弈终结,们捡起手中牌,准备着下轮。下轮游戏给予们机会来重新建立信任与怀疑,实施对抗或和解,给予报仇或宽恕。在这个无限长博弈里,们最重要任务是:赢“银行家”,而不是对方。
在10次博弈后,理论上也许可以获得最多5000美元,但只有在你完全愚不可及、或者大公无私地每次都打出“合作”时候,才有可能每次都得到最高奖赏“背叛诱惑”。在更实际点儿情况里,们各自都在10次对弈中打出“合作”,并各自从银行家里得到3000美元。这样,们并不需要特别大公无私,因为们彼此都能从对方过往行为中,知道对方可以信任。们事实上也在监管着对方行为。还有另个也可能发生结果,们彼此不信任对方,在10次对弈中
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。