背景:两个人因盗窃被捕,警方怀疑其有抢劫行为,但未获得确凿证据可以判他们犯了抢劫罪,除非有一个人供认或两个人都供认。即使两个人都不供认,也可判他们犯盗窃物品的轻罪。 囚徒被分离审查,不允许他们之间互通消息,并交代政策如下:如果两个人都供认,每个人都将因抢劫罪加盗窃罪被判2年监禁;如果两个人都拒供,则两个人都将因盗窃罪被判处半年监禁;如果一个人供认而另一个拒供,则供认者被认为有立功表现而免受处罚,拒供者将因抢劫罪、盗窃罪以及抗拒从严而被重判5年。如下表所示。 囚徒困境 囚徒 拒 供 供 认 甲 囚徒乙 拒 供 0.5 , 0.5 5 , 0 供 认 0 , 5 2 , 2 在这个模型中,最终两人选择的策略都是供认,因为每个囚徒都会发现:如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择;如果对方供认,则自己供认将被判2年,而自己拒供则会被判5年,因此供认是较好的选择。 在上表中明显能够看到存在一种对双方都有利的策略:拒供。这种策略是一个有利的结局:分别被判0.5年徒刑。 “囚徒困境”有着广泛而深刻的意义。个人理性与集体理性的冲突,个人追求利己行为而导致的最终结局是一个“纳什均衡”(以其研究者数学家纳什命名),也是对所有人都不利的结局。甲、乙两人都是在供认与拒供策略上首先想到自己,这样他们必然要服长的刑期。只有当甲、乙都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。从利己目的出发,结果是损人不利己,既不利己也不利他。两个囚徒的命运就是如此。 因此,我们从“纳什均衡”中可以悟出:合作是有利的“利己策略”。也就是我们所说的“己不所欲勿施于人”。其次,“纳什均衡”是一种非合作博弈均衡,在现实商务伙伴之间非合作的情况要比合作情况普遍,因此对非合作博弈的研究更具有现实意义。 本文来源:https://www.wddqw.com/doc/04a36d59df88d0d233d4b14e852458fb760b3844.html