博弈论中的囚徒困境在生活中的应用 囚徒困境最早出现在1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 若二人都互相检举(互相“背叛”),则二人同样判监2年。 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: (1)若对方沉默、背叛会让我获释,所以会选择背叛。 (2)若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 一,囚徒困境之于异地恋 异地恋成功率很低,如果一个事件大量发生,那么我们视之为一个大概率事件,不是偶发事件,或者就可以叫一种现象。尽管很多人认为这是感情问题,但是感情问题是感性问题,感性问题不足以解释现象,那么造成这种现象的原因可以用博弈论中的囚徒困境来解释。 那么异地恋同样可以视为一组囚徒困境 假设一:分开两地(距离较远)的情侣视为甲、乙两人 假设二:甲乙两个都是经济人 假设三:甲乙两个人由于分开两地无法完全了解对方的选择,即信息具有不透明性 甲乙的两个选择:坚守、放弃 选择A:若甲乙都选择不顾时间长短和地理的距离,都选择坚守,那么甲乙情侣关系维持,之前的时间和异地造成的机会成本没有浪费,对甲乙来说得利最大 选择B、C:若某一方率先选择放弃,找到新欢再抛弃另一方,那么这一方的机会成本会为新的得利(找到新欢)的得利收获所弥补,但另一方在这组博弈中得利为0,之前投入的机会成本全部变为沉没成本。 选择D:若两方同时选择放弃,那么两方的机会成本都变为沉没成本。 在四组选择中,A选择似乎是对两人的最优选,但是由于假设条件的存在,信息的不透明性会导致甲乙选择的结果大多不会是A,由于担心对方选择放弃,导致自己的机会成本变为沉没成本,在面临优选的时候,甲乙很容易形成选择BCD的局面。 在这个博弈中有两个变量,就是分开的地理位置的长短以及分开的时间的长短,这两个变量 本文来源:https://www.wddqw.com/doc/33334c936bec0975f465e27d.html