囚徒困境、纳什均衡、帕累托最优

时间:2023-03-07 15:23:20 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。


囚徒困境

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑两年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

囚徒困境(prisoner's dilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。



帕累托优化

帕累托改进一般指帕累托优化

帕累托优化(Pareto Improvement),也称为帕累托改善或帕累托改进,是以意大利经济学家帕累托(Vilfredo Pareto)命名的,并基于帕累托最优变化,在没有使任何人境况变坏的前提下,使得至






少一个人变得更好。一方面,帕累托最优是指没有进行帕累托改进的余地的状态;另一方面,帕累托改进是达到帕累托最优的路径和方法。帕累托最优是公平与效率的“理想王国”。

一般来说,达到帕累托最优时,会同时满足以下3个条件: 交换最优:即使再交易,个人也不能从中得到更大的利益。此时对任意两个消费者,任意两种商品的边际替代率是相同的,且两个消费者的效用同时得到最大化。[1]

生产最优:这个经济体必须在自己的生产可能性边界上。此时对任意两个生产不同产品的生产者,需要投入的两种生产要素的边际技术替代率是相同的,且两个生产者的产量同时得到最大化。

产品混合最优:经济体产出产品的组合必须反映消费者的偏好。此时任意两种商品之间的边际替代率必须与任何生产者在这两种商品之间的边际产品转换率相同。

纳什均衡

纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。

假设有n个局中人参与博弈如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1] ,则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合Strategy Profile纳什均衡,从实质上说,是一种非合作博弈状态。




本文来源:https://www.wddqw.com/doc/90dac41864ec102de2bd960590c69ec3d5bbdbe5.html