博弈论与经济行为 博弈论已经成为整个社会科学特别是经济学的核心。萨缪尔森在他的经典教科书中曾引用过的短谚是:“你可以使鹦鹉成为训练有素的经济学家,所有它必须要学的只是两个词,供给和需求”——现在它们或许可换成“博弈”和“均衡”。 天才数学家冯诺伊曼(1904-1957)是“传奇中的传奇”。他是一个卓尔不群的数学天才,他几乎独立完成了这篇1200页的论文,进行史无前例的论述了“博弈论是一切经济学理论的正确基础”,为博弈论以后的发展打下了坚实的基础。 按照1998年诺贝尔经济学奖得主阿玛蒂亚森的看法,博弈论和社会选择理论是20世纪社会科学最主要的成就。 到目前为止,我们对经济活动的考察没有考虑人们之间的相互影响。其实,一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾,于是就出现了各种各样的问题,比如如何克服和解决人们之间的利益冲突?如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面?显而易见,这些问题的解决并非易事,于是就出现了博弈论。它为解决这些问题提供了有力工具。博弈论以人的理性为基本假定,强调策略性——一种普遍的行为现象。这种现象的广阔背景是市场中的竞争与合作。20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示经济行为的相互影响和制约方面取得了重大进展。大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题,都可看成博弈现象来研究。 下边列举两个故事,来简单说明一下。 1. 智猪博弈的故事 猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下,远离踏板的食槽端就会落下食物。若一猪去踩踏板,另一猪就会等在槽边抢先吃到食物。若小猪去踩,大猪会在小猪跑到食槽前吃光食物;若大猪去踩,大猪还有机会在小猪吃完之前抢吃到食物的一半。这两头猪会采取什么策略呢? 答案:小猪舒服地等在槽边,大猪要为争取残羹奔忙于踏板和食槽之间。 原因:对小猪而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,当然不去踩了。反观大猪,明知小猪不为,那么自己为之总还是要比不为强。 智猪故事揭示了大、小企业的关系。当企业定位于“大猪”时,应选择“主动获得”之优势策略;当定位于“小猪”时,应选择“等待获得”,这也是优势策略。比如,研究开发、为新产品做广告,这对大企业值得,对小企业是得不偿失的。完全市场中,作为一个理性企业,最可能的情况是小企业把精力花在模仿上,或等待大企业打开市场后出售廉价产品。而大企业应当以主动的态度来开拓市场。 智猪故事还给竞争中的弱者以等待为最佳策略的启发。博弈中,每一方都想方设法攻击对方、保护自己,最终取得胜利;同时,对方也是一个与你一样的理性人,他会这么做吗?这就需要更高明的智慧。任何理性企业都必然会像智猪那样,总是选择优势策略。 2. 鱼与鱼竿的故事 从前有两个饥饿的人从一位智者那里得到了一根鱼竿和一篓鲜鱼。 得到那篓鲜鱼的人在原地把鱼煮熟吃完,解决了饥饿问题,可很快又感到肚内空空,最终饿死在空鱼篓旁边。 另外一个得到鱼竿的人提着鱼竿朝向遥远的大海走去,当他终于来到海边的时候,也用尽了最后一点力气而死去。 不久之后,同样是两个饥饿的人,也从智者那里得到了一根鱼竿和一篓鲜鱼。不同的是: 他们一起去寻找大海。每到饥饿的时候,就从鱼篓中拿出一条鱼吃。 当他们最终来到海边的时候,这两个人就拿着那根鱼竿开始了捕鱼为生的日子! 博弈是一种普遍现象,人们总会有意、无意地运用博弈的思想。比如企业在决策时,总是会考虑竞争对手的反应;个人与政府之间 “上有政策,下有对策” ;金融监管与创新犹如“猫鼠博弈”;博弈还作为消遣游戏,让人们获得快乐。 博弈的特征表现为两个或两个以上具有利益冲突的当事人处于一种不相容状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。当所有当事人都拿定主意作出决策时,博弈的局势便确定下来。 博弈论的目的是要研究人们之间这种不相容的行为,推广标准的一人决策理论。 博弈论关注的问题:在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何采取行动? 基本要素:局中人(players)、策略(strategies)、收益(payoffs) 局中人以策略定胜负,以收益最大化为目标。 标准形式(normal form):G = (Xi, fi)n,其中 Xi 为局中人 i 的策略集合, fi : S R 为局中人 i 的收益函数(i = 1,2,,n)。 S = X1 X2 Xn 叫做博弈G 的局势集合。 局势:策略 n 元组 (x1, x2,, xn) ( xiXi,i = 1,2,,n)。 博弈的分类:一般按照博弈的基本要素进行分类。 按人数分:二人博弈、多人博弈 按策略分:有限(策略)博弈、无限(策略)博弈 按收益分:常和(零和)博弈、变和博弈 按性质分:非合作博弈、合作博弈 按次序分:同时移动博弈、先后移动博弈(序贯博弈) 交叉分类:以上分类方式的结合,比如二人零和有限博弈。 二人博弈中,包含着一种博弈的方法叫重复博弈。 虽然人们对二人博弈的最优解作了深入研究,但让局中人找到最优解却不是一件容易的事情,需要反复实践和锻炼,就好像棋手下棋一样,需要反复不断地下,才能越来越接近最优解。可见,博弈是需要重复进行。 但到目前为止,所研究的博弈都是一次性博弈。因此,有必要研究博弈的重复。 事实上,当博弈重复进行时,其最优结局可能会与一次性博弈的均衡有所差异。 下面以囚徒难题博弈为例,来说明重复博弈的最优解。我们将分两种情况讨论: 博弈重复进行有限次 博弈重复进行无限次 1. 有限次重复博弈 每个局中人都知道博弈将重复一个固定的次数。 最后一次博弈中局中人的推理:这是最后一次行动,每个人都认为此时是在进行一次性博弈,因而古诺均衡的标准逻辑得以应用,结果局中人双方选择“背叛”。 倒数第二次博弈:这里似乎每个人都重视合作,可以向对方发出“善意”的合作信号,以便在下次博弈中继续合作。但理性的局中人清楚,最后一次博弈中对方必然背叛。因此他在倒数第二次博弈中选择合作就没有优势,故要选择背叛。 倒数第三次博弈:局中人的推理与倒数第二次一样,结果在倒数第三次博弈中,局中人依然选择背叛。 结局:逆向归纳(backward induction)可知,每次博弈中双方都要“背叛”,有限次重复博弈的最优解依然是古诺均衡。 古诺均衡是局中人双方的短期利益所在。 2. 无限次重复博弈 每个局中人都知道,博弈要无限重复进行下去。每个局中人的策略都是一个函数序列,表明每个人在每个阶段的策略选择都是此阶段之前的博弈历史的函数。这样,局中人的收益是各t阶段收益的贴现值之和(向时刻0贴现): t 1 t 。 R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。 T1334 1r2R,R,RRTT ttt0(1r)t0(1r)(1r)TtT1(1r)tr(1r)T 只要贴现率r < 2,就有RT < R,即选择背叛无利可图,还是合作为好。贴现率小于2是平常的,说明通常情况下,只要博弈能够无限次重复下去,则可实现“(合作,合作)”。 双方选择合作是局中人双方的长期利益所在。 序贯博弈 迄今为止,我们讨论的博弈都具有简单的动态结构,即它们是一次性博弈,或者是一次性博弈的重复序列,而且还具有简单的信息结构,即每个局中人都知道其他局中人的收益情况及可以采用的各种策略。换句话说,各个局中人都是同时移动的。 然而实际中,许多利益较量博弈并不具备这种结构,局中人的决策和行动具有先后次序,即每个局中人都是在看到其他对手的行动后才开始行动的。 这种局中人在行动上具有先后次序的博弈,就是所谓的序贯博弈(sequential game)。对序贯博弈进行研究,将会产生一些新的概念和方法。 多人非合作博弈 二人一次性博弈是典型的非合作博弈,局中人之间没有串通和勾结,各个局中人都是独立决策和独立行动。 20世纪50年代,美国数学家纳什成功地将这种博弈模式推广到多人情形,接连发表了多篇研究论文,为现代博弈论的形成和发展奠定了坚实基础。 纳什对多人非合作博弈作出了明确界定,提出了多人非合作博弈的“纳什均衡”概念,并应用角谷不动点定理证明了纳什均衡的存在性。 由于纳什均衡是对矩阵博弈的古诺均衡概念的推广,因此人们也常常把纳什均衡称作古诺-纳什均衡。纳什均衡存在性定理的重要意义:该定理的结论可以直接向经济系统推广,并且这种推广是阿罗和德布罗重建瓦尔拉一般均衡理论大厦的关键所在。 u(1r) 本文来源:https://www.wddqw.com/doc/a4b0ae41fe4733687e21aab8.html