博弈论基础知识汇总
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。一种是“进化博弈论方法”。它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。 基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。 博弈论看法 博弈论的基本假设:参与人追求利润最大化。“在博弈论的世界里没有仁慈或怜悯,只有自利。”①即博弈论排除道德、良心、情感、责任等社会及心理因素,唯一以相对最大化赢利为行动选择的标准。这里的“利润”或“赢利”并非指经济学中的意义。在政治学中包括选票数、支持者人数、社会评价、人民喜好等诸多要素,这些要素不仅能够给参与人带来一定的满足程度,更能给参与人带来“权力”,选举权、决策权、公民权、表决权等政治权力。这些“利润”或“赢利”能够用数字度量,或者至少能够比较大小。博弈论的描述包括参与人、行动、信息、策略、支付、结果和均衡等构成要素,但其最基本的要素(罗伯特·奥曼)包括参与人、策略和效用函数。 博弈论告诉我们人具有理性的计算能力和倾向,都会倾向于选择对自己最有利的一种行为。 法律之所以能使大部分人不违法,是因为人在行动前往往有所计算,这也是对我们设计制度时的一种启示。 同时博弈论也是有局限性的,并不假设人都是自私自利的。人的行为不能完全依靠计算来预测,理性计算具有有限性,不能解决所有合作问题,不能单纯依靠建立合作有利的博弈局面来使人选择合作。博弈论也不能直接陶冶人的同情心,同情心等道德情感需要依靠宗教,伦理,美学等来培养。同时,时刻运用博弈为自己利益最大化谋算也似乎会让人缺少人情味缺少快乐。 中国古典博弈的精彩较多呈现在军事中,不仅具有典型动态博弈化的城濮之战,还有广为流传的孙子兵法。比如,国人都熟悉的田忌赛马的故事,按照博弈论的推演思路,这应该完全符合静态博弈的特征。双方在第一回合中均有自己的策略,并且甲方的策略就是乙方的策略,反之同样,此情景下达到第一层博弈均衡,在齐王之马体质优秀时获得胜利这样一个事实。当其中之一的博弈者开始变革策略,打破了原有的均衡值,就会产生新的博弈均衡,只是作为另一方的齐王没有变更策略而使新的博弈均衡毫无悬念地产生。 一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗? 绅士/美女 正面 反面 女正面 3,-3 -2,+2 女反面 -2,+2 1,-1 假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x) 这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,计算结果是-1/8元。 同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y) 解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元 如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。看起来这个博弈模型似乎没有什么用处,但是其实这可能牵涉了金融市场定价中最重要的一个模型:定价权重模型了。 总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来,并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作。 谈谈对博弈论的认识 金融0901 陈华英博弈论(game theory) 又叫对策论,是作为分析和解决冲突和合作的工具,参与人,策略集和效用构成一个基本的博弈. 参与人在博弈过程中是否能够达成一个具有约束力的协议,将博弈分为合作与非合作博弈(non-cooperative game), 后者参与人在选择自己的行动时,优先考虑如何维护自己的利益,前者强调的是集体主义,团体理性(collective rationality)。 博弈论强调时间和信息的重要性,是影响博弈均衡的主要因素。参与者之间的信息传递决定了其行动空间和最优战略的选择;博弈过程中始终存在一个先后问题,参与人的行动次序对博奕最后的均衡有直接的影响。 博弈根据参与人行动的次序和参与人对其它人的特征、战略空间和支付的知识、信息是否了解两个角度进行划分。四种博弈:完全信息静态博弈和动态博弈,不完全信息静态和动态博弈。严格讲博弈论并不是经济学的分支,只是一种方法,许多人于是将它看作数学的一个分支。它为解决不同实体的冲突和合作提供了一个宝贵的方法。 博弈论,又称对策论根据,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。它的研究对象是人与人之间行为的相互影响和相互作用,人与人之间利益和冲突、竞争与合作。博弈论对人类最大的贡献是其哲学思维方式推动人类思维模式的向前发展。 初识博弈论是在电影《美丽心灵》中,影片中有这样一个情节:在美国普林斯顿大学的酒吧里,4个男生正商量着如何去追求一位漂亮女生,当时还正在大学读书的约翰·纳什却在朦胧的“博弈论”思维逻辑引导下喃喃自语:“如果他们4个人全部去追求那漂亮女生,那她一定会摆足架子,谁也不睬。然后再去追其他女孩子,别人也不会接受,因为没人愿意当„次品‟。但如果他们先追其他女生,那么漂亮女生就会感到被孤立,这时再追她就会容易得多。”在纳什眼里,追求女生就是一场“博弈”,而“博弈”是要遵循一定规则的,是需要“博弈”策略的。当时对这种思维方式感觉很奇特,因为正常 本文来源:https://www.wddqw.com/doc/bd155549b4360b4c2e3f5727a5e9856a57122666.html