从进化稳定策略看大学生诚信的缺失
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
从进化稳定策略看大学生诚信的缺失 [摘要]大学生诚信缺失日益成为高校素质教育的主要问题之一。文章从进化博弈理论中的进化稳定策略出发,解释了大学生诚信缺失的现状,并针对这一问题提出了若干建议。 [关键词]进化稳定策略大学生诚信缺失 近年来,受竞争压力、社会环境、德育弱化等诸多因素的影响,诚信缺失开始侵蚀大学生的思想,并成为综合素质教育中的薄弱环节。大学生的诚信状况引起了各界人士的密切关注和广泛讨论。国内学者主要侧重于从高校德育方面进行定性研究和借助经典博弈理论进行定量分析,而以进化博弈理论为契合点的探究却不多。本文从进化博弈论中进化稳定策略的角度探讨大学生失信行为出现的深层原因,并就诚信缺失的防治提出有效对策。 一、关于进化稳定策略 进化博弈理论源于博弈论在生物领域的应用。20世纪70年代,随着梅纳德·史密斯(Maynard Smith)和普赖斯(G.R. Price)提出进化稳定策略(ESS-evolutionary stable strategy)①,经济学家、社会学家、人类学家等纷纷将视野转向该领域。与经典博弈理论不同,进化博弈论放弃了完全理性的假说,假定博弈是被重复进行的,参与人的理性是有限的,参与人只知道什么是成功的策略和不成功的策略,而不知道它为什么是成功的策略和不成功的策略。成功的策略不是一次性选择,而是需要经历一个适应性的调整过程,并且成功的策略会通过继承、模仿和学习得到推广,而不好的策略则会在进化过程中被淘汰。②这种理论框架实践性更强,由此得出的结论对现实中人们的群体行为能做出更准确的预测。 进化博弈论核心的概念是进化稳定策略。其基本思想是:假设存在一个全部选择某一特定策略的大群体和一个选择不同策略的突变个体,如果突变个体得到的收益大于原群体中个体所得到的收益,那么这个变异策略就能够侵入这个群体,反之,就不能侵入这个群体而在进化过程中消失。如果一个群体能够消除任何突变个体的侵入,那么就称该群体达到了一种进化稳定状态,此时该群体所选择的策略就是进化稳定策略。下面我们借助一个简单的模型来进一步理解进化稳定策略的定义。 假设在一个物种中,当个体与其同类为获得某种资源而发生冲突时,它们可能采取两种策略——“鹰”式策略H(hawk)和“鸽”式策略D(dove)。“鹰”式策略在战斗中全力以赴,除非对手败逃或自己身负重伤,否则绝不退却。“鸽”式策略只是进行恫吓、对峙,不主动出击,耐心等待对手退却,对手若主动攻击则在未被击伤之前逃走。“鹰”与“鹰”相遇时会一直斗到有一方受伤,另一方获胜得到资源为止。“鸽”与“鹰”相遇时,“鸽”逃走但不受伤,“鹰”取胜。“鸽”与“鸽”相遇则任何一方都不会受伤,而是长时间的对峙,直到一方先逃走,另一方获胜取得资源。在这里,个体的收益取决于两个因素:个体获胜的收益V(value),在战斗中严重受伤的代价W(wood)。这两项都以适合度(fitness,个体的适合度是衡量一个个体存活和繁衍后代成功率的一种尺度。适合度越大,个体存活的机会和生殖成功率就越大)来评价。在评价“鹰”“鸽”策略时存在以下四种情况(其收益矩阵如图1):(1)“鹰”攻击“鹰”的情况。在战斗中,胜者将得到V的收益,而败者付出W的代价,由于每只鹰都有相等的获胜机会,所以每只鹰的平均收益为E(H,H)=(V-W)/2。(2)“鹰”攻击“鸽”的情况。在这种情况下,鹰总是赢,不需付出任何代价,所以鹰的平均收益为E(H,D)=V。(3)“鸽”遇到“鸽”的情况。每只鸽获胜机会相等,因此平均收益是E(D,D)=V/2。(4)“鸽”遇到“鹰”的情况。鹰会攻击鸽,但鸽会选择逃走,所以鸽的收益是E(D,H)=0。 为了直观起见,现在我们规定V=10,W=50,假定有一个完全由“鹰”组成的种群中,有一个“鸽”的突变体,大量的搏斗在“鹰”与“鹰”之间进行,其收益E(H,H)是-20,“鸽”每次战斗都遇上“鹰”,虽然它每次都输,但它不会受伤,收益E(D,H)为0,因此,“鸽”的收益反而较高,于是“鸽”的数量在种群中越来越多。反之,如果在一个完全由“鸽”组成的种群中,有一个“鹰”的突变体,“鹰”与“鸽”搏斗,“鹰”的收益E(H,D)为10,远高于“鸽”的收益,于是“鹰”式策略在种群中扩散开来。显然,一贯采取“鹰”式策略或“鸽”式策略在进化上都是不稳定的,两者都能受到相对策略的侵蚀,因而都不是ESS。 虽然纯“鹰”或纯“鸽”式策略都不是ESS,但是有一种由“鹰”和“鸽”构成的混合型策略却能够达到稳定进化。这种混合型策略是按照特定的概率分布来决定在一场争斗中所应采用的不同策略。我们可以通过计算得出“鹰”“鸽”式策略的比例。设p为种群中“鹰”式策略的比例,则(1-p)为“鸽”式策略的比例。且种群中个体间的相遇是随机的,那么,“鹰”的平均收益为:pH=pE(H,H)+(1-p)E(H,D);“鸽”的平均收益为:pD=pE(D,H)+(1-p)E(D,D) 当pD=pH时,“鹰”和“鸽”就会有相同的收益,此时种群就会处于ESS的稳定状态,且p=V/W,相应地,“鹰”与“鸽”的比例则为V/W:(1-V/W)。ESS种群的稳定可以通过两种方法来实现:一种是每个个体均可以采取上述两种策略,但是采取“鹰”式策略和“鸽”式策略的比例为V/W:(1-V/W),而且必须是随机的;另一种是每个个体只能采取一种策略,但“鹰”式策略者和“鸽”式策略者之间的比例为V/W:(1-V/W)。如果由于某种因素,“鹰”与“鸽”之比偏离ESS时,系统都将自动恢复到这一比例。 二、解决大学生诚信缺失问题的建议 在改革开放初期,我国整个高校校园维持了一种较高的道德水平,体现出良好的校园文化。这种氛围我们可以认为在当时的环境中,几乎所有的人都采取“鸽”式策略(诚信策略),这实际上就回到了上面“鹰—鸽”模型中的初始状态:整个系统中只有采取“鸽”式策略的个体。然而,它不是进化稳定策略,很容易受到相对策略的侵蚀。如果整体内部发生了变异,即少数人开始采取不诚信的策略,而这时恰恰缺少相应的监督与惩罚制度,使得不诚信行为的机会成本(W)很小,那么采取不诚信策略的人可以比诚信的人获得更大的个人收益。因此越来越多的人将会放弃诚信原则而采取失信策略。从这个意义上讲,失信是进化稳定策略。更为严重的是,在W很小以至于V>W,而且系统环境不发生改变或改变不大,即W的数值没有提高到比V高的水平上时,根据上面的模型可以得出结论:最终社会的全体成员都会采取失信策略。因为采取诚信策略的人就像老鹰群中的鸽子一样,根本没有生存的空间。这就近似地解释了近些年来高校大学生诚信缺失的变化情况。 上述“鹰—鸽”模型分析结果表明,“鹰”与“鸽”比例为V/W(1-V/W)的混合型策略是进化稳定策略,这一结果的现实意义告诉我们,我们可以通过改变博弈的收益值来提高高校大学生的诚信度。也就是想办法使V尽可能大,W尽可能小,从而尽可能减少V/W值。我们知道V指的是个体获胜的收益,所以它可以看成是相对固定的。这样,问题的关键就在于如何提高W的值,提高失信行为的机会成本和代价,或者说提高这种变异策略的侵入边界。对于高等学校来说,可以从机制“他律”和道德“自律”两方面双管齐下,以改变博弈规则和收益矩阵,使得原有的进化稳定策略失去稳定性,让“失信者难以生存,守信者发展壮大”。结合高校的实际情况,我们可以从以下三个方面努力: 本文来源:https://www.wddqw.com/doc/9752b645b90d6c85ec3ac6bd.html