单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,A,*,第五节 演化博弈模型,1,A,第五节 演化博弈模型1A,一、演化博弈思想,传统博弈理论的两个苛刻假设:,(1)完全理性(2)完全信息,与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。,演化博弈论(Evolutionary Game Theory)把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。演化博弈理论源于生物进化论。,2,A,一、演化博弈思想传统博弈理论的两个苛刻假设:2A,为什么将演化思想引入到博弈论中?,(1)博弈论对生物学的影响。博弈论的策略对应生物学中的基因,博弈论的收益对应生物学中的适应度。在生物学中应用的博弈论与经济学中的传统博弈论最大区别就是非完全理性的选择。,(2)演化化思想对社会科学的影响。例如,在市场竞争中,我们不必要去理性的想那个策略才是最优的,最后能够在市场存活下来的企业,一定是适应能力最强的公司。,3,A,为什么将演化思想引入到博弈论中?3A,在演化博弈理论中,演化稳定策略(Evolutionary Stable Strategy,ESS)和复制动态(Replication Dynamics)是两个核心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。于是,博弈方在博弈的过程中需要不断进行学习,有过策略失误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个稳定的策略。,复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动态微分方程,可以用下式表示:,4,A,在演化博弈理论中,演化稳定策略(Evolution,当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?这就是演化博弈稳定性问题,一个稳定状态必须对微小扰动具有稳健性才能称为演化稳定策略。也就是说,如果我们假定为演化稳定策略的稳定点,则该点除了本身必须是均衡状态以外,还必须具有这样的性质:如果某些博弈方由于偶然的错误偏离了它们,复制动态仍然会使x回复到x*。在数学上,这相当于要求:当干扰使x低于时x*,dx/dt必须大于0;当干扰使得x出现高于时x*,dx/dt必须小于0,这就要求这些稳定状态处于的导数必须小于0。,演化稳定策略的影响因素分析,演化博弈关注的问题,5,A,当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?这就是演,二、复制动态中的对称博弈,(一)签协议博弈,假设:群体中“Y”的比例为x,“N”的比例为1-x,对于甲,Y:同意,N:不同意,设:群体比例的动态变化速度为,当,x,=0时,稳定;,当,x,0时,最终稳定于,x,*=1,则:,复制动态方程,6,A,二、复制动态中的对称博弈(一)签协议博弈假设:群体中“Y”,图1,签协议博弈的复制动态相位图,x,*=0,,x,*=1为稳定状态,此时,,dx,/,dt,=0,但,x,*=1为ESS,即最终所有人都将选择“Y”,7,A,图1 签协议博弈的复制动态相位图x*=0,x*=1为稳定状,(二)一般两人对称博弈,群体中采用S1的比例为,x,,S2的比例为1-,x,对于甲,当,F,(,x,)=0时,,复制动态稳定状态为:,x,*=0,,x,*=1,,x,*=(,d,-,b,)/(,a,-,b,-,c,+,d,),则复制动态方程,F,(,x,):,8,A,(二)一般两人对称博弈群体中采用S1的比例为x,S2的比例为,稳定性定理,若,x,0;,若,x,x,*,为使,x,x,*,应满足,F,(,x,)0.,F,(,x,)=d,x,/d,t,,,t,,则,x,F,(,x,)=d,x,/d,t,,,t,,则,x,这意味着:,当,F,(,x,*)0,,x,*为ESS,9,A,稳定性定理若x0;F(,(三)协调博弈的复制动态和ESS,当,F,(,x,)=0时,,x,*=0,,x,*=1,,x,*=11/61为稳定状态,复制动态方程,F,(,x,):,图2,协调博弈的,复制动态相位图,可知,当,F,(0)0,F,(1)0,则,x,*=0和,x,*=1为ESS,这意味着:,当初始,x,11/61时,ESS 为,x,*=1.,10,A,(三)协调博弈的复制动态和ESS当F(x)=0时,x*=0,(四)鹰鸽博弈的复制动态和ESS,令,x,为采用“鹰”策略的群体比例,,1-,x,为采用“鸽”策略的群体比例,则复制动态方程,F,(,x,):,当,F,(,x,)=0时,,x,*=0,,x,*=1,,x,*=v/c为稳定状态,11,A,(四)鹰鸽博弈的复制动态和ESS令x为采用“鹰”策略的群体比,假设v=2,c=12(,表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益),F,(0)0,F,(1)0,而,F,(1/6)0,,则ESS为:,x,*=1/6,当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处的可能性为25/36;一方霸道、一方忍让的可能性为10/36。,发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。,12,A,假设v=2,c=12(表示种群间发生冲突导致的损失很大,,假设v=8,c=8,(表示种群间和平共,处所得到的收益等于两者冲突导致的损失),ESS:,x,*=1,当cv时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因在于当一方忍让时,另一方可获得更多收益。,这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。,假设v=8,c=4,(表示种群间和平共,处所得到的收益大于两者冲突导致的损失),ESS:,x,*=1,13,A,假设v=8,c=8(表示种群间和平共ESS:x*=1,(四)蛙鸣博弈的复制动态和ESS,令,x,为采用“鸣”策略的群体比例,,1-,x,为采用“不鸣”策略的群体比例,则复制动态方程,F,(,x,):,m、P为求偶成功的概率,z为机会成本,(体力消耗、危险性等),满足:m,(0.5,1,,mm-z0,ESS:,x,*=,(m-z)/(1-P),在这种情况下,无论初始状况如何,最后总有,(m-z)/(1-P)比例的雄蛙鸣叫。,当个别雄蛙“搭便车”的收益大于群体雄蛙“鸣叫”所获得的收益时,则总会存在搭便车“不鸣叫”的雄蛙。,15,A,若(m-z)/(1-P)(0,1),即1-Pm-,若(m-z)/(1-P)m,ESS:,x,*=0,显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。,当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣叫。,若(m-z)/(1-P)1,即m-z1-P,ESS:,x,*=1,16,A,若(m-z)/(1-P)mESS:x*=,对称博弈:相似/相同群体中的演化博弈行为,非对称博弈:不同群体间的演化博弈行为,三、复制动态中的非对称博弈,有两个群体:竞争者和在位者,(一)市场阻入博弈,17,A,对称博弈:相似/相同群体中的演化博弈行为三、复制动态中的非,A:“进入”的群体比例为,x,“不进”的群体比例为1-,x,B:“打击”的群体比例为,y,“不打击”的群体比例为1-,y,对A而言:,则竞争者群体的复制动态方程,F,A,(,x,):,采用A表示竞争者,B表示在位者,假设:,18,A,A:“进入”的群体比例为x对A而言:则竞争者群体的复制动态方,竞争者群体的复制动态方程:,A:“进入”的群体比例为,x,“不进”的群体比例为1-,x,B:“打击”的群体比例为,y,“不打击”的群体比例为1-,y,竞争者的群体复制动态相位图为:,(b),y,1/2,ESS:,x,*=0,(a),y,=1/2,x,*,0,1,(c),y,5/6,ESS:,x,*=0,(a),y,=5/6,x,*,0,1,(c),y,1/6,ESS:,y,*=0,(a),x,=1/6,y,*,0,1,(c),x,1/6,ESS:,y,*=1,27,A,B群体的复制动态方程:B的群体复制动态相位图为:A:采用“鹰,A:“进入”的群体比例为,x,“不进”的群体比例为1-,x,B:“打击”的群体比例为,y,“不打击”的群体比例为1-,y,最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例,当初始状态落在A区域,ESS为,x,*=0,,y,*,=1,当初始状态落在D区域,ESS为,x,*=1,,y,*=0,当初始状态落在B、C区域,为不稳定状态,但可以确定最终大部分结果是落在D区。,落在区域A的概率为1/36,区域D的概率为25/36。剩下的10/36的可能性中绝大部分也会稳定在D区域。,28,A,A:“进入”的群体比例为x最后,得到竞争者和在位者两群体复制,谢谢大家!,29,A,谢谢大家!29A,