单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 重复博弈,重复博弈:基本博弈重复进行,重复博弈中博弈方的,行为,和博弈,结果,不一定是基本博弈的简单重复,必须把整个重复博弈过程作为整体进行研究。,第四章 重复博弈重复博弈:基本博弈重复进行,1,本章分三节,4.1 重复博弈引论,4.2 有限次重复博弈,4.3 无限次重复博弈,已知概率的随机停止重复博弈,本章分三节4.1 重复博弈引论已知概率的随机停止重复博弈,2,4.1 重复博弈引论,4.1.1 为何研究重复博弈,4.1.2 基本概念,4.1 重复博弈引论4.1.1 为何研究重复博弈,3,4.1.1 为何研究重复博弈,普遍存在性:,经济中的长期关系,与一次性博弈的差异:,未来利益对当前行为的制约,与动态博弈的差异:,各阶段有独立的选择和利益,短期关系中缺乏形成某种默契或合作关系,或通过报复、制裁的威胁,约束相互行为,追求共同利益的机会,4.1.1 为何研究重复博弈普遍存在性:经济中的长期关系短期,4,4.1.2 基本概念,有限次重复博弈:,给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。,无限次重复博弈:,一个基本博弈G一直重复进行下去的博弈,记为G(),没有可以预见的结束时间,主观上认为会不断进行,策略:,博弈方在每个阶段针对每种情况如何行为的计划,子博弈:,从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分,均衡路径:,由每个阶段博弈方的行为组合串联而成,4.1.2 基本概念有限次重复博弈:给定一个基本博弈G(可以,5,重复博弈的得益,若重复次数较少,或每次重复时间间隔短,重复博弈的得益若重复次数较少,或每次重复时间间隔短,6,随机停止和贴现率,随机结束重复博弈:停止重复概率p,重复下去概率1-p。设某博弈方第t阶段得益为,t,,利率为,则该博弈方期望得益的现在值为:,其中,,随机停止和贴现率随机结束重复博弈:停止重复概率p,重复下去概,7,4.2 有限次重复博弈,4.2.1 两人零和博弈的有限次重复博弈,4.2.2 唯一纯策略纳什均衡博弈,的有限次重复博弈,4.2.3 多个纯策略纳什均衡博弈,的有限次重复博弈,4.2.4 有限次重复博弈的民间定理,4.2 有限次重复博弈4.2.1 两人零和博弈的有限次重复博,8,4.2.1 两人零和博弈的有限次重复博弈,零和博弈是严格竞争的,重复博弈并不改变这一点。,以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样,,博弈方的正确策略是重复一次性博弈中的纳什均衡策略,。,上述结论可推广到非零和或多个博弈方,没有纯策略纳什均衡的,严格竞争博弈,中。,4.2.1 两人零和博弈的有限次重复博弈零和博弈是严格竞争的,9,4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈,定理:,设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G的得益。,-5,-5,0,-8,-8,0,-1,-1,坦 白,不坦白,囚徒2,坦白,不坦白,囚,徒,1,(-5,-5),-10,-10,-13,-5,-5,-13,-6,-6,坦 白,不坦白,囚徒2,坦白,不坦白,囚,徒,1,(-10,-10),4.2.2唯一纯策略纳什均衡博弈的 有限次重复,10,有限次重复削价竞争博弈,100,100,20,150,150,20,70,70,高 价,低 价,高价,低价,寡头2,寡,头,1,削价竞争博弈,有唯一纯策略纳什均衡,(70,70),有限次重复的结果仍然是,(低价,低价),上述结论对有限次古诺模型重复博弈也成立。,有限次重复削价竞争博弈100,10020,150150,20,11,重复囚徒困境悖论和连锁店悖论,重复囚徒困境博弈结果与直觉经验和大量实验结果不一致;,塞尔顿(1978)提出”连锁店悖论”,症结:较多阶段的动态博弈中逆推归纳法的适用性,B,不进,进,(1,10),A,不打击,打击,(5,5),(-2,3),重复囚徒困境悖论和连锁店悖论重复囚徒困境博弈结果与直觉经验和,12,4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈,5,5,3,,,3,2,0,0,2,2,0,6,0,0,2,0,6,1,,,1,H,M,H,厂商2,M,L,厂,商,1,L,三价博弈,2,2,3,1,3,1,1,3,4,4,7,1,1,3,1,7,8,8,厂,商,1,厂商2,L,M,H,H,M,L,两次重复三价博弈的等价模型,触发策略:,两博弈方先试探合作,一旦发现对方不合作则也用不合作报复,博弈方1:第一次选H;如第一次结果为(H,H),则第二次选M,否则选L,博弈方2:同博弈方1,可以运用触发策略实现较好的结果,子博弈完美纳什均衡路径:第一阶段(H,H),第二阶段(M,M),4.2.3多个纯策略纳什均衡博弈的 有限次重复,13,触发策略的进一步讨论,触发策略存在报复机制,的可信性问题,如果第一阶段一方偏离H,另,一方第二阶段采用报复性的L,策略是不可信的。,触发策略在不少情况是,非常可信的,4,,,4,5,3,5,3,3,5,6,,,6,9,,3,3,5,3,,9,8,8,厂,商,1,厂商2,L,M,H,H,M,L,重复三价博弈的等价博弈:,不可信报复,触发策略不可信,因此不管第一阶段结果如何,第二阶段都是(M,M),第一阶段得益矩阵,触发策略的进一步讨论触发策略存在报复机制4,45,35,33,14,两市场博弈的重复博弈(重复两次),(A,B)+(A,B)OR (B,A)+(B,A)(1,4)(4,1),连续两次采用混合策略(2,2),(A,B)+(B,A)OR (B,A)+(A,B)(2.5,2.5)轮换策略,一次纯策略+一次混合策略(1.5,3)(3,1.5),0,0,4,,,1,1,,,4,3,3,厂,商,1,厂商2,B,A,A,B,两市场博弈,没有运用触发策略的条件(或机会),触发策略不是普遍存在的,策略与平均得益,两市场博弈的重复博弈(重复两次)(A,B)+(A,B)O,15,重复博弈不同策略、均衡及一次性博弈得益比较,不同策略组合、均衡得益图示,厂商2,得益,厂商1得益,(1,4),(3,3),(,2.5,2.5,),(2,2),(3,1.5),(4,1),(1.5,3),平均效率和公平性较好的均衡结果,重复博弈不同策略、均衡及一次性博弈得益比较不同策略组合、均衡,16,两市场博弈的重复博弈(重复三次或以上),三次及以上存在触发策略运用的条件,触发策略,厂商1 第一阶段选A;若第一阶段结果为(A,A),则第二阶段选A,若第一阶段为(A,B),则第二阶段选B,第三阶段无条件选B,厂商2 第一阶段选A;第二阶段无条件选B,若第一阶段结果为(A,A),则第三阶段选A,若第一阶段为(B,A),则第三阶段选B,触发策略有很强的可信性,是子博弈完美纳什均衡,,双方每阶段平均得益:(,3+1+4)/3=2.67,均衡路径,(,A,A)(A,B)(B,A),两市场博弈的重复博弈(重复三次或以上)三次及以上存在触发策略,17,4.2.4 有限次重复博弈的民间定理,个体理性得益:,不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益,可实现得益:,博弈中所有纯策略组合得益的加权平均数组,定理:,设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们,厂商2,得益,厂商1得益,(1,4),(3,3),(1,1),(4,1),w=(1.1),其中w为一次性博弈中各方最差均衡得益数组,4.2.4 有限次重复博弈的民间定理个体理性得益:不管其它博,18,4.3 无限次重复博弈,4.3.1 两人零和博弈的无限次重复博弈,4.3.2 唯一纯策略纳什均衡博弈,的无限次重复博弈,4.3.3 无限次重复古诺模型,4.3.4 有效工资率,4.3 无限次重复博弈4.3.1 两人零和博弈的无限次重复博,19,4.3.1 两人零和博弈的无限次重复博弈,两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡,上述结论可以推广到更多博弈方、非零和严格竞争的无限次重复博弈,不存在合作的潜在利益,4.3.1 两人零和博弈的无限次重复博弈两人零和博弈无限次重,20,4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈,两寡头削价竞争博弈,该博弈一次性博弈均衡是都采用低价,是囚徒困境型博弈,4,4,0,,5,5,,0,1,,,1,H,L,H,L,4.3.2唯一纯策略纳什均衡博弈 的无限次重复,21,无限次重复两寡头削价博弈,触发策略:,第一阶段采用H,如果前t-1阶段的结果都是(H,H),则继续采用H,否则采用L。,如果博弈方2采用L,总得益现值为,如果博弈方2采用H,总得益现值为,因此当 时,,此触发策略为纳什均衡策略,无限次重复两寡头削价博弈 触发策略:第一阶段采用H,如,22,两寡头削价竞争无限次重复博弈的民间定理,厂商2,得益,厂商1得益,(1,4),(4,4),(1,1),(4,1),(5,0),(0,5),两寡头削价竞争无限次重复博弈的民间定理厂商2厂商1得益(1,23,4.3.3 无限次重复古诺模型,假定:,边际成本都为2。,在无限次重复古诺模型中,当贴现率 满足一定条件时,两厂商采用下列,触发策略,构成一个子博弈完美纳什均衡:,在第一阶段生产垄断产量的一半1.5;在第 t 阶段,如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生产古诺产量2。,4.3.3 无限次重复古诺模型 假定:,24,设厂商1已采用该触发策略,若厂商2也采用该触发策略,则每期得益4.5,无限次重复博弈总得益的现值为:,如果厂商2偏离上述触发策略,则他在第一阶段所选产量应为给定厂商1产量为1.5时,自己的最大利润产量,即满足:,解得 ,此时利润为5.0625,高于触发策略第一阶段得益4.5。,设厂商1已采用该触发策略,若厂商2也采用该触发策,25,但从第二阶段开始,厂商1将报复性地永远采用古诺产量2,这样厂商2也被迫永远采用古诺产量,从此得利润4。因此,无限次重复博弈第一阶段偏离的情况下总得益的现值为:,当,上述策略是厂商2对厂商1的同样触发策略的最佳反应,否则偏离是最佳反应。,但从第二阶段开始,厂商1将报复性地永远采用古,26,低水平的合作,9/17时,可构造如下,触发策略,:,第一阶段生产,q*(q,m,/2q*q,c,),,第t阶段,如果前t-1阶段的结果都是,(q*,q*),,则继续生产,q,*,否则生产古诺产量,q,c,。,设厂商1已采用该触发策略,则厂商2期望得益,采用触发策略:,*,/(1-),第一阶段偏离:此时厂商2最优产量q,2,=(6-q,*,)/2,得益,d,=(6-q*),2,/4,无限次博弈得益现值为,低水平的合作9/17时,可构造如下触发策略:,27,低水平的合作,只有当,厂商2才愿意采用触发策略,否则肯定会偏离。即只有当,q*2(9-5)/(9-),时,触发策略是稳定的。,结论:,越大,能支持越低的子博弈完美纳什均衡产量q*,接近0时,q*接近古诺产量2,09/17时,q,m,/2q*,q,c,,,待定惩罚性产量,可以证明对给定的贴现值,只要惩罚力度x足够大,上述触发策略为子博弈完美纳什均衡。,加大惩罚力度提高合作水平构造如下触发策略:,29,4.3.4 有效工资率,模型设定:,首先厂商选择工资率为 ,然后工人选择接受或拒绝。如果拒绝,则他作个体户得到收入 小于 ,如果