1.3 序贯均衡
纳什均衡的原始定义适用于具有完全信息的静态博弈,在不完美信息的动态博弈下可能存在不可置信的威胁。序贯均衡是对纳什均衡的严格而有影响力的改进,能够剔除不可置信的威胁,甚至被认为是对完美贝叶斯均衡的再精炼。
在博弈G 中,参与者 pi的信念βi表示对于每个信息集Iij上的具体节点x∈Iij ,该参与者对其在该节点的概率判断为βi(x)=Pr[x|Iij]。信念系统表示每个参与者信念的集合,意味着参与者对处于信息集上的具体非终止节点的概率分布判断,即参与者对于其他参与者历史行为的判断。参与者在非终止节点x的期望效用表示该参与者从节点x到每个终止节点的概率与效用乘积之和,其中,ui(e)表示参与者在每个终止节点的效用,Pr[e|s,x]表示参与者到达终止节点的概率,s表示策略组合。表示该参与者在属于该信息集Iij上的每个非终止节点的期望效用之和。
在博弈G中,给定策略组合s和信念系统β。如果对于任意参与者pi,有∀si'≠si,ui((si',s-i),β,Iij)≤ui(s,β,Iij),则称s=(si,s-i)在信息集Iij上是理性的。如果s=(si,s-i)在任意信息集Iij∈I上都是理性的,则称(s,β)是序贯理性的。如果存在一个完全混合策略组合序列收敛于s,以及通过贝叶斯法则得到的信念序列(收敛于β,则称(s,β)是序贯一致的。(s,β)是序贯均衡的,当且仅当其是序贯理性且序贯一致的。也就是说,序贯均衡要求参与者的效用不止在整个博弈中是最优的,同时在每个信息集上都是最优的。