4.3 核——联盟博弈一个重要的解概念

现在,我们面临具有可转移效用(或盈利)的合作博弈中的最基本问题之一:如果n个局中人形成一个大联盟,那么如何在他们之间分配大联盟所产生的盈利(或者如何分摊他们的成本消费,例如在机场跑道问题中的成本分摊)。

要解决这个基本问题,就需要提出“博弈的解”。“博弈的解”必须考虑到每个局中人的分配所得和每个子联盟的分配所得(更确切地,每个子联盟中每个局中人的分配所得之和),因为若存在任何一个子联盟对分配表示不满,他们就有脱离大联盟的可能,于是,使得合作成为泡影。所以,所谓“博弈的解”就是需要指派至少一个盈利向量x=xii∈N∈ℜn,其中xi是分配给局中人i的盈利。我们这里讲“指派至少一个盈利向量”,是因为依照某些公理或理论提出的解概念可能包含不止一个盈利向量,称为“集值解”。本节将要介绍的“核”(core)就是“集值解”。有些解概念只包含一个盈利向量,称为“一点解”。例如,在第5章中将要介绍的Shapley值就是一点解。

不是ℜn中所有的向量都在我们的考虑范围之内,只有满足的盈利向量才是现实可行的,众所周知,局中人的分配所得之和不应该超过他们共同创造的财富。因此,如同两人讨价还价问题一样,n人的合作博弈也应该在可行盈利向量范围之内考虑。为了在大联盟中产生达成合作的可能,要求盈利向量应当满足有效性,即

“蛋糕”不全部分完可能会引起局中人的不满,因此,有效性是指根据分配方案(配置)x分配给n个局中人的盈利之和恰好等于这些局中人的合作所得。在vGN中,所有的有效配置的全体构成集合:

这是一个“非空”的凸集,“非空”是不言而喻的,因为x=(vN),0, …,0)∈I*v),表示I*v)中至少包含一个点。至于凸性,就是说,如果x, yI*v),并且0≤α, β≤1,且满足α+β=1,那么,必定应该有αx+βyI*v)。要说明这一点,只要计算

就可以了。我们称非空凸集I*v)为博弈vGN的预分配集合(preimputation)。从数学角度来看,显然,I*v)是n维空间ℜn的一个超平面。

预分配集I*v)中的元素只满足了分配的有效性,仅仅满足有效性的配置不足以维系大联盟。譬如,x=(vN),0, …,0)在一般情况下有时很难成为维系大联盟的配置,它颇有点“地主残酷剥削农民”的味道,农民会产生“造反”的主观愿望。

一般来说,对于I*v)中的配置x,倘若至少存在一个局中人iN,按照x分配给他的盈利xivi),那么很有可能这个局中人不乐意继续留在大联盟中与其他局中人在分配方案(或者可以说是合作协议)x的基础上进行合作,因为他认为即使自己单干都比留在大联盟中获得xi来得强,一旦产生了这样的想法并且将它付诸行动,于是大联盟就岌岌可危了。看来,为了维系大联盟,配置除了应该满足有效性之外,还要考虑到每个局中人的积极性,即对每个局中人都应该满足xivi),这个需要满足的性质称为“个人理性”,因为博弈中的每个局中人都是“理性”的。

现在,我们可以定义n人合作博弈的分配集合了。它由那些有可能实施的盈利向量的全体组成。

定义4.7 如果盈利向量x∈ℜn满足有效性和个人理性,即

(1)

(2)对所有的iN成立:xivi)。

那么称x是博弈vGN的一个分配(imputation),博弈vGN的所有分配组成的集合记为Iv)。

Iv)的定义,从Iv)中选择一个或若干个分配作为合作博弈的解是合理的想法,需要回答的现实问题是,Iv)有没有可能是空集?因为如果Iv)是空集的话,“解”就处于虚无缥缈之中了。因此我们需要研究Iv)为空集的条件。

其实Iv)是空集的充分必要条件是:。如果,那么,由Iv)的个人理性条件,对于任何满足个人理性的x,,即,这与Iv)中的x必须满足有效性相矛盾。就是说,此时不可能存在这样的x,它既满足有效性又满足个人理性条件,所以Iv)只能为空。这样我们就证明了充分性。反过来,证明必要性:如果Iv)是空集,必定应当成立。利用反证法,若不然,假设,令,利用这个ε,构造一个配置,那么,x*必定满足:

可知这个新构造的x*满足有效性,又因为,所以x*又满足个人理性条件。因此,,这与“Iv)是空集”的假设矛盾。

一般情况下,我们当然地从Iv)出发去寻求联盟博弈的解。在面临的n人合作博弈中,要求其特征函数满足,从而保证Iv)为“非空”的集合。对于那些使不等式中的等号成立的情况,即,我们称该博弈问题属于“平凡”的一类,或者说它是“无关紧要”的。因为在这种情况,不难验证x=(v(1), v(2), …, vn))是唯一的既满足有效性又满足个人理性的配置。显然,我们感兴趣的情况是,它体现出“团结就是力量”,使我们所需要研究的博弈具有实质性的意义。

定义4.8 若博弈vGN满足条件:,则称它为N-实质的博弈。

对于我们需要研究的N-实质博弈,它的配置集Iv)肯定是非空的,它包含了多少个配置呢?答案是“无数个”。因为如果我们令,对于这样一个非零常数a,我们一定能够找到无数个n维向量b=(b1, b2, …, bn),其中bi≥0且b1+b2+… +bn=a。于是与无数个b相应的无数个x=(vi)+bii∈N肯定既保证有效性又保证个人理性条件:vi)+bivi)(i=1,2, …, n),因此xIv)。这表明Iv)具有无数个配置。可见,如果博弈是N-实质的,那么它的配置集Iv)包含的元素实在太多以致增加了博弈求解的难度。我们需要探讨一些准则,挑选那些最有可能发生且最“公平合理”的配置作为最终的分配方案或者作为博弈的解。为此,我们将沿着个人理性条件继续深入探讨下去。Iv)中的配置只“排除”了个人“愤而单干”的可能,这对于维系大联盟的目的还是难以达到的。我们需要考虑“存在两个人结盟,或者若干个人结盟以对抗大联盟”的可能性,甚至同时存在若干个对分配有所不满而准备退出或对抗的小联盟。什么情况会使得“小”的联盟(或称子联盟)采取对抗大联盟的行动呢?设想一个由k个局中人(1<kn)组成的子联盟S,如果通过子联盟Sk个人的共同努力所创造的财富vS)超过他们从大联盟的分配x中得到的盈利的总和,即,那么“理性”将促使这个子联盟S将拒绝x并且脱离大联盟以实施S的独自创业。我们称这种情况为“联盟S可以改善x”。如果大联盟实施分配方案x,只要存在可能出现(至少)一个子联盟S可以改善x,那么大联盟将失去吸引力或内聚力,大联盟很可能形成不起来。显然,为了维系大联盟的合作,大联盟必须具有一定的内聚力。我们赋予“内聚力”一个正式的定义:

定义4.9 如果对所有局中人构成的集合N,关于它的每一种划分(S1, …,Sk),N中的每一个局中人i都能感觉到,大联盟N存在一个分配,这个分配给予他的盈利,至少与该局中人i所属的联盟Sj创造的盈利能分配给他的一样多,那么我们称大联盟或者联盟博弈具有内聚力。

由于定义4.9是对每一个局中人iN并且对于每一种划分来叙述的,因此从定义出发可知,对于具有可转移效用的联盟博弈,如果要求博弈具有内聚力,其充分必要条件是,对于每一种划分(S1, …, Sk),成立vS1)+vS2)+… +vSk)≤vN)。

问题已经非常清楚,现在我们需要从可行配置集Iv)中精选出更为合理的配置以达到维系大联盟的合作。为此,我们很自然地要求x满足如下条件,不存在任何S∈2N\{∅},使得这个S可以改善x。当然,这种想法只有对具有内聚力的联盟博弈才有意义。从可行配置集Iv)中精选出来的满足这种想法的配置全体构成了Iv)的一个子集,作为博弈的一个解概念,我们称它为核(core)。

定义4.10 博弈vGN的核Cv)为如下集合:

在式(4.18)中,我们涉及的盈利是“正”的,意味着盈利是分配给局中人的,理性使得每个局中人和每个联盟对盈利的要求为“多多益善”。在实际情况,有些盈利是“负”的,比如成本分摊。例4.1中的机场跑道成本分摊就是一个例子。这种场合,理性将使局中人要求分摊到的“负盈利”越少越好。如果在成本前面加上负号进行研究,那么其核就如同式(4.18)所定义。但是,一般情况并不需要这样去做,对于诸如成本和风险等“负盈利”,在讨论中仅需将式(4.18)中的不等号反向过来就行了。下面我们给出的例子,其盈利就是负的。

例4.5 考虑若干人群,每个人群组织一个团体(互相帮助),这样可以减少每个局中人面临的风险。譬如,第一个人群有人数n1=100,其中每个人面临的损失为1,而发生损失的概率为q1=0.1。假如这些人决定组成一家类似于小型保险公司那样的团体,借以帮助缩减每个人面临的风险。这家公司所承担的保险费应该使得整个团体遭遇破产的概率小于0.001。假定每个人面临的风险是独立发生的,由于n1比较大,计算风险所用的二项分布可以采用大样本时的正态逼近方法,那么该团体必须拥有的资金应当等于

因此,这个团体内的每个人除了承担纯保险费0.10之外,还需要支付安全准备金0.09。对于第二个人群,假如它拥有人数n2=100,他们中的每个人面临的损失为1,发生的概率为q2=0.2。如同第一个人群一样,他们也准备合作组成自己的保险团体,并且假设也要求团体的破产概率小于0.001。那么,同样在风险独立的假设下,它必须拥有的资金为

意味着他们每个人除了上交纯保险费0.20之外,还应支付安全准备金0.12。

现在假定这两个群体决定联合起来组成单一的“公司”,在所有人发生损失的机会都是独立的假设下,为了确保联合公司的破产概率小于0.001,这家新公司必须拥有的资金为

显然p12=45<p1+p2=51。联合的结果使得整体的安全准备金减少了6,节省下来的钱如何在两个群体之间瓜分呢?按照传统的方法之一,就是以原先的纯保险费用为基础按比例分配安全准备金。于是,第一个群体将承担15,第二个群体将承担30。双方都节省了开支,然而,这种做法合理吗?因为按照这种分配方法,第一个群体节省了4,而第二个群体仅仅节省了2。从理性出发,第二个群体会希望从“6”这块蛋糕中多分得一些。这势必会引起两个群体之间的讨价还价。

倘若再添加第三个群体进来,问题将变得更复杂。假设第三个群体包含n3=120人,其中每个个体以概率q3=0.3遭遇损失1。他们组成一个确保破产概率小于0.001的“保险团体”所需要的保险资金为

现在,如果这三个群体希望联合起来组成一个比较大的“保险公司”,在损失发生的机会为独立以及要求联合公司的破产概率小于0.001条件下,容易计算需要的总保险资金等于

毫无疑问,p123=87<p1+p2+p3=102。这笔费用如何在三个群体中分摊(或者说,节省下来的费用如何在三个群体中分摊),比起只有两个群体的情况当然要复杂得多。

不妨设费用的摊派向量为(x1, x2, x3)。一个合理的分配似乎应该满足如下条件:

x1+x2+x3=87

x1≤19, x2≤32, x3≤51

第一个等式是无可非议的,它就是所谓的有效性,总共需要的87正好被三个群体分摊完。三个不等式反映了三个群体的个人理性,联合起来节省了钱,不可能让任何一个群体的支付超出不联合时它的费用,否则,就会出现宁可退出联盟的事情发生。于是,凡符合上述条件的x均属于Iv)。

Iv)中的任何分摊方案会使大家都乐意接受吗?不妨观察方案(17,30,40),显然这个方案属于Iv)。第一个和第二个群体很可能对这个方案产生“抵触”情绪,因为如果它们两个自行结盟,总共只需要资金45,少于方案的摊派17 +30 =47。因此,这两个群体只要通过互相协商达成一个协议,譬如,在“小”联盟中的支付商定为(16,29),怎么也强于大联盟摊派给他们的(17,30)。显然脱离大联盟对于第一个和第二个群体无论从整体还是从个体的利益都有好处,第三个群体无法为了让自己得益而阻止他们的结盟。换句话说,(17,30,40)虽然是Iv)中的成员,但是它不能维系大联盟。如果第三个群体希望第一和第二个群体不要离开,它必须通过谈判并且在谈判中做出适当的让步。至少应该使得x1+x2≤45才行。也就是说,第三个群体至少应该承担x3≥87-45 =42。

出于同样的理由,也应该注意到第一和第三个群体之间,第二和第三个群体之间有否结盟从而脱离大联盟的可能。经过计算,我们得到

看起来,为了维系大联盟,合理的分配(x1, x2, x3)应该满足条件:不存在任何一个子联盟可以对它进行改善。就是说,要使(x1, x2, x3)成为核Cv)中的一员,它必须满足:

x1+x2+x3=87

x1≤19, x2≤32, x3≤51

x1+x2≤45, x1+x3≤63.54, x2+x3≤75.3

或者说,核配置要求三个群体各自的保险资金具有如下的界限:

x1+x2+x3=87

11.7 ≤ x1≤19, 23.46 ≤ x2≤32, 42 ≤ x3≤51

任何违背上述界限的分配方案都有可能导致一个或两个群体退出大联盟。

例4.5显示,核Cv)的范围的确比可行配置集Iv)“浓缩”了不少,因此,Cv)实际上可以看做Iv)的一个“精炼”。同时,我们也发现,虽然对Iv)进行了“精炼”,但是满足核条件的配置仍然可能有无穷多个。“无穷多”在寻求博弈问题解的过程中给人们平添了不少麻烦。因此,“无穷多个解”构成了解概念“核”的缺陷之一。

例4.6 三人多数博弈

三个局中人1,2,3共同支配价值为1的产品。任何多数(2个人或3个人)组成的联盟可以取得产品的分配权。单个人将对此无能为力,从而落得两手空空。因此,这里的特征函数根据游戏规则自然地生成为

v(1)=v(2)=v(3)=0

v(12)=v(13)=v(23)=v(123)=1

注意,有时候为了方便,我们将v(1,2)写成v(12), v(2,3)写成v(23),等等。这种做法在一般情况下不致引起误会,在可能会发生误会的情况,将特别作申明。容易看到,可行配置集为

Iv)={(x1, x2, x3)|x1+x2+x3=1, x1≥0, x2≥0, x3≥0}

我们将指出,任何分配(x1, x2, x3),如果x1>0, x2>0, x3>0,那么这样的配置一定不在核Cv)内。因为在这样的情况下,任何两个局中人的总收入将会少于1:xi+xj=1-xk<1(ijki),那么局中人ij两个人可以组成联盟从而取得支配权,使得在他们之间完全地分配1。我们还将指出,恰好有两个人得0的任何配置也一定不在核Cv)内,因为这两个人完全可以通过组成联盟从而两人共享1,这个举动推翻了让他们得0的配置。现在我们考虑恰好只有一个人得0的配置,不妨设x1=0,于是可以记(x1, x2, x3)=(0, ω,1-ω)其中ω≠0。为了使自己的处境好一些,局中人1可以提出方案(1-ω-ε, ω+ε,0), ε也是一个正数,且ω+ε<1,这个方案足以使局中人2愿意离开与局中人3的联盟而与局中人1结盟,局中人1提出的这个方案改善了原来的分配(0, ω,1-ω)。因此,核Cv)内不可能存在恰好有一个人得0的元素。再加上有效性的要求,核Cv)内也不可能存在三人全得0的配置。综上所述,三人多数博弈的核是空集。

例4.6显示了,除了“可能包含无限多个配置”这个缺点之外,“核”还可能是空的。这可是个致命的缺陷。它意味着,我们有可能找不到一种分配方案,它可以被所有的子联盟都接受。“空核”的现实使谈判处于一种动态的变幻无穷的复杂状态。因为无论推出什么样的分配方案,只要有机会,至少存在一个联盟可以通过有效谈判来改善该联盟中成员的处境,从而推翻原来的分配方案。除了“空”和“无穷多”这两个缺陷,对于“核”来说,还存在其他的缺陷吗?下面的例子提供了另外一个可能的缺点:“逆直观”现象。

例4.7 左右鞋的匹配

局中人1拥有一只左鞋,局中人2与3各自拥有一只右鞋。假设鞋的大小相同,仅有左右之分。任意一只左鞋与任意一只右鞋可以互相匹配成一双鞋,其价值为100元。单只鞋或二只右鞋,都由于无法匹配使用而一文不值。于是,这三个人所拥有的三只鞋总共值100元。这其中,似乎局中人1拥有的一只左鞋显得最重要,因为如果没有局中人1拥有的左鞋的参与,那么任何联盟拥有的鞋的最终价值为零。面临的现实问题是,“地位重要”的局中人1应该从大联盟具有的100元价值中分得多少才比较合理呢?

首先证明,这个联盟博弈的“核”存在唯一的元素,那就是(100,0,0)。这是一个非常令人惊讶的结论。这反映了“核”配置完全没有“感觉”到局中人2与3之间可能结盟的威胁。因为如果局中人2与3组成联盟,他们仍然只能各自得到零,丝毫不可能由于他们两人的结盟而改善了自己的待遇。对于拥有右鞋的局中人2与3,只要他们是理性的,如果对其中的任何一个局中人给予哪怕是一丁点儿正的鼓励,譬如,给予局中人2以ε>0,于是分配方案变成(100-ε, ε,0),足以“引诱”局中人2与局中人1组成联盟而“背叛”与局中人3的无法给自己带来好处的联盟。但是这种方案又可以通过局中人1与局中人3之间的结盟而得到改善,因为针对局中人2对自己的背叛,局中人3可以表示自己只需要得到ε/2以引诱局中人1与自己结盟,新的分配方案(100-ε/2,0, ε/2)绝对使得局中人1与局中人3的处境都得到改善。如此看来,唯有方案(100,0,0),使得局中人1不会主动寻求变更去改善方案,而局中人2与3之间的联盟又不会对这个方案形成任何威胁,从而(100,0,0)构成了唯一的核内元素。

这样的核配置,虽然使人觉得似乎有点荒谬,但是从直观上来讲,它基本上符合经济学的解释:右鞋的供应一旦大大超过了左鞋的供应,那么右鞋将变得一文不值。然而,如果将持左鞋的人数(记为|L|)扩大到n,假定n是个很大的整数,譬如说是1000万,而持右鞋的人数(记为|R|)扩大到n+1。比起庞大的n,超额1可以说是微不足道的,因此,人们的直观意识会认为,此时左鞋与右鞋应该几乎值相等的钱。不幸地,我们将发现,“荒谬”会继续下去。人数扩大以后的博弈的“核”仍然只包含一个元素:

显然,这个分配方案与直观有相悖之处,我们称这种现象为“逆直观”。证明这个分配方案是核配置的方法与只有三个人的博弈一样。假定某个右鞋持有者得到正的盈利,那么,其他2n个局中人的总盈利一定会小于100n,此时,这2n个局中人不如摈弃那个获得正利的右鞋持有者而在他们之间互相进行鞋的匹配,这样就可以获得总收益100n,从而改善了这2n个人的处境。既然任何右鞋持有者得到正盈利的分配方案都可以通过其他联盟来加以改善,因此,要使一个分配方案属于核,右鞋持有者在这个方案中必须得到零。

有趣的是,倘若左鞋数增加到n+2,右鞋数仍然保持为n +1,现在超额供应的是左鞋而不是右鞋,此时,在“逆直观”的核配置中,荒谬继续延续,只不过左右鞋持有者的地位和收益颠倒过来了。

匹配鞋的例子为某些人对“核”作为解概念所提出的责难提供了依据。不过,无论如何“核”这个概念还是比较吸引人的,因为它满足几乎人人都认可的理性条件。根据核的定义,我们知道在核配置中,不但局中人是个人理性的,而且局中人的任何形式的联盟也是理性的。所以人们又给“核”下了如下的定义:

定义4.11 博弈vGN的核是所有联盟(或集团)理性盈利的集合。

综上所述,“核”作为解概念,它的提出具有一定的合理性。但是“核”又存在着若干缺陷和引起争议的地方,最致命的缺陷也是在实际应用中最希望得到解决的问题应当是“核有可能是空集”,因为一旦核为空集,那么就不能从核出发去求得问题的解,这样,核的重要性未免会打折扣。所以,眼下最需要我们关心的问题是:在什么情况下,博弈的核是非空的?进而再深入探讨核为非空集合的充分必要条件。这些正是下一节中试图解决的问题。