第二节社会偏好与内化规范研究进展_社会转型中的规则偏好与信任合作-QQ阅读男生历史网

书名：社会转型中的规则偏好与信任合作
作者名：关宏宇
本章字数：12198字
更新时间：2020-08-29 05:44:19

第二节社会偏好与内化规范研究进展

根据偏好分层理论，关注他人的社会偏好是社会规范的内化所形成的，即普遍认同的社会规范内化为个体社会偏好的主要内容。所谓内化规范是指一个群体内部成员外在的对应于褒奖、禁止及惩罚的激励约束的行为模式（可记为规范Norm）^[4]，“内化”（Internalization）为自己形成决策过程中的部分。这种行为模式（或称规范）是他们长期打交道（合作与冲突）的过程中所形成的，是他们共同知晓的，且相对稳定的；所谓“内化”，是相对个体若实施这种行为模式将受到自己之外的群体中其他成员的褒奖或禁止及惩罚，当个体实施这种行为时，他给自己的褒奖或禁止及惩罚，决策前，就将这种对自身行动的评价纳入选择决策之中。所以，这时个体行为并不是对外在社会规范的被动遵从，而是将其纳入自己多方面（多种偏好）综合权衡之中的选择。规范内化的结果是使人们的行为自发自觉地受到规范取向的指引和约束的影响。

在经济学分析体系中对如何纳入内化规范进行分析，包括如何在经济学分析体系中准确把握内化规范的性质含义、模型中的变量设置，现实中如何度量观测其存在或影响，或者说能否在经验事实中观测内化规范并检验其存在，或者检验对决策均衡的影响，以及内化规范是如何形成的，本章文献综述的任务仅仅是通过对别人已有工作的细致理解，考虑经济学分析体系中是如何刻画内化规范的，进而准确把握内化规范的性质含义、模型中的变量设置，是简略考察内化规范如何形成的相关讨论。

下面通过对有关社会偏好和内化规范理论的简要回顾，综合已有的实验室合作行为研究结果，逐步考察导致合作行动的因素，以及社会偏好与内化规范存在的实验证据，在实验结果的基础上采用决策认知的BPC统一框架（信念-偏好-约束），探讨个体决策模型中，主要偏好如何在效用函数中纳入社会偏好与内化规范，以便对社会偏好和内化规范如何影响（合作与冲突）行为做出解释。

一社会偏好与内化规范理论思想简要回顾

针对现实中的捐赠、合作、对规范的遵守等事例，以及实验研究中呈现的利他或自我实施的遵守规则的行为，主流经济学模型做出了必要的应对，实验经济学和跨学科的研究则给出了带有革命性的拓展。

（一）长期重复交易

主流经济学模型所做出的应对，主要就是在经典的企业或个人长期收益最大化模型的基础上的拓展。处理的思路是，认为采取合作行动、对规范的遵守是决策者基于声誉考虑的行为选择，即长期重复交易机会的存在，无限期重复交往的合作解收益大于一次性背叛，这使得双方趋于选择合作行动。

Trivers（1971）的互惠利他理论就属于这一类，他指出每个人类个体都携带利他和欺骗的倾向（Altruistic and Cheating Tendencies），当未来两个人从事重复交易的机会足够高的时候，自然选择会偏爱双边交易中的互惠利他行为。由于对方在未来可以将“撤回合作”作为威胁策略，经济主体为了长期利益而不得不抑制自己的欺诈或不合作行为。也就是说利他倾向是自然选择下的演化产物。或者说互惠利他理论的基础是演化模型，即在生态演化过程中出现人类超越亲缘利他的互惠合作行为。因此，在双边重复交易中，互惠合作或利他就成为一个稳定的演化结果。此外，多人捐赠的公共物品模型及实验也都表明，多人合作均衡的出现，往往要通过外界有效的监督反馈才能得以实施。

（二）个体效用是他人收益水平的增函数

上一种拓展，实际是将合作行为解释为个体受长期自利受益最大化驱使所做的选择。进一步的拓展，是在偏好构成中加入新的内容，即考虑人们进行决策时还受非自利偏好（Other-regarding Preferences）的影响。加入决策者具有纯粹利他（叶航，2005）倾向的设定。尽管对这种利他行为是否真正存在尚有争议，但是著名的“汤姆森瞪羚 ”（Gazelles Thomsoni）的例子（叶航，2005）已为其提供了生物界的确凿证据。携带这种利他倾向的个体，套用哲学家内格尔（2005）的说法，“不是出于自利，也不是出于仁慈和同情，而仅仅是出于为他人利益着想的行动意愿”。这种利他主义的伦理态度还是以理性为基础的，例如，一个人对饥民的粮食捐赠是根据自己对缺粮程度的判断。Becker（1974）给出了这种利他偏好用个体效用函数的表示，就是将他人收益或效用水平当作个体效用函数的一个自变量，给出了非传统意义上的效用函数。改善他人福利水平的行为可以提高个体效用，从而解释在传统自利假设下无法理解的利他捐赠行为。

（三）Warm-glow——个体做出捐赠等行动本身会给行为人带来效用改善

通常对决策过程的处理集中关注的是收益结果以及决策的成本大小，认为决策者只是把行动方式作为实现目的的手段，没有对行动方式的价值判断（适当还是不适当、好还是坏）。不仅人们干什么很重要，而且他们干这种事的方式也很重要，所谓的适当方式（Proper Means）就是道德和规范层面的问题。道德规范决不能看作一种技术方法，而是一种人类实践。也就是说传统假设缺乏某种对人的本性和道德之间基本联系的正确评价，没有抓住事物内部的、人的、实际接触的方面。

针对这种个体做出的行动本身，会给行为人带来效用改善的情况，Andreoni（1989，1990）称为Warm-glow（暖光）。这是Andreoni在解释捐赠行为时提出的，它是指捐赠者个人可以从捐赠行为本身获得的效用，而不是因为考虑其他人收益水平改善而增大了自己的效用。

（四）Inequity Aversion——不公平（不公正）厌恶

Fehr和Schmidt（1999，2005）、Charness和Rabin（2002）、Fowler等（2005）和Dawes 等（2007）详细讨论了个体效用中的不公平厌恶，即除了上面讨论的情况以外，个体还具有对公平的偏好（The Preference for Fairness and Resistance to Incidental Inequalities），其效用依赖自己对他人所做的举动是否偏离某个标准的判断。例如对群体中违反合作规则而多得好处的人、对受到不公而少得收益的情况，有可能宁愿损失自己的财产打抱不平。对这种耗费自己的利益为代价，以取得较公正的分配状态，从而改善自己的效用的情况，相应的效用函数在下文展开。

简言之，受这种偏好驱使的人会与遵守规范的人合作，同时自愿付出成本惩罚违反合作规则的人（与合作者合作，惩罚非合作者）。Bowles和Gintis（2004）对这种称为强互惠利他（Strong Reciprocity）的生物演化进程进行了模拟试验，提供了这种偏好设定的经验学科基础（不像经典的那样，先思辨猜想然后整理为数学形式的公理化体系）。

针对强互惠和上面提到的互惠利他，根据Zürich大学的Fehr和Fischbacher（2003）归纳的非自利动机分类，除了这两类以外，还有一类亲缘利他（Kin Altruism）。这些基于利他行为的生物演化来源和对自然选择下生存适应的功能贡献的研究，确立了利他行为存在坚实的经验学科基础。不过从生物演化形成的角度确定利他偏好，在凸显人类作为适应生存的合作物种具有与生俱来的道德倾向的同时，淡化了一个更为重要的适应性特征——携带的习得能力这种适应性优势，可以后天将经历的外部环境约束中的规范“内化”为自己的信念、意识、意向。

而社会学从其奠基人Durkheim开始，就强调人们后天的道德规范“内化”（Moral or Norm Internalization）——集体意识（Collective Conscience）向个体意识的转化（Durkheim，1897）。社会学领域大多认为（Hoffman，1977）人们并不是一直把社会道德规范看成外在强加于个体的、要求其必须遵守的压力，尽管它最初总是外在的且与个人利益相冲突的，但最终它会成为个体内在动机的一部分，决定了个体如何行动。不过，这种结构功能主义（Parsons，1937，1968）走到了另一个极端：把人们经社会化（Socialization）、服从传递（Conformist Transmission）等习得后的行为，当作既定的反应，强调社会规范和社会价值观决定了个人的行动，这样个人利益与社会道德规范的冲突不复存在。这种理论最终落入结构决定论的框架，以至于20世纪80年代以后几乎销声匿迹。

综上，一方面演化形成、基因决定的利他行为理论没有顾及后天习得的规范，另一方面以为强调后天被社会化的个体别无选择地服从传递，这两种取向均不足以揭示实际既有基因决定的利他倾向，又有后天习得的规范在对“内生偏好”（Endogenous Preference）起作用。在理论上综合两方面的工作，当属North（2005）的“信念-制度”体系形成与变迁理论，该理论将人们的道德直觉（Moral Intuitions）、学习过程等有机地结合起来，构成了对制度约束的形成和约束下个体行动选择的解释框架体系。当然，进入具体场景下的形式化分析，还需要经典的决策均衡分析模型，如Gintis（2007）提出的BPC （Beliefs，Preferences and Constraints）统一框架模型。

二实验室社会偏好和内化道德存在的实验证据

随着行为和实验经济学的发展，对于以上不同内容社会偏好和内化规范的实验考察所得到的证据也越来越有说服力，其中比较典型的简单实验有公共物品实验、最后通牒实验、独裁者实验、第三方惩罚实验、礼物交换实验、经典信任博弈实验。我们结合Camerer和Fehr（2004）以及Levitt和List（2007）的分析，在其基础上罗列几个关于合作的经典博弈实验，见表2-1。

表2-1 合作的博弈实验范式

续表

若个体做出的行动本身会给行为人带来一定的效用，则这些动机可直接体现在偏好中，并作用在效用函数上，这正是因某特定道德、规范、习俗等被行为人内化而产生的直接影响，或者说是行为人实施的自我约束，这一部分是本书重点讨论的内容；另一部分则是因个体行动产生或给他人造成一定的结果，此结果的反馈作用于行为人效用函数之上产生的间接影响，这是通过外界监督反馈实施的道德规范。前一部分，即可归入内化规范范畴 ^[5]的，体现为偏好中产生直接效用的非自利动机。

考察利他行为的实验工作从n人囚徒困境中是否存在非自利偏好开始，然后逐步比较，是否会有纯粹的“维护正义”偏好和暖光效应。

（一）公共物品实验与非自利偏好——“善良”的存在

在n人的囚徒困境实验中（Isaac and Walker，1988； Isaac et al.，1994），设置每个个体都有m的初始禀赋，让他们决定把其中的c_i（0≤c_i≤m）投入公共物品账户中，剩下的作为私人物品保留给自己。投入公共账户后每个人都有一样的收益，即α·（∑c_i）/n，1≤α≤n。虽然每人都捐赠m是帕累托有效的，但显然子博弈精炼纳什均衡（Unique Subgame Perfect Nash Equilibrium）是c^*_i=0，即理论解的结果应该是一分钱都不投入，总的∑c^*_i也应该是0。然而，实验结果显示不论怎么调整n、m、α，多组的平均捐赠量∑c_i都会大于0。这一实验结果证明了非自利性偏好的存在。此外，Rabin（1993）开创性地给出了针对互惠动机的模型化处理，通过设定善良函数（Kindness Function）考察两人间的互惠博弈过程，得到了互惠的均衡结果，即公平均衡（Fairness Equilibrium）。Ledyard（1995）曾经归纳，“关于究竟是什么导致个体在公共物品实验中不同行为模式仍没有达成一致。几种可能的原因有出于对他人收益的利他偏好（altruistic preferences for others' earnings），或是对于他人贡献的互惠响应（reciprocal responses to others' contributions），或是一定程度的困惑与错误（confusion and error）”。

所以究竟是出于对他人收益等的非自利偏好，还是出于判断他人出钱时的纳什均衡，抑或是对声誉的追求，或是困惑与错误，这是需要从机理上弄清楚的。

为了回答上述问题，Andreoni通过调整分别始终在一个群体内部（partners）的、随机改变群体内成员（strangers）的两个组进行实验，剔除追求声誉的动机，结果显示匿名群体仍然具有大于0的个体捐赠量（Andreoni and Croson，2008，Palfrey and Prisbrey，1996）；关于“善良”和“困惑与错误”的区分，Andreoni（1995）将公共物品实验中个体支付由原来的“正和博弈”转化为“零和博弈”，剔除了因“误解或失误”进行捐赠的个体。结果显示，依然有善良动机在捐赠合作中发挥了作用，即使有1/2以上参与合作供给的个体明知存在“搭便车”的机会，仍然选择参与合作供给。当然，通过实验设计的区分，也能确认存在因“困惑与错误”而产生的捐赠。总之，非零供给的公共物品实验结果表明，除了自利以外，的确存在其他对个体行为产生作用的偏好。

但这里试验还无法区分个体究竟是认为“就应该有尽量多的G”（关于公共物品G的数量的偏好 ^[6]），还是不管别人出多少，“只要自己尽一份心”，或者是行侠仗义的强互惠利他者。所以有必要考察关于是否存在纯粹“维护正义”者的实验，和关于是否存在暖光效用的实验，我们在下文展开。

（二）最后通牒与独裁者实验——纯粹“维护正义”的存在

最后通牒实验很好地描述了很大一部分人会在交易中牺牲自身收益以避免不公平的结果，或惩罚那些不公平的行为。其中的出价提议者和接受或拒绝者这双方都有可能受到“利他”倾向或维护正义偏好的影响采取“利他”行动。

就出价方考虑，不把99%的部分留给自己而采取看似“利他”的出价现象，究竟是源于怕被拒绝的最优选择（理性选择），还是“内化”公平原则在起作用呢？这是需要恰当的实验设计来回答的问题。就接受或拒绝方考虑，明明大于零的收益被拒绝掉，这种看似拒绝“不公”的现象，究竟是源于本以为应该达到的收益受损而宁愿增加成本的一种理性报复，还是纯粹的“维护正义”，也是需要恰当的实验设计来回答的问题。下面考察这两方面的实验。

早期的实验结果中（Güth et al.，1982），大部分出价方会提出远大于0的比例，与对方分享40%～60%的财富，如果给对方的份额小于25%则被拒绝的可能性就会很大。这一结论与后期的相关实验（Camerer and Thaler，1995； Roth，1995； Camerer，2003）结论基本一致。近期著名的跨文化实验中（Henrich et al.，2001，2005），15个不同地区的对照结果也显示，内化的公平规范主导人们的选择行为。

然而依然需要考虑公平分配方案的提出究竟是因为利他、公平原则的作用还是因为怕被拒绝。为了排除出价方担心被拒绝的利己权衡的因素，独裁者实验就非常合适了——接受者没有拒绝的权利。毫无疑问，这时留下全部财富是出价方者的最优选择，但实际上大部分人仍然会拿出部分财富与对方分享。Forsythe等（1994）的实验结果显示，独裁者实验中人们仍会拿出25%的财富与人分享。这说明公平准则的确在起作用。但是再进一步，是不是有一些自利但有自我意识的被试（selfish but self-conscious subjects）会因为害怕被社会冷落（social distance）而做出并非自愿的选择呢？Hoffman等（1994）进一步改进实验，加入匿名和保密原则，这样调查人员无法知道受测者的行动，在此情况下，平均的分配方案降至10%。几次改进的实验结果尽管分配程度不同，但这样就确切地通过决策行为测出了内化公平规范的存在。

最后通牒中接受者的拒绝策略，可能是因为过低比例的分配方案伤害了接受者的自尊，或者本以为应该分得的收益受损而宁愿增加成本以实施报复，而不是因为内化的公平规范导致接受者的拒绝策略。针对这个疑问，如果能让潜在的惩罚者不受预期收益的影响（没有事先认为自己应该得到收益的预期），那么这时候人们不再牺牲自身利益去惩罚那些违反群体道德规范的人，就可以拒绝前面对不公正厌恶的强互惠利他假说。Fehr和Fischbacher（2003）的第三方惩罚实验回答了这一疑问。其实验设置是在通常的最后通牒实验的A、B之外，安排了一个第三方被试C，每个人都给一定的初始禀赋。让C观察A的分配提议，如果C认为A给B的比例太小（小于自己认为的公平尺度），那么就可以对A实施惩罚，让A受损失。C的惩罚行动要耗费一定的成本——从自己的初始禀赋里出钱。^[7]实验结果显示，A提出50%或更多给B，C通常不会进行惩罚。一旦分配方案小于50%（即违背公平），60%的第三方会采取惩罚措施，对公平原则违背越严重惩罚越重。很多人在公共物品或囚徒困境实验中加入第三方惩罚机制均得到相似的结论（Kahneman et al.，1986；Turillo et al.，2002；Carpenter et al.，2004），论证了对违反公平、合作等规范行为的第三方惩罚的确普遍存在。

强互惠理论不仅可以从行为观测层面进行检验，还可以根据该理论假说——惩罚实施者应从惩罚行为中获得某种效用满足，进一步通过脑科学实验的配合，检验其真实存在。Quervain等（2004）改进了信任博弈，让投资者具有惩罚的权利，且将惩罚场景分为有成本的惩罚、无成本的惩罚和象征性惩罚并通过正电子发射计算机断层扫描（PET）观测投资者的脑部特定区域的活动情况。实验结果显示，在对方辜负了其信任的情况下，无成本惩罚场景下个体会采取最大限度的惩罚，在有成本惩罚场景下大部分个体仍会采取惩罚，程度有所降低，在此场景下，个体的行为类似于购买一件商品，只要边际成本低于边际收益个体就会对对方实施惩罚。PET显示三种场景下的惩罚行为均会引起脑部相关区域的剧烈活动，此时受试者表现出强烈的惩罚愿望并通过惩罚行为获得较高的满足，从而试验结果（Fehr and Schmidt，2005）为强互惠者可以从利他惩罚行为中得到满足这一论断提供了生理基础。^[8]

还应该指出，在第三方惩罚的实验中同时表明了多种偏好对决策行为的混合作用，既有个体对成本的顾虑，又有对非正义的厌恶，适当的效用函数就应该包含这些多项偏好因素。

（三）挤出效应测试——纯粹“维护正义”与“只要自己尽一份心”

暖光效用是在慈善捐赠理论中提出的，关于该理论假说的检验也是在捐赠实验中得以证实的。Crumpler 和Grossman（2008）针对暖光效用而开展的实验依然给出相当可观的利他结果，即57%的参与人会进行捐赠，捐赠水平约占其财富水平的20%。针对捐赠实验，这究竟是暖光效用还是其他利他偏好决定的捐赠行为，很多学者各持己见。

如前文所述，理论上有区别的几种利他偏好对应的效用函数分别是：第一，个体效用是他人收益水平的增函数；第二，个体效用是偏离公平距离的减函数，即看到他人受益或行为偏离公平状态的距离越大效用越小；第三，个体效用是自己采取正义行动本身的增函数。

自身行动发出暖光的通俗表述就是 “只要自己尽一份心”，本书将此归为第三种利他偏好，这种偏好的启动机制是个体一旦看到收益低于公平水平（Equitable Benchmark）的其他人，就会引起脑部相关区域的活动，表现出援助愿望并通过付出行为获得满足。这种偏好也可以认为是以不公平厌恶为基础的——个体会对收益低于公平标准（Equitable Benchmark）的他人表现出利他性。

类似的，考虑对他人收益水平高于这一公平水平而产生的嫉妒情绪，他或她将从自己发出的惩罚行为中获得某种效用，引起脑部相关区域的剧烈活动，受试者表现出强烈的惩罚愿望并通过惩罚行为获得较高的满足。这种“维持正义”的行为也可能是第三种偏好的作用，虽然这个取向与捐赠给“贫者”的表现不同。同样有待厘清的问题是，究竟是否存在“维持正义”的挤出效应。按照第三种利他偏好的理论性质，一旦“不公”情景启动脑区偏好，只有自己的行动才能缓解；即使“不公”情景被他人消除，自己偏好对应的效用依然未得到满足。所以，外部维持正义的介入，不能完全挤出个体的“强互惠”惩罚行动，而是验证或区别第二种和第三种利他偏好的实验研究的任务。

上述实验研究的结果表明：存在不同性质的非自利偏好——“善良”；存在除长期合作收益最大化或对最优策略误解失误以外的，纯粹“维护正义”的偏好，而何谓“正义”是被个体内在携带的；存在依经典最优选择的“利他出价”（怕被拒绝而采取的最优选择实际上也是互惠的性质），不过其中预期对方能接受的价格也来自过去的经历，也是被个体内在携带的，只是作用在决定主观支付函数的信念上；对应的，也存在预期收益受损而宁愿增加成本的理性报复，这时的预期收益也是来自过去的经历，同样是被个体内在携带的，作用在决定主观支付函数的信念上。

公共物品实验中的挤出效应表明，存在两种纯粹利他偏好的可能。第一，个体效用是他人收益水平的增函数；第二，个体效用是偏离公平距离的减函数；存在不能完全挤出的“利他”，启动该行为的场景一旦出现，只有自身行动才能直接作用于效用函数，本书称为第三种利他偏好。实际行动中，效用函数中自利和多种利他偏好组合起来起作用，所以观测到的选择行动往往是综合作用的结果。

三社会偏好与内化规范在效用函数中的表示

交往中合作均衡的出现，恐怕主要应归功于社会偏好与内化规范。在大量的实验研究基础上，将社会偏好与内化规范引入决策理论、人类行为分析有了坚实的经验学科支撑基础。不同形式的社会偏好与内化规范在被证实广泛存在后，接下来的重要任务是社会偏好与内化规范应该如何纳入效用函数，以便分析他们对均衡状态的影响。本书在上一部分实际上已经给出了三种利他偏好下的效用函数概念，下面初步进行具体函数形式的归纳。

（一）社会偏好与内化规范如何纳入模型的理论思考

将社会偏好与内化规范纳入决策均衡模型，需要考虑以下几个理论问题。

第一，如果社会结构塑造了人们的行为规范，即包括公平水平的内化公平规范（Internalized Fairness Norms），那么人们的行动是否就是直接执行“规范”给定的行动指令？如果是这样，那就没有个体选择的余地了，经济学也就不需要再考察个体的决策均衡了。前面在理论总数部分已经指出，实际社会经济运行并不符合结构决定论。把人们经社会化、服从传递等习得后的行为当作既定反应，就像基因座位决定人类行为一样，是不符合实际的。^[9]所以，自利和利他既是受人类演化基因影响的，又是受后天经历所习得的公平规范影响的，在这两方面的影响下，个体依然在约束范围里进行权衡选择，即决策均衡模型还是必须要建的关键环节。

第二，作为影响行动的重要变量，社会偏好与内化规范有可能以怎样的形式影响选择行为？

Henrich和McElreath（2003）刻画个体间交往的道德标准（Moral Standard）给出了三个特征：①某一范围内、群体内对于个人而言，恰当（proper）行为的描述；②这种描述在该范围内被该群体广泛认可接受；③对于这种描述的违背将激怒群体中的其他人，他们会采取惩罚行动，即使需要付出一定的成本。

参考Henrich和McElreath（2003）的标准，基于North（1994）以“信念-制度”解释经济变迁的分析思路，可以从个体和群体两个层面说明道德规范如何影响选择行为。从个体层面看（即特征①），内化规范是存储于个人大脑中的某种偏好取向、约束禁忌、事件之间关联的固定信念等 ^[10]，也可以称为知识（信念-意向）体系，用于指导持有这种内化规范的个体在特定场合决策行事，以及关于其他人该如何行事的判断。原本外在的褒奖、惩罚等信号（信念体系）内化后，使个体具有了道德感（Moral Intention）。这种内化的道德标准通过一些强烈的情感——在此借用Tangney等（2007）的用法称为道德情感（Moral Emotions），如羞愧、罪恶、自豪等，与个人道德行为（Moral Behavior）和对“不遵守规则”的他人的惩罚行为相联系。正如Gintis（2003）所说，内化道德规范是通过内部惩罚，如羞愧、内疚、自尊缺失等实施的，而不是单纯的外部惩罚，如物质利益的减少或是惩罚。

从群体层面（特征②和③）看，一方面，上面提到的知识（信念-意向）体系，因个体经历习得在一群体内被一定程度地分享或者共享、认可，成为该群体的道德标准和行为规范。成功的社会往往具有稳定的有利于增强个体及社会适应性的内化规范，如积极工作的信念、利他规范、勇敢诚实的品质等。这个在群体中分享的知识（信念-意向）体系，对群体成员构成外在的“约束-激励”结构，即对个体选择的行动将依照规范做出褒奖或惩罚的相应反应，从而影响个体在各种情景下是否合作、如何交易等行为选择。另一方面，这个群体层面的交往环境，也是新的个体成员进入群体习得内化规范的知识（信念-意向）来源。

归纳起来，内化规范对个体选择的影响可以表述为：a.内化规范决定个体的好恶评价，或是对选择结果的好恶评价，或是对行动本身的评价；b.内化规范驱动个体的选择行动，要让这种行动的结果沿着一个方向尽量地“好”，或者尽量地接近一个既定目标（实际上“b”以“a”为前提），这种驱动的过程，是自己选择行动的结果经由他人反应才形成的，或自己选择行动的结果无须经他人反应就已经作用在自己的效用上；c.内化道德约束个体的选择范围，构成行动的边界。所以，纳入效用函数的内化道德在函数形式上，无非两类：一是个体选择的行动（决策变量）直接作用在自我评价的效用变化上，就类似独自一人的消费行动（久坐不动的人通过起来活动实现效用改善）；二是个体选择的行动（决策变量）间接地通过别人的行动反应，获得效用改善。

（二） BPC框架

Gintis（2007）提出了统一的BPC分析框架——信念、偏好、约束框架（Beliefs，Preferences and Constraints）。BPC在形式上就是一个博弈论方法的体现，它建立在人们具有可传递偏好以及关于他人行为和自身行为后果的信念的前提下。在此框架下对人类行为的分析可表述为：各参与个体在面对给定信念和约束的条件下，对最符合人们偏好的行为做出选择。

BPC框架模型与传统经济学的不同在于，一是行为选择不再仅仅针对客观约束，而是融入了个体们的内在的信念因素，二是BPC框架下的关于偏好、动机的设定是建立在广泛而坚实的实验基础上的。正如Fehr和Gintis（2007）所说，微观实验研究和理论模型（经实验结果印证）相结合是BPC框架模型最大的特点。

实际上一些具体模型（Andreoni，1990； Rabin，1993； Fehr and Schmit，1999）可以说是有BPC框架痕迹的，可以当作假定信念 ^[11]恒定，针对偏好做具体处理的特例。Gintis（2007）指出，用BPC的语言表述，规范被接受被遵守，并不是作为未达到某种目的的工具，而是作为偏好函数的参数，自我施加并实施的约束。也就是说，公平、诚实、忠诚等品质 ^[12]不是手段而是某种目的。例如某人内化了“要讲实话”的行为规范，他会始终讲实话，尽管在一些情况下讲实话会使他的物质收益为负；或是某人内化了“见义勇为”的行为规范，他会在别人遇到危难之时挺身而出，甚至将自己的生命置之度外。^[13]

BPC模型提出的贡献不仅在于将各学科对人类行为的分析统一在一个框架之下，更在于建设性地为我们引出接下来的研究方向：信念的构建及调整；内化道德规范的形成过程（也就是如何将道德规范转化为偏好的过程）；对这些非自利偏好更为深入地考察与实验研究，更真实地反映行为主体特征、人们决策行为过程，更好地解释人类行为。

（三）几种具体体现社会偏好与内化规范的模型

经内化的社会规范最终转化为个体的意图，这样就可以表述为某种偏好，进而纳入经济学所擅长的最优化分析框架。事实上，很多经济学家（Becker，1976；Andreoni，1990； Rabin，1993；Ferh and Schmit，1999）就将各种反映规范的偏好纳入效用函数，分析了如慈善捐赠、人类合作、劳动力市场等领域的人类行为。下面给出几个具体体现内化规范效用的社会偏好效用函数形式。

1.个体效用是他人收益水平的增函数

以慈善捐赠领域为例，Becker（1974）给出了慈善捐赠的利他主义解释，指出人们捐赠是出于一种改善接收受者福利的愿望。改善他人福利水平的行为可以提高个体效用。这样一来Becker将他人的效用函数当作内化利他道德规范的个体效用函数的一个自变量，给出了非传统意义上的效用函数，进而解释了在传统自利假设下无法理解的利他捐赠行为。延续Becker （1974）的思路的沃尔（Warr，1982；Roberts，1984；Bergstrom et al.，1986）等人提出捐赠的公共产品模型，效用函数为：

U_i=u（x_i，G），G=G_-i+g_i

其中x_i是个体i对私人物品的消费，G为群体捐赠总量，G_-i指除个体i捐赠外的捐赠总量，g_i为个体i的捐赠量，也就是i在公共品上的支出决策，这反映个体只关注公共物品总量，从而可以得出政府资助对个人捐赠的“完全挤出效应”。

2.个体效用是偏离公平距离的减函数

这一种效用函数的性质是看到他人受益或行为偏离公平状态的距离越大效用越小。在这方面的贡献可以用Ferh 和 Schmit（1999）给出的不公平厌恶模型（Inequality Aversion）为代表，即个体会对收益低于公平水平的他人，表现出利他性，同时对他人收益水平高于这一标准而产生嫉妒情绪，这样的个体效用函数可以表示为：

其中0≤β_i≤α_i，β_i≤1。该式反映了对公平的偏离产生效用损失，且他人高于公平标准带来的效用损失大于低于标准带来的损失。这样的函数设置与现实情况更为符合，自然有力地解释了现实和试验中人的行为。

3.个体效用是自己采取正义行动本身的增函数

Andreoni（1990）所提出的暖光效用理论指出，人们不只从慈善捐赠提供的公共物品中获得效用，还可以从自身捐赠中获得效用，其效用函数为：

U_i=u（x_i，G_-i+g_i，g_i）

三个影响效用的自变量中，后两项G_-i+g_i和g_i里面的g_i均属于利他行动，但是唯有第三项的g_i才是暖光效用。由于暖光效用的存在，他人的捐赠G_-i与自身捐赠g_i就不再满足完全替代关系。

4.个体效用是基于对方动机的响应

不同于上述三个效用函数，Rabin（1993）开创性地采用心理博弈（Psychological Game）（Geanakoplos et al.，1989）思想构建包含策略互动的互惠偏好模型。互惠动机下，个体行为遵循“当别人对你友善时你也对别人友善，当别人对你不善时你也对别人不善”的“互惠互损”的行为准则。不同于以往的物质博弈，心理博弈将决策者的二阶信念引入效用函数，用于分析对方意图对决策均衡的影响。Rabin（1993）构建了双人博弈中个体的效用函数，博弈方i的效用函数为：

U_i（a_i，b_j，c_i）=π_i（a_i，b_j）+f_j（b_j，c_i）[1+f_i（a_i，b_j）]

其中，a_i为博弈方i的策略，b_j为博弈方i关于博弈方j会采取的策略的信念，c_i是博弈方i关于博弈方j认为博弈方i会采取的策略的信念——二阶信念，π_i（a_i，b_j）为博弈互动的物质收益带来的效用，f_j（b_j，c_i）[1+f_i（a_i，b_j）]则表明互惠给参与人带来的效用，其中f_i（a_i，b_j）和f_j（b_j，c_i）分别为“善意函数Ⅰ”（Kindness Function Ⅰ）和“善意函数Ⅱ”（Kindness Function Ⅱ）。整个效用函数中，善意函数的构建是重点，Rabin（1993）采用自己的实际收益与期望公平收益的比较来刻画对方的善意程度 ^[14]，进而决定自身行动策略。其中，（对博弈方j而言博弈方i采取的策略带给他的）公平收益是指在博弈方i相信博弈方j选择b_j策略的情况下，在帕累托有效下博弈方j可能获得的最高收益和最低收益的平均值。根据上述效用函数，得到了公平均衡：当别人友善时，最大化自身效用的策略为以德报德，当别人不友善时，最大化自身效用的策略为以怨报怨。

上述社会偏好和内化规范的研究工作中效用函数和实验处理均表明，以往讨论的社会偏好工作大多是结果导向的，正如Camerer和Fehr（2004）将社会偏好界定为个体关于“自己与他人之间不同财产收益分配状态的排序”一样，社会偏好仍然是基于结果的效用分析思路。然而，现实中人们对于规则本身并不是无所谓的，人们不仅关注互动后的物质收益结果，也关注导致这一结果产生的过程与规则。因此有必要将过程与规则纳入效用函数进行考察。

经典社会学（Durkheim，1951）、人类学（Benedict，1934）等强调个体经历的社会化过程使人们习得相应的道德规范，并内在地进入个体偏好，从而影响或决定了个体的选择行为。本节基于North（1994）以“信念-制度”解释经济变迁的分析思路，通过梳理关于利他行为的理论和实验室成果，得出了以下主要结论。

根据道德规范的实际含义，即对应于褒奖、禁止及惩罚的激励约束的行为模式，亦称为规范，规范对个体之间决策结果的影响总是通过他们事先已经携带的对应一般情况的共同信念（Common Belief）发生作用的。

作为规范的外部作用，是对各参与方的行为与随后发生事件后果的稳定预期（Expectation），即博弈规则共享知识，规范通过博弈规则影响个体决策。

内化道德则是在即使没有外部成员对自己褒奖、禁止及惩罚时，个体仍会对一定的均衡结果或自己的行动实施自我褒奖、禁止及惩罚——形成自己的偏好。

实验研究结果确认了存在三种纯粹“利他、维护正义”的偏好，即个体效用是他人收益水平的增函数；个体效用是偏离公平距离的减函数；存在不能完全挤出的“利他”，启动该行为的场景一旦出现，只有自身行动才能直接作用于效用函数。

纳入效用函数的内化道德在函数形式上可以分为两类：个体选择的行动（决策变量）直接作用在自我评价的效用变化上，就类似独自一人的消费行动（久坐不动的人通过起来活动实现效用改善）；个体选择的行动（决策变量）间接地通过别人的行动反应，获得效用改善。

本周热推：

以法达治新丝路新梦想：“一带一路”战略知识读本问答中国：只要路走对，谁怕行程远？城乡贫困关联与联动治理机制优化当代港澳研究（2017年第2辑/总第55辑）