- 流域生态系统恢复价值评估:CVM有效性与可靠性改进视角
- 蔡志坚 杜丽永
- 5448字
- 2020-08-29 18:10:50
4.3 WTP与CVM
CVM通过问卷调查来估算消费者对q的变化的WTP。由于询价方法的不同,WTP在推导方法上也存在差异。尤其是采用封闭式问卷时,必须考虑分布函数设定问题。总的来说,包括参数模型、非参数模型(Ayer et al. 1955; Kriström,1990; Copas,1983; Staniswalis and Cooper,1988)、半参数模型三类(Horowitz,1993)。
参数模型要求数据生成过程是已知的。其优点是对投标点的依赖性较弱,而且能够包含更多的协变量信息,有助于检验有效性。但是,参数模型的分布函数形式一旦固定,就比较呆板,往往拟合效果较差。而非参数模型则与参数模型刚好相反,其分布函数形式是不确定的,其结果外延困难,但拟合效果却比较好。参数模型操作简便,可以外延,适于预测,但形式呆板,难以精确拟合复杂的曲线。非参数模型形式灵活,可以精确拟合复杂的曲线,但是操作相对复杂,难以较大幅度地外延预测。而半参数模型则兼具参数模型与非参数模型的优点。
当采用参数模型时,必须考虑以下几个方面:分布函数是否允许负WTP、是否允许零WTP、如何保证弱单调性、分布函数尾端的平滑特征、估值约束问题(例如,WTP必须小于收入水平)。
WTP为负的含义是,政府即使反过来补贴一定的费用,公众也不会支持推动该项目。由于污染治理不可能是吉芬商品,因此可以排除WTP为负的可能。但是,WTP为零却是合理的。例如,某些受访者可能对当前的环境质量基本满意,维持现状还是进一步改善对他们来说是无差异的。假定这部分人群所占的比例为θ,这就意味着在WTP=0处存在数据堆积现象,堆积程度由θ确定。由于零WTP具有明确的经济含义,因此在数据分析时必须予以考虑。
根据需求理论,价格越高需求量就越低。类似地,投标值越高支付意愿也就越低。参数模型必须满足关于投标值A的弱单调递减性。在参数模型下,若选取生存函数,则弱单调递减性自然得到满足。如果采用的是非参数模型,则可通过PAVA算法(Pool Adjacent Violators Algorithm)保证弱单调性。
最后一个问题是如何处理概率分布函数的右尾。即,在右尾端所允许的最大WTP的大小直接决定了平均WTP的大小。直观上,可以直接询问受访者的最大支付意愿,但正如我们在第三章所讨论的那样,开放式调查并不十分可靠。另外一种选择是以收入水平作为WTP的上限,例如不超过收入水平的5%。
4.3.1 开放式问卷
开放式问卷(open-ended questionnaire)非常直观,调查人员直接询问受访者最多愿意为环境改善支付多少费用,每个受访者都会回答一个具体值。WTP可根据样本的平均值或中位数直接得到。例如,假定样本量为n,每个受访者愿意支付的最高值为Ai,则平均支付意愿为
中位数支付意愿为
当调查中有少数受访者的支付意愿特别高时,WTPe就会存在偏差。例如询问1000位受访者对水质改善的WTP,其中999人最大支付意愿在500元以下,但是第1000位受访者的支付意愿却高达2000元。微观调查数据的可获得性极低,每一份问卷都来之不易。对待这样的异常值,首先要判断其是否可信,直接删除并非首选。例如,考察与其收入水平是否相符,与其身份是否相符等。如果异常值通过了这些初步筛选,则应予以保留;反之若初步检验无法通过,则至少存在三种处理方式。一是将异常值从样本中直接删除;二是将异常值删除,但追加适宜的观测值计入样本(如以次高值或次低值替换异常值);三是寻找异常值产生的实际原因并进行修正。当然,异常值所影响的是平均WTP,而对中位数WTP通常影响甚微,以中位数WTP作为最终评估标准可能更为合适。
当真实WTP服从正态分布时,WTP e具有最小方差。然而在CVM中,真实WTP通常不会服从正态分布,因为正态分布允许存在负值,而WTP通常是非负数。当总体服从非正态分布时,均值估计仍然是有效的估计量,但是采用极大似然估计得到的估计值更有统计效率。当然,此时需要设定WTP的具体函数形式。开放式问卷的另外一个问题是会造成数据堆积,即大量受访者会集中回答少数几个值(如20元、50元等),造成舍入误差。
在开放式问卷下,计量模型的主要作用是讨论WTP的影响因素,例如检验WTP是否随着收入的增长而增长。在开放式问卷下,受访者所陈述的WTP为受限因变量(Censored Variable),一般来说不会出现负值。因此,在分析WTP的影响因素时,经典的最小二乘法可能造成估计系数偏差。
当被解释变量具有上限、下限或存在极值时,可采用Tobit模型进行分析。人们为了纪念Tobin对被解释变量取值有限制、存在选择行为的模型的贡献,称之为Tobit模型。
假定WTP为解释变量的线性形式,且具有可加性误差项:
WTP*k是无法观察到的潜变量,表示受访者的真实WTP。受访者所陈述的支付意愿定义为WTP k。在标准的Tobit模型下,有
这样设定意味着因变量为受限的正态变量。我们称上述设定为第1类Tobit模型(Tobit1)。潜变量的期望为E[WTP*k]=βz k,而受限因变量的期望为
式中,Φ(z)和φ(z)分别为标准正态分布函数和标准正态密度函数。
在Tobit1模型下,WTP原则上可以取为负值或正值,而零响应被假定源于不可观察性。但是,这种设定并不适用于CVM研究,因为在CVM的实际运用中,零WTP具有明确的经济含义。
零WTP是受访者决策的结果,而不是不可观测的原因造成的。不仅如此,在Tobit1模型下,还隐含着一个较强的假设:给定WTP>0,自变量对支付多少的影响和对是否愿意支付的影响完全相同。换句话说,Tobit1模型没有将零响应和正响应两种不同的机制区分开来。因此,需要引入双方程模型(two-equation model)分别模拟两种决策机制。
双方程模型有很多种类型,这里采用较为简单的设定形式:
若d*=0则WTP=0;若d*=1则WTP=WTP*。E[WTP|WTP>0]=βzk。当受访者的支付意愿大于零时d*=1,反之则d*=0。因此式(4-13)是关于是否愿意支付的决策过程,而式(4-14)是关于支付多少的决策过程。由于式(4-14)只考虑因变量为正的情形,因此可以采用截断回归方法(Truncated Regression)进行分析。
但是,假定式(4-13)和式(4-14)彼此独立可能并不符合现实。例如,收入水平对两个决策过程的影响同时为正。一个修正方法是,假定式(4-13)和式(4-14)的残差存在相关性(称之为Tobit2模型):
这样,ρσεθ(γ, zk, σu)实际上度量的是样本选择偏差的影响。当ρ=0时,Tobit1模型实际上是Tobit2模型的一种特殊情况。如果无法拒绝ρ=0的原假设,则表明样本选择偏差的影响不会太大,此时可以将抗议性样本直接删除。必须强调的是,国内研究中只有少数学者在开放式问卷下考虑了Tobit1模型,但文献检索尚未发现有基于Tobit2模型的CVM研究成果。
4.3.2 支付卡式问卷
支付卡式问卷提供一组数据,让受访者从中挑选出最大(小)的支付(受偿)意愿。基于支付卡的CVM其WTP估算方法也可分为两种。其中一种和开放式CVM完全相同,直接计算平均值或者中位数,这也是国内CVM研究文献常用的方法。但是,简单地给出平均值或者中位数,会受限于支付卡所列出的投标点。例如,受访者的选择可能会局限于10元、20元、50元、100元等少数几个离散点上。此外,简单算术平均法也无从分析受访者的人口统计特征和社会经济变量对其选择的影响。
实际上,支付卡所揭示的是受访者真实支付意愿的区间而非真实值。例如,假定支付卡为[0,5,10,15,20],当受访者选取15元时,更为准确的理解是该受访者的真实WTP不低于15元但低于20元。而直接选取间隔数据[15~20]的组中值进行OLS估计,可能会造成模型系数和平均WTP出现偏差,因为组中值并不一定就等于区间上的期望值。
更为理想的替代方法是Cameron和Huppert(1989)所提出的间隔数据分析方法。由于WTP的取值为非负,因此假定WTP服从对数正态分布:
WTP*k为受访者k的真实WTP, εk服从均值为零、标准差为σ的标准正态分布。
Φ为标准正态分布的累积函数。相应的对数化极大似然为
中位数WTP的计算公式为exp(βzk),而平均WTP根据exp(βzk)exp(σ2/2)进行计算。
4.3.3 封闭式问卷
封闭式问卷(close-ended questionnaire)需要设定WTP的函数分布形式,包括参数模型、非参数模型以及半参数模型三类,本研究只讨论前两类模型的设定方法。
4.3.3.1 Hanemann模型
在封闭式问卷下,调查人员首先选取某个投标值(如A),然后询问受访者是否愿意为环境改善支付A。如果受访者回答“是”,则表明其WTP不小于A;反之若其回答“否”则表明受访者的真实WTP小于A。
封闭两分式问卷格式更加具有激励相容性。与开放式问卷不同,封闭式问卷只能判断受访者的WTP是高于A还是低于A,所得到的是受访者WTP的区间而非精确值。因此,封闭式问卷调查结果并不能直接用来度量WTP或WTA,必须构建计量模型进行估算。
Hanemann(1984)首先提出了以间接效用函数为基础的CVM估值方法,根据随机效用函数(Random Utility Function, RUF)讨论受访者的行为偏好。Hanemann认为,对受访者的行为选择应该从效用差异的角度进行解释。例如,评估对象从状态q0变化至更好的状态q1,受访者会根据两种不同情况下所得到的效用水平来决定是否愿意支付一定的费用。换句话说,受访者享受环境改善所带来的效用会大于或等于保持原有消费水平时的效用。
在RUF中,受访者知道环境状态变化所带来的效用改变,但对调查人员来说,每个受访者的偏好特征是未知的和不确定的。也就是说,受访的偏好中会包含无法观测到的随机成分。这些无法观测的因素可能源自消费者的特征,或者非市场产品的性质,也可以表示总体成员之间偏好的差异或者度量误差等。如果受访者效用的决定因素及其效用函数形式已知,那么就可以很容易地估算出效用大小。然而事实上这是不可能的,因为我们不可能知道所有影响效用的因素,即便知道所有的影响因素,也还需要进一步确定效用函数的形式。
为了更直观地描述上述逻辑,假定受访者效用函数中的随机部分为ε,其间接效用函数设定为v(p, q, y; ε)。若受访者对环境状态从q0变化至q1愿意支付费用C,则在Hanemann看来应当满足
面对C,受访者回答愿意支付的概率为
为了更直观地描述上述思想,接下来以McFadden和Leonard(1993)所提出的COX-BOX间接效用函数为例进行阐释。
定义COX-BOX间接效用函数为
式中,εi是具有可加性且均值为零的随机扰动项。将式(4-23)代入式(4-22)可得到
其中,y(λ)=(yλ-1)/λ; α=α1-α0; ε=ε1-ε0。
假定ε服从均值为零、方差为σ2的正态分布,可以得到
定义。
将式(4-23)代入式(4-21)求解方程,可以得到平均WTP的表达式为
式中,α≡α1-α0, η≡ε1-ε0。
中位数WTP的表达式为
特别地,当λ=1时效用函数退化为简单线性形式。此时平均WTP和中位数WTP的计算方法相同:
4.3.3.2 Cameron模型
与Hanemann(1984)所提出的随机效用模型的思想有所不同,Cameron和James(1987)、Cameron(1988)提出了最小支出函数法,认为可以根据受访者的支出差异来分析偏好,而无须设定效用函数。在理论本质上,Cameron模型和Hanemann模型并无二致,但在实证研究技术上,Cameron认为两分选择数据所提供的信息要比Hanemann模型更为丰富。Cameron认为,在封闭式问卷下受访者的响应取决于其实际WTP和投标值的大小。如果WTP大于等于所呈现的投标值(A)则会选择愿意支付,反之则选择不愿意支付。Cameron的思想显然更为直观、简单易懂。
1.线性模型
封闭式询价下,受访者真实WTP无法直接观察到。设该WTP为受访者的收入水平、社会经济变量以及非市场产品特征的函数:
其中zi为协变量向量,γ为其系数向量。ηi服从均值为零的独立同分布。对随机抽取的A,受访者回答“是”的概率等于
假定η服从N(0, σ2),式(4-30)可转化为
其中,α*=1/σ, β*=γ/σ。
根据式(4-29),线性模型的平均支付意愿和中位数支付意愿的表达式为
若η服从均值为0、方差为π2τ2/3的逻辑斯蒂分布,则式(4-30)转化为
Λ为逻辑斯蒂函数的累积分布函数。其WTPe和WTPd的计算公式和式(4-32)完全相同。
2.指数模型
若WTP采用指数分布形式,即WTP=exp(Zγ+η),则平均WTP的计算公式为WTP e=exp(Zγ)E(exp(η))。显然,η的分布形式直接决定了WTPe的估计结果。
若η服从N(0, σ2),则exp(η)服从对数正态分布,其均值为exp(σ2/2),方差为exp(2σ2)-exp(σ2)。代入式(4-30)可以得到
若η服从逻辑斯蒂分布,则有
若η服从Weibull分布,则有
Hanemann方法的基本思想是,受访者只要知道环境状态变化前后的效用差异就可以进行理性的决策。Cameron方法则认为,受访者只有认为投标值小于其真实支付意愿时才会进行决策。相比而言,Cameron方法在计算等价变化或补偿变化时更为直观。McConnell(1990)基于理论模型讨论了Hanemann方法和Cameron方法之间的差异。收入变量在封闭式调查中尤为重要。但为了研究方便,文献通常设定收入的边际效应为常数。这样设定包含三重意思:效应是收入的线性函数,收入的边际效应不随着资源状态的变化而变化,收入的边际效应也因个体不同而不同。McConnell指出,当这三个假设满足时,Hanemann方法和Cameron方法完全等价。随后,Park和Loomis(1993)根据实际调查数据检验了上述三个约束,结果发现只有第一个得到了印证,其余两个均被证伪。因此,不能简单地认为上述两种方法之间是线性等价变换关系。不过,Park和Loomis也发现,这两种方法在平均WTP的估计值上非常接近。因此,在实际运用中可根据研究方法的便捷性进行取舍。Hanemann的效用差分模型估计起来更为方便,而Cameron方法则需要采用非线性优化算法,很可能发生迭代过程不收敛的情况。
3.非参数模型
通过前面的分析可以看出,参数模型最大的缺点是需要选取合适的分布函数,但实践中我们很难先验地获知数据的真实生成过程。非参数模型可以避免将过多的精力放在分布函数的选取上。与参数模型相比,非参数模型的估计更容易,并且估计结果不会受概率分布函数的影响。
如前所述,在封闭式问卷下,调查人员只能观察到受访者的真实WTP是低于所提供的投标值还是高于所提供的投标值。假定WTP是随机变量,其累积分布函数为FWTP。受访者愿意支付费用Ak的概率可表示为
1-FWTP(Ak)为生存函数。常见的生存函数估计方法有Kaplan-Meier-Turnbull(KMT)和Spearman-Karber(SK)两类。一旦估计出生存函数,根据式(4-37)就可以很容易地得到平均WTP和中位数WTP。
其中,fWTP为WTP的概率密度函数。
不过,正如前面所指出的那样,WTP应该为有界的非负数。假定WTP的上限为T,则有
在KMT下有
Pk为当投标值为Ak时愿意支付的比例,K为投标点个数,PK+1=0。
在SK下有
其中,定义AK+1=T, PK+1=0。