四、实证研究中的变异量控制

在研究设计阶段,我们需要制订自己的研究计划,选择研究方法和数据收集的方式,并且确定统计处理的方法。除此之外,我们还需要精心设计研究过程,这主要是通过对造成因变量变异的三种来源进行控制而实现的。这三种变异量包括:系统变异、外生变异和误差变异(Kerlinger and Lee,2000)。下面让我们首先来了解一下这三种变异量的关系。

4.1 研究中的变量变异

我们经常可以观察到在同一家企业里,员工的满意度会有很大的差异;在同一个行业里,公司经营业绩也会非常不同。这些个体/企业之间差异就是我们在研究中需要解释的变异量。研究设计的目的在于寻求合适的自变量,实现对因变量变异的解释,如我们可以用个人的收入水平来解释员工满意度的差异。但在实际情况中,因变量的变化不仅仅会受到自变量的影响,还同时受到其他很多因素的影响。如满意度可能同时受到组织的情境或气氛、个人的期望和人格特征等因素的影响。我们称这些因素为外生变量,即是自变量以外,有可能影响因变量的因素。除此之外还有误差变异,所谓误差(error)的意思是它能影响到因变量,但是它不是系统性变量(systematic variable),而是原因各异的随机因素(random factors),如被试在接受测验时的心情、当时的物理环境等。我们把这些变量的关系用图4加以表示。

图4 构成因变量变异的各种因素

研究设计从变异的角度(variance perspective)来看,最主要解决的问题是如何处理因变量变异的问题。研究者要尽力控制上述三类变异,即最大化系统变异(maximize systematic variance)、控制外生变异(control extraneous variance)、最小化误差变异(minimize error variance)。此三种变异在研究设计上有很重要的含义,不同类型的变异也要有不同的处理方法。

4.2 最大化系统变异

系统变异是指因变量的变异中受到自变量影响的部分。在研究设计时,我们希望发现自变量对因变量的显著性影响,所以研究者需要将自变量对因变量的影响最大化。最大化系统变异可以使我们把自变量的效应从因变量的总变异中区分出来,因此可以支持假设中构念之间的关系。系统变异在因变量的变异中占的比重越大,说明研究中自变量的影响越明显,我们也就更有机会发现支持我们假设的证据。

最大化系统变异可以通过样本选择或者对自变量的精准测量来实现,每一种方法都致力于让自变量对因变量有最大的效应。例如,在研究收入水平与工作满意度的关系时,如在选择的样本当中,大多数人都是对工作满意,或者更糟糕的情况是,她/他们的薪水都相似,那么研究者得到支持性证据的可能性将非常低。

由于变量性质的不同,在研究设计中的控制操纵方法也是不同的。我们可以把管理学中的变量分成两类:可变变量(active variable)和属性变量(attribute variable)。前者是指在设计中可以被操纵的、可以变化的变量。对这类变量我们可以通过实验法对其加以控制,实施具有影响力的操纵,使得实验组与控制组的情景非常不同。这样我们才有可能观察到由于对自变量的操纵而引起的被试反应。例如在Staw(1975)的研究中,研究者告诉高绩效组的被试说她/他们的绩效表现非常好,属于最优良的20%;而告诉低绩效组的人说她/他们做得不好,属于最差的20%。这就是一个运用有效操纵来提高系统变异的例子。

但在许多研究中,研究者感兴趣的变量不是可变的,或是非常难以操纵的。我们把这类变量称为属性变量。我们对这类变量的控制需要通过对样本的选择来实现。例如Farh, Hackett和Liang(2007)考察了权力距离(power distance)和个人传统性对中国员工的影响。他们从社会交换(social exchange)理论出发,提出这两种文化价值观可能调节了中国员工在知觉组织支持后的反应:高权力距离和传统性的员工更多地受到自己的角色限制,她/他们的工作态度和行为较少地受到组织支持的影响;而低权力距离和低传统性的员工则更多地看重双方在交换中的对等性,她/他们对企业的态度和行为更多受到组织支持的影响。为了验证这一假设,他们在样本选择阶段尽可能地扩大了可能影响结果的系统变异,选择27家性质不同的公司员工来收集数据,而不是在一家公司或利用MBA学生来完成问卷。通过这种方式,他们实现了对关键变量的控制:知觉到的组织支持(perceived organizational support, POS)、权力距离和个人传统性。

同样的道理,如果我们研究的是人力资源政策对于员工行为的影响,则全部的样本不能来自同一家公司/集团。这是因为同一家公司的人力资源政策基本上都是一致的,不同的部门间可能存在细微的差异,如销售员和工程师,低阶层和高阶层的人。但来自同一家公司应有很多的同质性(homogeneity),基本的情境是相同的。这时人力资源政策这个变量的变异显然不够大。研究者需要经过对样本的选择,选取不同的公司组织(例如选不同公司的研发部门)作为研究的样本,以此提高研究的系统变异。

4.3 控制外生变异

外生变异会系统地影响我们感兴趣的因变量,但却与我们的研究目的无关。换言之,这类变量在其他的研究中可能是很好的自变量,但在我们的研究中却不属于关注的焦点,所以我们需要对这类可能对因变量造成影响的外生变量实现有效的控制,将其效应最小化、抵消,或者与我们的自变量进行隔离。通过这些控制手段,我们就能够排除无关变量对因变量的影响,清晰地判断并解释自变量对因变量的影响。如果不能实现对外生变异的有效控制,在发现有显著性的关系后,我们无法判断这一关系究竟是因为自变量对因变量的影响,还是未加控制的外生变异的影响。例如,在研究创新战略对公司经营业绩的影响时,我们必须控制公司的规模和行业特征。虽然这两个因素都不是研究的关注点,但它们会影响公司的获利能力。只有控制了这些变量,我们才可以有信心地得出这样的结论,即公司利润的变动是创新的结果而不是规模(大公司倾向于利润更高)或行业(一些行业比其他行业利润更高)的影响。能否对外生变量实现有效的控制,是判断一名研究者的设计能力、对相关文献了解程度的一个很好的评价指标。

在研究设计中,我们可以通过抽样的方式(如随机化、匹配参与者等)或者统计控制(statistical control)的方式,实现对外生变量的控制。通常的控制方式有三种:

第一,排除法(elimination)。不同于选择差异化的自变量,研究者可以通过选择同质性的外生变量,来排除它们对因变量的影响。例如我们希望了解收入水平对个人满意度的影响,同时性别也有可能对满意度水平有影响,这时在取样时我们就可以单独选择男性或女性。在这种同质的样本,我们就可以排除外生变量的影响。

第二,随机分配法(random assignment)。如果我们能够随机分配被试到不同的实验组与控制组中,就能使外生变量的效应相互抵消,对其进行有效的控制。如Staw(1975)的研究即是将60位学生随机分派到实验组及控制组,以此控制了外生变异,这时得到的研究结果就不能用外生变量作为对因变量差异的解释。

第三,配对法(matching)。这种方法是指将外生变异进行配对处理,创造相对等的研究条件,从而控制外生变量。例如,如果需要考察一项组织变革的成效,我们可以选择另一家没有变革的企业作为控制组。虽然研究者不能随机分派哪家企业进行变革或哪家不变革,但研究者可选择一家与变革企业相当类似的企业(如科技的性质、制度、工厂设立时间长短等)作为控制比较对象,如此的配对即可看出变革操纵后产生的实际效果。

上面的方法都属于通过操纵样本的方式实现对外生变异的控制。但在管理学研究中,研究者不一定有条件对研究对象进行操纵。这时我们可以选择其他两种控制方式:(1)纳入法。即我们可以将外生变量纳入研究设计,并将其效应与自变量的效应加以区分。例如我们如果认为个体能力是影响绩效的一个因素,而不是只有工作满意度一个变量,我们就可以将两者一并测量。在实验法中,我们则可以将两者作为设计中的分析要素,形成2×2多因子实验设计。通过分析它们的主效应和交互效应,来区分这两种因素对员工绩效的影响。(2)统计控制。纳入法改变了原有的设计思路,使得原有的设计变得复杂,研究者还可以通过统计控制的方式实现对外生变量的控制。我们可以将这些无关变量与自变量一起进行测量,在统计分析时首先排除它们的效应。统计控制的思路简单,操作方便,但如果外生变量与自变量的相关过高,我们可能由于在排除外生变量效应的同时,低估对自变量效应的估计。

4.4 最小化误差变异

误差变异是指由于随机因素而导致的因变量变异。这是属于随机性质的,而不像外生变异那样造成系统性的偏误。最典型的随机变异是测量误差(如暂时的不注意、短暂的情绪波动等),或研究者控制不了的未知因素。我们将误差最小化,其目的就是尽可能地使系统变异显示出来。通常误差变异和外生变量对因变量变异的影响是无法区分的,这两部分之和就是我们在统计分析时所说的剩余部分(residual),即我们感兴趣的自变量无法解释的部分。在进行F检验时,我们将因变量的总变异分成两部分:一部分是由自变量造成的组间差异(between group variance);另一部分是就是外生变量和误差造成的剩余部分。如果我们能够尽量减少测量的误差,就可以使测量更精确,提高我们统计分析的F值,从而增加我们得到显著性结果的可能性。最小化误差变异可以通过控制数据收集过程,以及增强测量指标的信度而控制误差变异对研究结果的影响。

由于误差变异是由随机因素造成的差异,所以它的处理方法也表现为减少个体差异和测量误差两方面。首先,减少被试的个体差异(individual differences)。在保证最大化自变量的同时,尽量减少个体差异对因变量的影响。人与人之间的差距越小,由于个体差异带来的误差变异也越小。其次,减少测量误差(errors of measurement)。减少测量误差一方面需要我们提高测量的精确程度,提高测量的信度(reliability)(我们在第十一章会专门讨论测量的信度),另一方面需要我们有效地控制测量情境。情境控制可以使测量更精确。如在实验时尽量减少实验者的不同,例如性别的不同、讲话语气的不一样等。用放录音带的方式,使指导语的速度和声音尽量标准化。在问卷调查时,尽量保证室内环境、问卷填答的时间等因素保持一致。

从上面的讨论可以发现,在研究设计时,对变量的控制是非常重要的。为了实现对因变量的预测,我们需要尽可能地提高自变量的变异,控制与因变量变异有关的外生变量和随机误差。外生变量和随机误差的存在会增加自变量无法解释的因变量变异(即变异剩余量),从而降低我们在检验自变量效应时的统计检验功效(statistical power)。

在这一节我们讨论了通过研究设计对研究中的三种变异量进行控制的问题。对于一个研究中因变量的变异来说,其中只有一部分对我们是有帮助的,也就是系统变异量。因此,我们运用研究设计对变异量进行分割(partition)的目的就是帮助我们在实证研究中最大可能地确定变量间的因果关系。具体来说,就是系统变异量可以实现最大化;外生变异可以得到有效控制;同时,误差变异能够被控制到最小程度。