1.6 数据统计检验

1.6.1 离群数据的检验

在实验中,一定条件下重复测定所得到的一组数据具有一定的分散性,这种分散性反映了随机误差的大小,但是可以认为这一组数据是来自同一正态的总体。当然,也无法排除实验中由于各种因素的改变而产生系统误差的可能,后者显然不来源于前者的同一总体,结果产生了离群数据,或称为异常值。为了进行离群数据的检查,首先要确定判断离群值的准则,然后再选择合适的统计检验方法。

(1)判断离群值的准则

确定一个合理的显著性水平或概率水平为1%或5%。

①如果统计量的计算值≤5%的临界值时,被检验的数据称为统计上不显著,不属于离群数据,应该保留。

②如果统计量的计算值>5%的临界值,而同时又≤1%临界值,被检验数据称为偏离值;对偏离值除非产生的原因很清楚,一般不予以剔除。

③如果统计量的计算值>1%的临界值,被检验数据称为离群值,应剔除。

以上1%和5%均为显著性水平。

(2)检验离群值的方法

离群值的检验方法较多,如拉依达(laǔta)方法、肖维勒(Chauvent)方法、偏度峰度法、格拉布斯(Grubbs)法、狄克逊(Dixon)法、t检验法和Cochran法等。这里介绍3个常用的、被公认为是较好的方法,即Grubbs法、Dixon和t检验法。

①格拉布斯(Grubbs)法 Grubbs采用的统计量为:

(1-22)

式中,xd表示可能的离群值,一般为同一组数据中的最大值(Xmax)或最小值(Xmin);为所有被检数据的平均值;s是包括可疑值在内的数据标准偏差。根据样本容量n值,及确定的显著性水平α(一般取0.01或0.05)。查Grubbs检验临界值表,得到临界值Gαn),比较计算值G与表中查得的Gαn),进行判断。若GGαn),则xd为异常值舍去;若G<Gαn),则xd不是异常值,应保留。Grubbs法判断离群的异常值要依靠Grubbs检验临界值表Gαn)(见表1-29)。

表1-29 Grubbs检验临界值表Gαn

②狄克逊(Dixon)法 Dixon法是应用极差比方法,经过简化而可得到严密的结果。为了提高判断效率,不同的测定次数应用不同的极差比。

具体步骤如下。

第一步:将样本值在n次测量中按数值的大小顺序排列为x1x2≤…≤xn,设x1xn可能是离群值。

第二步:计算离群值与最邻近数据的差值,除以全组数据的极差,其商为D值。以式(1-23)计算D值:

(1-23)

第三步:判断,如果计算的D值,若D计算≥D临界值,则表明x1xn是离群值,应弃去;反之,就保留此数据。临界值可以查Dixon检验法临界值表(见表1-30)。

表1-30 Dixon检验法的临界值表

不同的测定次数应用不同的极差比,其计算D值公式为下:

当3≤n≤7时,

当8≤n≤10时,

当11≤n≤13时,

当14≤n≤25时,

t检验法

t检验法采用的统计量t为:

  (1-24)

式中,xd为怀疑的离群值;为不包括离群值在内的(n-1)测定值的平均值;S为不包括离群值的测定值的标准偏差。

检验步骤:第一步是将怀疑是离群值的数据代入式(1-24)中,计算t值;

第二步是确定显著性水平α与测定次数n,查t检验的临界值Tαn表1-31;

第三步为判断,若t计算值>t临界值,则将xd作为异常值弃去,若t计算值<t临界值,则xd应保留。

表1-31 t检验的临界值表Tαn

上述介绍的Grubbs法、Dixon法和t检验法是比较严格的统计方法,在要求较精密的实验中,可以选用其中两种方法加以判别,以便合理地剔除异常值而保留正确值。剔除的异常值应是少量的和个别的测量值,否则应从实验上寻找原因。以上三种方法既可以作为实验室内平均值的异常值检验,又可以作为各实验室间的平均值的异常值检验。

(3)检验离群值(异常值)注意事项

①在检验异常值之前,首先对测量的数据核查,若有的数据明显是由于某种过失,如溶样时样品溅出,污染原因造成异常或测定时由于仪器不正常引起的异常,事先应将其舍去,再进行统计检验。

②因为检验异常值的统计方法均适用于来自正态分布总体的样本,所以必须首先检查确定总体是正态分布时才能使用,在分析实验中,一般情况所测量的数据及随机误差属于正态分布的,若样本来自对数正态分布总体,应先将数据取对数,然后用对数样本进行检验。

③以上三种检验法中,Grubbs法、t检验法大小样本都适用,Dixon法仅适用于容量不大于25的样本。

④在用统计检验法剔除异常值时,应注意异常值可能不止一个,应逐个判断,逐个剔除。判断从最大值开始,若是异常值,剔除后再判断次大值,直到所判断的不是异常值为止。

⑤经判断确定异常后,通常的做法是不要轻易地舍去,首先应检验实验过程是否存在问题,为稳妥起见,分析人员应对其重新测量,必要时从称样开始严格地进行每一步实验。复查这个数据,若结果与前面相同,仍为异常,则排除实验因素,进一步考核采样及运输过程是否有污染的因素,必要时,重新采样再次测量,以做最后的判断。

(4)实验室间的离群值检验

不同的实验室对同一个试样测定,得到不同的平均值,通过统计检验的方法来判断实验室间是否存在离群值,当然,这个离群值就不是个别数据的离群,而是一组数据的离群。判断方法如下。

第一步:将m个实验室对同一试样测定得到m个平均值将其按大小顺序排列

第二步:对最小平均值和最大平均值怀疑是否离群进行检验,按下式计算统计量

(1-25)

式中,分别为第1个实验室和第m个实验室测量数据的平均值;m个实验室的总平均值;m个实验室间平均值的标准差。

若测量次数相同时均为n次,实验室间单次测定的标准偏差为

(1-26)

若测定次数不相同(n1n2≠…≠nm)时,则

(1-27)

式中,Si为第i个实验室单次测量的标准偏差。实验室间平均值测定的标准偏差为

  (1-28)

第三步:判断,由式(1-25)计算的统计量T值和从表1-32中查得的相应显著水平αm下的临界值比较,若T1>TαmTm>Tαm,则与其他实验室平均值之间有显著差异,应剔除第1个实验室或第m个实验室的一组数据;反之,则应保留。

表1-32 实验室间离群值检验临界值表

1.6.2 t检验法

在分析实验中,一般只进行少数的几次测定,是小样本实验,适用于小样本的统计方法。t分布规律是小样本的统计规律,当大样本为正态总体时,小样本的t分布也是属于正态分布,可以计算样本数据的平均值和样本的标准偏差S,使用统计量t来进行平均值是否存在显著差异的检验。用t检验可以对在有限次的测定中,两种方法、两个实验室或两个分析人员测定值是否存在显著性差异,可以通过计算统计量t值,与相应的tαf临界值比较,即可做出判断。

为了检验一个新的分析方法是否存在系统误差,可以用已知含量的标准样品进行对照分析,也可以应用国家规定的标准方法或应用经典的公认的测定方法进行对照实验。如果两者之间存在统计上的差异,就说明新方法有系统误差;否则,说明新方法的误差属于偶然误差或称随机误差,新方法可靠。在实际工作中,如果测定数据精度高,两个平均值相差又比较大,这种情况容易判断。若有时两组数据本身不很精密,但两个平均值又相差不大,这种情况借助经验是不易判断的,借助于统计量t即可以解决。

(1)已知标准值的t检验。

如果已知标准值,或者由其他方法可以得到一个“真值”的结果,去检验一个新方法的平均值,这实际上是用标准试样法检验样本的平均值。标准样品的值视为真值(μ),用新方法测定标样n次,从样本值计算平均值()和标准偏差(S),用t统计量式(1-18)来检验样本和标样真值(μ)是否存在统计学上的差异。

t检验步骤如下:a.根据样本值,计算平均值和标准偏差S;b.根据式(1-18)计算统计量t值;c.根据给定的显著性水平α和测定次数n,查t分布表1-27,得到tαf临界值;d.比较计算的t值与tαf临界值的大小;e.>tαf为有显著性差异,<tαf为无显著性差异。

给定的显著性水平α值为0.05和0.01两个界限,作为t检验的两个显著性界限值,在统计中经常使用。

【例1-1】 用某种方法测定分析纯氯化钠中氯的百分含量。10次测定结果为60.64,60.63,60.67,60.66,60.70,60.71,60.75,60.70,60.61,60.70;并且已知“真值”为60.66%,问这种方法是否可靠?

解:根据样本计算=60.68%,标准偏差S=0.044代入t公式中,则

t分布表,当显著性水平α为0.05时,自由度f=10-1=9时,查得t0.059=2.26,由于t计算=1.43,t临界值=2.26,1.43<2.26,判断出样本的平均值与“真值”含量之间没有显著性差异,故认为这种测定方法可靠。

(2)两个平均值之间的t检验

判断两种方法,两个实验室,两个分析人员测定值是否存在显著性差异,使用的统计量为

(1-29)

(1-30)

式中,Sp为两个样本的组合偏差或称合并标准差;分别为两个样本的各自平均值;x1ix2i分别为每组数据的个别值;n1n2分别为每组的测量次数。自由度f=n1+n2-2。

也可用下面形式的公式计算t

(1-31)

(1-32)

式中,为合并样本的方差;分别为两个样本的方差。

【例1-2】 在一次实验中,用等离子体-质谱法(ICP-MS)和火焰原子吸收法(FAAS),测定同一个土壤样品的锌含量(μg/g),两组数据如下。

FAAS法:93.08,91.36,91.60,91.79,92.80,91.03,91.91

ICP-MS法:93.95,93.42,92.20,92.46,92.73,94.31,92.94,93.66,92.05

试用t检验法确定ICP-MS法是否存在系统误差,

解:

t分布表1-27,当显著性水平α为0.05,f为14时t临界值t0.0514=2.15,判断出因为t计算=2.48,t0.0514=2.15,t计算>t临界,所以两者之间有显著性差异,结果表示是两种方法之间有显著性差异,即ICP-MS法在这次测定中有系统误差。

(3)具有多个试样的t检验。

有时往往通过分析成分稍有变化的几个不同试样,与某种公认的方法相对照来试验一个新方法,或者比较两个实验室采用相同方法对n个试样测量结果的比较,常采用配对比较的方法,配对的特点就是数据要成对,配对试验t检验法所用的统计量是

(1-33)

(1-34)

式中,是所有数据配对差的平均值;Sd为配对测定之差的标准偏差;Di是两个实验室(或两种方法)对每个试样测量结果的配对差(考虑正、负值)。

【例1-3】 利用氢化物发生-原子荧光光谱法测定土壤中砷的含量,来比较两个实验室的测定结果是否有显著性差异(见表1-33)。

表1-33 配对数据

解: =0.95

t分布表1-27,当显著性水平α为0.05,f=n-1=5时,;判断,t计算=2.69,t临界=2.57,t计算>t临界,所以可以判断两个实验室的测量结果存在着显著性差异。

(4)t检验注意事项

t检验主要是以小样本的资料为基础,即在测定次数n较小的情况下使用,其前提是总体为正态分布,而且被比较各组的方差相同。在实际应用上是有偏差的,但两样本的方差不能相差太大,如果相差较大,则需要先检验两组的方差的差别是否有显著性,如差别有显著性,需对t检验校正为t',来代替t检验。

两样本方差的差别是否有显著性,如用统计是F检验

(1-35)

式中,分别为二样本中较小方差和较大方差。计算F值,查F分布表,确定显著性水平α两样本的自由度(n1-1,n2-1)时F临界,比较F计算F临界的大小进行判断,若F计算<F临界,两方差间无显著性差异时,则t检验可以使用;若F计算>F临界,两方差有显著性差异时,不能使用t检验,而用t'检验。t'统计量为:

(1-36)

式中,分别为两样本均数标准误方差。

用下式计算近似的显著临界值:

(1-37)

(1-38)

然后将计算的t值与比较后进行判断。

1.6.3 F检验法

方差检验中,两个总体方差的检验即F检验,它的统计量见下式:

式中,分别为两个样本的方差,通常数值大的作分子,数值小的作分母;f1f2分别为自由度,其中f1=n1-1,f2=n2-1。

F检验是用来检验两个或两个以上均数之间是否存在显著性差异,即系统误差。

F检验步骤如下。

(1)由样本值x1x2,…,xny1y2,…,yn计算F

(1-39)

(2)在给定的显著性水平α和自由度f1f2下查F分布表得到F的临界值Fαf1f2

(3)比较计算的F值和查表的临界值Fαf1f2)的大小

F计算>F临界,表示两个总体有显著性差异;若F计算<F临界,则无显著性差异。

以上是两个总体的方差检验,也就是两个均数间的显著性检验,可以用t检验,也可以用F检验。当检验两个以上均数差别的显著性时不能用t检验,只能用方差检验。

对于多个方差的检验,可用F检验法,检验一组方差中最大方差(S )和最小方差(S )。如果两者不存在显著性差异,则处于两者之间的方差也无显著性差异,因此,可以认为整组方差来源于同一个总体。如果S S 之间有显著性差异,则需要继续地两两比较。