第三节 归纳评估

归纳概括是从特定经验事实中得到一般或普遍命题的过程,具体是指利用不完全归纳,来得出一个虽然并非必然但要相对合理的结论。

归纳概括的形式如下:

现象E的事例1伴随有事态C

现象E的事例2伴随有事态C

现象E的事例3伴随有事态C

………

因而现象E的每个事例都伴随有事态C。

由一个个的例子推导出一个普遍的结论,是不完全归纳推理中最基本的一种,即归纳概括。当然,归纳概括出来的结论应该恰当。

比如,一个装满东西的袋子,第一个人从袋子里摸出三个东西,全部都是红色的木球。第二个人从袋子里摸出三个东西,全部是红色的玻璃球。第三个人从袋子里摸出三个东西,全部是红色的石球。对于袋子里剩下的东西,他们没有继续往下摸。

根据上面的论述,下面对袋子里的东西进行归纳概括。不完全归纳所得出的结论只具有可能性,因此,结论不应该是“袋子里的东西全部都是球”或“袋子里的东西全部都是红色的球”等绝对性的结论。概括出来的结论如果是“袋子里的东西可能都是球”,这不能算错,但不是最恰当的,最恰当的结论应该是“袋子里的东西可能都是红色的球”。

一、评估准则

归纳推理作为扩展性推理而言,使用的标准是其合理性。一个人接受某个命题总有一定的理由,一个人从个别可相信的命题出发推导出超出已知命题知识范围之外的新命题,如何来判定其合理性,有许多需要进行研究的内容。合理性的衡量,一个尺度是概率,另一个尺度则可以归结为健全的批判性思维提供的标准。

批判性思维的核心是批判性地提问,评价一个推理或论证也应该是从提问开始的。评估归纳论证的准则可用如下批判性问题来描述:

(批判性问题的英文名为Critical Question,以下统一简称为“CQ”)

CQ1:前提是否真实?

归纳推理首先要满足前提可靠的标准。

如果归纳的前提不真,实验的证据不准确,那么归纳的结论就毫无可靠性。

CQ2:前提和结论是否相关?

前提和结论是否相关,由它们谈的是否同一种东西来决定。若前提和结论不相关,那么归纳的结论就毫无可靠性。

要注意有没有混淆或偷换了概念?需要洞察概念的不同解释对得出结论的关键影响。

CQ3:结论是什么?结论的范围是否受到适当限制?

得出的结论是否恰当?调整结论的强度,谨慎下绝对肯定或绝对否定的结论。比如,我的朋友张三是湖南人,爱吃辣椒;李四是湖南人,也爱吃辣椒;王五是湖南人,更爱吃辣椒。我所碰到的湖南人都爱吃辣椒。针对这些事实,得出“多数湖南人都爱吃辣椒”和“所有湖南人都爱吃辣椒”这两种结论,显然,前者比后者要更可靠,因为前者的断定没那么绝对。

和其他推理一样,归纳推理的充足性还与结论的范围和强度有关。对同样数量的前提,结论的变化会导致支持的“充足性”变化。在同样的前提下,结论范围大小和可靠性成反比。“太阳永远升起”和“太阳明天会升起”,在过去同样的经验下,后者要更可靠,因为它只涉及明天。

CQ4:有没有发现反例?

为提高枚举归纳推理或统计推理结论的可靠性,要注意考察可能出现的反例。一旦发现反例,结论就会被推翻。这就是所谓的“证伪”。“证伪”的目的就是杜绝“以偏概全”的错误。

若没有发现与结论相关的反例,结论的可靠性就越高。若发现了反例,就要修改结论。比如,人们曾根据多次见到天鹅是白色的,归纳推论“所有的天鹅都是白色的”,直到1697年,探险家在澳大利亚发现了黑天鹅,人们才知道以前的结论是片面的—并非所有天鹅都是白的,于是就要修改这一结论。

CQ5:所举的例子的数量是否足够大?

即考察对象的数量是否足够大?样本容量是否足够大?

要尽可能增加被考察对象的数量,被考察对象的数量越多,样本容量越大,越是接近全部对象,那么结论的可靠性程度也就会越高。

归纳支持不充足的问题首先出在前提的数量上。依靠的事例太少,不可能成为充分的推理。明显地,基于过少的样本所做出的概括是容易犯错误的,以少数例子作出的推理往往会犯“以偏概全”和“轻率概括”的谬误。比如,根据你第一次所吃的那个柠檬是酸的,就断言所有的柠檬都是酸的。根据你认识的几个东北人具有粗犷豪爽的性格,就说所有东北人都是粗犷豪爽的。我们需要考虑足够大的样本容量,也就是样本内所含个体的数量要足够多,才能确立我们对所做出的概括的信心。

CQ6:考察对象的范围是否足够大?

即所举的例子是否多样化?样本的个体之间差异是否足够大?

归纳结论的可靠性程度不仅建立在枚举事例的数量上,而且还取决于分布的枚举事例范围。样本个体之间的差异通常能反映样本个体在总体中的分布状况,样本之间的差异越大说明样本个体在总体中的分布越广。因此,要尽可能调动考察对象的视角和范围,尽量在不同的时间、地点、场合和条件下去考察同类对象,样本的个体之间差异越大,那么结论的可靠性程度也就会越高。

例:通过分析物体的原子释放或者吸收的光可以测量物体是在远离地球还是在接近地球,当物体远离地球时,这些光的频率会移向光谱上的红色端(低频),简称“红移”,反之,则称“蓝移”。原子释放出的这种独特的光也被组成原子的基本粒子尤其是电子的质量所影响。如果某一原子的质量增加,其释放的光子的能量也会变得更高,因此,释放和吸收频率将会蓝移。相反,如果粒子变得越来越轻,频率将会红移。天文观察发现,大多数星系都有红移现象,而且,星系距离地球越远,红移越大,据此,许多科学家认为宇宙一定在不断膨胀。

分析:上述科学家的观点是,宇宙一定在不断膨胀;理由是,天文观察发现,大多数星系都有红移现象,而这一现象表明,物体远离地球。这则论证存在着严重的缺陷,若事实上,人们所能观察的星体可能不足真实宇宙的百分之一。这表明考察对象的范围较小,意味着有天文观察而归纳出的观点很可能不可靠,这就有力地质疑了科学家的观点。

CQ7:所举的例子或样本是否具有代表性?

即观察到的事物和属性有什么关系?

研究事物和属性的内在关系或者因果关系,这是科学的专注点。从逻辑上说,样本代表性是指样本属性与结论所概括的总体属性应当具有同质性。样本属性与描述属性具有同质性的概率越大,结论的可靠性就越大。

如果一个总体中的所有个体在某一方面都有相同的属性,那么任意一个个体在这方面的属性都有总体的属性。比如,医生为病人验血时,只需抽取病人血液的一小部分。不同的个体之间在某方面所具有的无差别的属性称为同质性,有差别的属性称为异质性。

二、归纳不当

归纳推理的结论并非是从前提中必然推出的。归纳法虽然有着自己的独特作用,但是,它的前提和结论之间的逻辑联系具有或然性,所得出的结论并不可靠。由前面分析可知,提高归纳推理可靠性的办法有:

①前提必须真实;

②前提和结论要相关;

③受到适当限制结论的范围;

④没有发现反例;

⑤尽量增大考察对象的数量;

⑥尽量增大考察对象的范围;

⑦所举的例子或样本要具有代表性。

在进行归纳推理时,如果只根据若干还不够充分的事实仓促地推出一般性的结论,把它看作完全可靠的,就会犯“归纳不当”的错误。其谬误实质是严重忽视了与样本属性相反的事例存在,常见的表现形式有特例概括、机械概括和轻率概括。

1.特例概括

特例概括,也叫举例不当,是以特例为根据,仅由不具代表性的例证或缺乏典型性的事例就不恰当地进行概括,得出包含该个体的群体具有的普遍性质的结论。其谬误是以概括所依据事例的非典型性和偶然性为主要特征。

例1:我碰到的一个荷兰人是骗子,所以荷兰人都是骗子。

例2:我的父母吸了一世烟,但他们从未患过癌症,可见吸烟不会导致癌症。

例3:“守株待兔”这一成语讲的是,古时宋国有一位农夫,偶然遇到一只兔子撞在树上死去,他不费力气就捡到了它。他认定,此等好事还会发生,于是他扔下农具、不再干农活,一直守在树旁,希望再捡到撞死的兔子,该位农夫因为特例概括而成为千古笑柄。

2.机械概括

机械概括是由于忽视时间因素的影响,机械地以样本属性为根据,而对事物的现在或未来作出概括。

例:调查表明,目前中年消费者的零售支出,有39%都花在百货商店的商品和服务上了;但对年轻人而言,该百分比仅为25%。由于未来十年内,中年人口数将会剧增,所以百货商店应该把一些原业以年轻人为服务对象的商品换成吸引中年人的商品。

分析:文中提到,“未来十年内,中年人口数将会剧增。”这意味着两方面的变化:一方面是目前的中年人将陆续退出中年人的行列;另一方面是目前年轻人将陆续加入中年人的行列。“中年人口数的剧增”意味着后一方面的变化加剧,今天的年轻人在未来的中年人中所占的比例不断加大。由此,文中的推论若成立,就必须假设:今天的年轻人在步入中年的时候,他们在消费方式上的变化只受年龄增长这种单一因素的影响,而且变化的结果必须与现在中年人的消费方式相同。显然,这种假设是不一定成立的。该论证将目前两组消费整体所具有的样本特征,机械地推广到未来。这一推论是在没考虑目前的样本特征可能会在未来发生变化的情况下做出的,所以,该论证犯了机械概括的错误。

3.轻率概括

轻率概括从狭义上讲,也叫样本太小,是以少数的不具有代表性的事例就匆匆归纳出普遍性的结论。其谬误在于由于样本太小,不能满足在样本容量方面的要求,而使样本缺乏代表性,由此,不足以概括出代表总体特征的结论。

例1:医生使用吗啡减轻病患的痛苦是对的,因此,所有人都可以随意使用吗啡。

例2:知识分子家庭出身的孩子都聪明,你看小珍、小强、小琴都很聪明,他们的父母都是知识分子。

例3:1979年3月,美国三里岛核电站发生严重事故,1986年苏联切尔诺贝利核电站也发生了严重事故。所以,目前世界上正在运行的核电站都会发生严重事故。

需要注意的是:

第一,样本可能太小这一事实不一定意味着样本就是不典型的。如果较小的样本在一个很大的总体中具有典型性,这样的概括不是谬误。只有对太小而且不典型的样本进行概括,才犯了轻率概括的谬误。

例:给3只小老鼠喂食了1克T物质,这3只小老鼠在两分钟内进入了休克状态,然后都死了。所以,对于所有的小老鼠来说,T物质可能是使它们致命的物质。

分析:这则论证没有犯轻率概括的谬误,因为在这则论证中,样本在它所属的总体中具有典型性。小老鼠在两分钟内死亡的事实表明:在吃T物质与小老鼠死亡之间存在因果联系。如果存在这种联系,那么其他小老鼠吃了T物质也会这样。

第二,从另一个角度说,样本大不一定能保证样本就是典型的。在样本较大的情况下,如果样本不是随机选取的,它在一个很大的总体中可能就没有典型性。

例:对加州的10万名选民进行选情调查,其中有80%的选民说他们会投共和党候选人的票。很明显,共和党候选人将会当选。

分析:尽管这则论证中引用的样本是很大的,但其调查的抽样不是随机进行的,该论证还是犯了轻率概括的谬误。有80%的加州选民说他们会投共和党候选人的票,这说明共和党候选人在加州具有压倒性的优势,但它不能反映全国其他地区选民的投票倾向。

三、归纳困境

传统归纳逻辑力图研究如何从个别性经验知识上升到具有必然性的一般知识的思维过程和思维方法。但人们不断对归纳的合理性进行质疑。

英国哲学家伯特兰·罗素曾谈到一个关于火鸡的故事。在火鸡饲养场里,有一只火鸡发现:每天,主人一打铃后就给它喂食。这只火鸡通过归纳推理得出了下述结论:“主人打铃后就会给我喂食。”可是,在圣诞节前夕,当主人打铃后它跑出去觅食时,主人却把它抓起来并且宰杀、烹调之后,送上了餐桌。那么,火鸡究竟错在哪里呢?不能说它的归纳很片面,至少它还懂得观察不同场合下的大量事实。只能说它不懂主人为什么要给它喂食。因此,在一定的时间条件下,它做出的不完全归纳即简单枚举归纳的结论是有效的,而超出一定条件则是无效的。这实际上是有关归纳的合理性问题。

英国哲学家大卫·休谟却对这一归纳纲领提出了严厉的诘难,对因果关系的客观性提出了根本性质疑。归纳推理是否能得必然性结论,如果不能得必然性结论,那么它的合理性何在?如何为它的合理性辩护?这叫做“归纳合理性及其证成问题”,它是由18世纪的哲学家休谟提出来的,因此亦称“休谟问题”。

休谟对归纳合理性的质疑包含三个要点:

①归纳推理不能得到演绎主义的证成,归纳不能得必然结论。因为在归纳推理中,存在着两个逻辑的跳跃:一是从实际观察到的有限事例跳跃到了涉及未观察到的无穷对象的全称结论;二是从过去、现在的经验跳跃到了对未来的预测。而这两者都没有必然的保证,正如英国哲学家波普尔所说:“有限不能证明无限,现在不能证明将来”。

②归纳法本身的正确性只能归纳地证明,而这是逻辑循环。从逻辑上讲,归纳推理的有效性也不能归纳地证明,例如根据归纳法在实践中的成功去证明归纳,这用到的还是归纳推理,因此导致循环论证。

③归纳推理要以自然齐一律和普遍因果律为基础,而这两者并不具有客观真理性,这两者只不过出于人们的习惯性心理联想。

休谟问题激起了深刻的历史回响,不少逻辑学家和哲学家对此提出了不同的回答,迄今仍无定论,有人甚至认为它是不可解决的,“休谟的困境就是人类的困境。”

尽管如此,归纳推理对于人类来说具有实践的必然性,理由如下:

①归纳是人类在茫茫宇宙中生存必须采取、也只能采取的认知策略。

②人类有理由从经验的重复中建立起某种程度的确实性和规律性。

③人类有可能建立起局部合理的归纳逻辑和归纳方法论,并且已部分地成为现实。

④归纳的结论虽然不是必然真,但是可能真的,通过科学的归纳技术,可以有效地提高归纳为真的程度。

例:“我真的不知道太阳明天是否会升起”对这个论断作出评价。

分析:这一论断偏向于怀疑论者。某种意义上,太阳的升起是值得怀疑的,因为他们认为只是因为这件事在过去一直发生并不意味着它一定会在明天再一次发生。但是我们对太阳为什么会升起的解释是有理由的,因为太阳并不只是偶然升起的。地球是旋转着的,为了让太阳明天不再“升起”,就要有一些可怕的东西来阻止地球旋转,或者有意外的灾难让太阳或者地球灭亡。很难想象在明天这么短的时间内有什么可怕的东西能使这些事情发生,并且我们坚信人类的智慧,在人类没有提前预知这一点时,这是不可能发生的。