1.3 利用SPSS进行数据分析的基本步骤

学习和应用SPSS软件的过程并不是单纯地学习和应用一种计算机软件的过程。由于SPSS是一种专业性较强的统计软件,因此,学习和应用它时必须要了解和掌握必要的统计学专业知识和数据分析的一般步骤和原则,这样才能够避免滥用和误用,不致因引用偏差甚至错误的数据分析结论而做出错误的决策。

1.3.1 数据分析的一般步骤

数据分析一般包括收集数据、加工和整理数据、分析数据三个主要阶段,统计学对此有非常完整和严谨的论述。在数据分析的实践中,用统计学的理论来指导应用是必不可少的,也是极为重要的。数据分析的一般步骤是:

· 明确数据分析目标

明确数据分析目标是数据分析的出发点。明确数据分析目标就是要明确本次数据分析要研究的主要问题和预期的分析目标等。例如:分析城市和农村储户的储蓄行为是否存在显著差异以及成因;分析某企业的客户群特征,包括其人口特征和消费行为等方面;分析全国高等院校人文社会科学的科研能力;分析中西医结合治疗非典型性肺炎的疗效与单纯西医治疗的疗效是否存在显著差异,等等。只有明确了数据分析的目标,才能够正确地制定数据收集方案,即收集哪些数据,采用怎样的方式收集等,进而为数据分析做好准备。

· 正确收集数据

正确收集数据是指从分析目标出发,排除干扰因素,正确收集服务于既定分析目标的数据。正确的数据对于实现数据分析目的将起到关键性的作用。

例如,在研究中西医结合治疗方案治疗非典型肺炎的例子中,数据收集的方式并不只是让一些非典型性肺炎患者接受中西医结合疗法,隔一段时间后看其病情是否得到显著缓解这样简单。因为这些数据里掺杂了一些诸如年龄、性别等干扰因素。通常可以采用随机分组方式进行对比实验,这样得到的数据能有效排除病人体质、病情恶化程度、性别、年龄等因素对数据的干扰和影响,使数据趋向目标“净化”,进而服务于数据分析的目标。

因此,排除数据中那些与目标不关联的干扰因素是数据收集中的重要环节。数据分析并不仅仅是对数据进行数学建模,收集的数据是否真正迎合数据分析的目标,其中是否包含了其他因素的影响,影响程度怎样,应如何剔除这些影响等问题都是数据分析过程中必须注意的重要问题。

· 数据的加工整理

在明确数据分析目标基础上收集到的数据,往往还需进行必要的加工整理后才能真正用于分析建模。数据的加工整理通常包括数据的缺失值处理、数据的分组、基本描述统计量的计算、基本统计图形的绘制、数据取值的转换、数据的正态化处理等,它能够帮助人们掌握数据的分布特征,是进一步深入分析和建模的基础。

· 明确统计方法的含义和适用范围

数据加工整理完成后一般就可以进行进一步的数据分析了。分析时应切忌滥用和误用统计分析方法。滥用和误用统计分析方法主要是由于对方法能解决哪类问题、方法适用的前提、方法对数据的要求不清等原因造成的。另外,统计软件的不断普及和应用中的不求甚解也会加重这种现象。因此,在数据分析中应避免盲目的“拿来主义”,否则,得到的分析结论可能会偏差较大甚至错误。

另外,选择几种统计分析方法对数据进行探索性的反复分析也是极为重要的。每一种统计分析方法都有自己的特点和局限,因此一般需要选择几种方法反复印证分析,仅依据一种分析方法的结果就断然下结论是不科学的。

· 读懂分析结果,正确解释分析结果

数据分析的直接结果是统计量和统计参数。正确理解它们的统计含义是一切分析结论的基础,它不仅能够帮助人们有效避免毫无根据地随意引用统计数字的错误,同时也是证实分析结论正确性和可信性的依据,而这一切都取决于人们能否正确地把握统计分析方法的核心思想。

另外,将统计量和统计参数与实际问题相结合也是非常重要的。客观地说,统计方法仅仅是一种有用的数量分析工具,它绝不是万能的。统计方法是否能够正确地解决各学科的具体问题不仅取决于应用统计方法或工具的人能否正确地选择统计方法,还取决于他们是否具有深厚的应用背景。只有将各学科的专业知识与统计量和统计参数相结合,才能得出令人满意的分析结论。

1.3.2 利用SPSS进行数据分析的一般步骤

利用SPSS进行数据分析也应遵循数据分析的一般步骤,但涉及的方面会相对较少。主要集中在以下几个阶段:

· SPSS数据的准备阶段

在该阶段应按照SPSS的要求,利用SPSS提供的功能准备 SPSS数据文件。其中包括:在数据编辑窗口中定义SPSS数据的结构,录入和修改SPSS数据等。

· SPSS数据的加工整理阶段

该阶段主要对数据编辑窗口中的数据进行必要的预处理。

· SPSS数据的分析阶段

选择正确的统计分析方法对数据编辑窗口中的数据进行分析建模是该阶段的核心任务。由于SPSS能够自动完成建模过程中的数学计算并能自动给出计算结果,因而有效屏蔽了许多对一般应用者来说非常晦涩的数学公式,分析人员无需记忆数学公式,这无疑给统计分析方法和SPSS的广泛应用铺平了道路。

· SPSS分析结果的阅读和解释

该阶段的主要任务是读懂SPSS输出编辑窗口中的分析结果,明确其统计含义,并结合应用背景知识做出切合实际的合理解释。在以后的章节中将重点讲解分析结果的统计含义。

利用SPSS进行数据分析的基本步骤可简单概括为图1-8。

图1-8 利用SPSS进行数据分析的基本步骤