- SPSS统计分析教程:新世纪第三版(全国中医药行业高等教育“十四五”规划教材)
- 刘仁权主编
- 1729字
- 2024-06-18 16:35:24
2.2 变量的属性及其设置
任何一个变量都应该有一个变量名与之对应,但为了满足统计分析的需求,除变量名外,统计软件中还对每一个变量定义许多附加的变量属性,如变量类型(Type)、变量宽度(Width)等。
1.变量名(Name) 在Name框中输入要定义的变量名称。若不定义变量名,则系统依次默认为“VAR00001”、“VAR00002”……
变量命名应遵循的主要原则:①首字符是字母或汉字或@,其后可为字母或汉字或数字或下划线“_”等,但不能含有空格、“?”“-”“!”“*”等特殊字符。注意:不能以下划线“_”和圆点“.”作为变量名的最后一个字符。②变量名不能与SPSS保留字相同。SPSS的保留字有:ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH等。③系统不区分变量名中的大小写字符,例如,age和AGE被认为是同一个变量。
2.变量的数据类型(Type) 将光标移至变量类型单元格中并单击右边形如…的按钮,弹出Variable Type(变量类型)对话框(见图2-3),有9种类型供选择。
图2-3 Variable Type对话框
SPSS变量有3种基本类型:Numeric(标准数值型,系统默认)、String(字符型)、Date(日期型)。数值型又可按不同的要求分为6种:Comma(逗号数值型。千进位用逗号分隔,小数与整数间用圆点分隔)、Dot(圆点数值型。千进位用圆点分隔,小数与整数间用逗号分隔)、Scientific notation(科学计数法)、Dollar(货币型),再加上Custom currency(自定义型)和Restricted Numeric(受限数值),共可定义9种类型的变量类型。
每种类型的变量由系统给定默认宽度。所谓宽度是指显示该变量值所占的字节数,也就是用字符数表示的显示宽度。小数点和其他定界符(/和E等)包括在总长度内,如12/31/2008,1.23E-03。
数值型变量系统默认宽度为8,还可以设置数值型变量的宽度(Width)和显示小数位数(Decimal)。另外,也可以通过调节变量视图(见图2-2)中的Width、Decimal单元格右边的微调按钮设定宽度和显示小数位数。
字符型变量系统默认显示宽度为8个字符位,它不区分大小写字母并且不能进行数学运算。注意:在输入字符型数据时,如果输入引号,引号将会作为字符型数据的一部分。
日期型变量是用来表示日期或时间的。SPSS以菜单的方式列出日期型的显示格式以供用户选择。日期型数据主要在生存分析和时间序列分析中比较常用,在较为简单的分析问题中完全可以用普通数值型数据类型来代替。
3.变量的标签(Label) 数据处理过程中,变量名的命名越简单越好。此时,对每一个变量含义的解释就显得很重要,需要给简单的变量名加以注释说明(即标签),以便识别,如图2-2中的x1、x2。在数据视图(见图2-1)中,当光标移至某变量名(如x1)处,会显示变量标签。
4.变量值标签(Values) 变量值标签(Values)是对变量所取值的含义的解释说明。例如,对于性别数据,用1表示男,用2表示女,数据录入时只录入1和2,如果在录入数据时数据集中没有设定变量值标签,其他人就很难弄清楚是1表示男还是2表示男。
选择Values单元格并单击右边形如…的按钮,弹出Variable Values(变量值标签)对话框(图2-4)。先单击+按钮进行添加,然后在Value(值)下面的条框中录入变量的值,在Label(标签)下面的条框中录入对应的变量值标签,全部输入完毕,单击OK返回。
5.缺失值(Missing) 在实际工作中,因各种原因会出现数值缺失现象,为此,SPSS提供缺失值处理技术。在变量视图(Variable View)中,将光标移到缺失值单元格并单击右边形如…的按钮,弹出Missing Values(缺失值)对话框(见图2-5)。
图2-4 Variable Values对话框
图2-5 Missing Values对话框
对缺失值在定义变量属性时应该给出明确的定义。各个分析过程对缺失值的处理都有默认的方法,也可以由用户指定如何处理这些缺失值。
6.数据列宽(Columns) 表示显示数据的列宽,系统默认8个字符。
7.对齐方式(Align) 有Left(左对齐)、Right(右对齐)、Center(居中)3种数据对齐方式。
8.度量类型(Measure) 根据度量精度将变量分为Scale(定量变量,如体重、血压等)、Ordinal(等级变量,如痊愈、显效、好转、无效)、Nominal(定性变量,如A型、B型、O型、AB型)。该选项用于统计制图时坐标轴变量的区分以及SPSS决策树模块的变量定义,统计方法的选择也依此。
9.角色(Role) 某些对话框支持可用于预先选择分析变量的预定义角色。当打开其中一个对话框时,满足角色要求的变量将自动显示在目标列表中。可用角色包括Input(将变量作为输入变量,如自变量)、Target(将变量作为目标变量,如因变量)、Both(将变量既可以作为输入变量也可以作为目标变量)、None(不为变量分配角色)等。