第1章 描述性统计

描述性统计(Descriptive Statistic)是通过图表或数学方法,对统计数据进行整理、分析,并对数据的分布状态、数字特征和随机变量之间的关系进行估计和描述的方法。描述性统计的任务就是描述随机变量的统计规律。

要完整地描述随机变量的统计特性需要用分布函数,但求随机变量的分布函数并不容易。实际上,对于一些问题也不需要去全面考察随机变量的变化规律,而只需知道随机变量的某些特征。

例如,研究某一地区居民的消费水平,只需知道该地区的平均消费水平即可;但如检查一批灯泡的质量时,则既需要注意灯泡的平均寿命,又需要注意灯泡寿命与平均寿命的偏离程度。尽管这些数值不能完整地描述随机变量,但能描述随机变量在某些方面的重要特征,这些数字特征在理论和实践上都具有重要的意义。

因此,在分析数据时,一般首先要对数据进行描述性统计分析,以发现其内在的规律,再选择进一步分析的方法。在描述性统计中,主要使用集中趋势、离散程度、偏度度量、峰度度量等方法来描述数据的集中性、分散性、对称性和尖端性,以归纳数据的统计特性。常用的描述统计量有众数、中位数、算术平均数、调和平均数、几何平均数、四分位差、标准差、方差、变异系数等。

集中趋势测度:算术平均值、几何平均数、调和平均数、中位数、众数。

离散程度测度:极差(全距)、标准差、方差、四分位差、变异系数。

数据分布测度:偏度、峰度。

数值统计:最小值、最大值、总和、总个数。

Excel中用于计算描述统计量的方法有两种:函数方法和描述统计工具的方法。本章将首先介绍列联表的使用以及数据的频数分析,然后详细介绍如何使用Excel 2007中给出的统计函数来求解各种统计量和使用描述统计工具来实现对统计数据的描述性统计。