前言

数据挖掘技术应用越来越广泛,社会对掌握数据挖掘技术的人才需求越来越大,越来越多的高校在计算机相关专业及经济、管理类专业开设了数据挖掘课程,以适应社会的需求。

本书旨在向读者介绍数据挖掘的基本原理、方法,数据挖掘应用流程,通过原理、方法应用的背景介绍,使读者理解、掌握如何选择数据挖掘方法解决实际问题,通过案例的分析使读者能够应用这些方法解决现实世界中的问题。

本书于2012年被中国电子教育学会评为“全国电子信息类优秀教材”。

全书分为上、下两篇,共8章。上篇包括第1~6章,下篇包括第7~8章。

第1章介绍数据挖掘的基本概念以及数据挖掘的重要应用领域。

第2章介绍数据的基本统计量以及数据预处理的常用方法。

第3章介绍分类的基本概念、应用背景,重点介绍决策树、贝叶斯、最近邻分类方法。

第4章介绍聚类分析的基本概念、应用背景,重点介绍常用的聚类方法。

第5章介绍关联分析的基本概念、应用背景,重点介绍频繁模式挖掘算法(Apriori 算法和Fp-growth算法)、序列模式挖掘算法。

第6章介绍离群点挖掘的基本概念、应用背景,重点介绍基于距离、基于相对密度、基于聚类的离群点挖掘方法。

第7章介绍数据挖掘在通信行业中的客户细分、客户流失分析、客户社会关系挖掘、业务交叉销售等方面的应用,并通过实际案例进行了分析。

第8章介绍数据挖掘在文本处理方面的应用,介绍文本挖掘和Web挖掘的基本概念,通过跨语言智能学术搜索系统和基于内容的垃圾邮件识别两个案例进行分析。

本书除了介绍数据挖掘的经典方法之外,也融入了作者的部分研究成果。

本书为广东省精品课程建设成果。

本书的出版融会了许多人的辛勤劳动。第1、2、4、6、7、8章由蒋盛益负责,第3章由李霞负责,第5章由郑琪负责。参与编写工作的还有庞观松、王连喜、吴美玲、谢照青、阳垚、苗邦、谢柏林、邝丽敏等。印鉴教授、王家兵副教授认真审阅了初稿,指出了一些纰漏,并提出了修改建议。本书的出版得到了电子工业出版社的大力支持,书中参考了许多学者的研究成果,在此一并表示衷心感谢。

限于作者学识水平,书中肯定存在不足和疏漏,敬请读者批评指正。

本书为任课教师提供配套的教学资源(包含电子教案、实验用数据集、习题及参考答案、部分综述文献和常用资源列表),需要者可登录华信教育资源网(http://www.hxedu.com.cn),注册之后进行下载

读者反馈:unicode@phei.com.cn。

作者