前言

回顾过去的十年,科技产品和成果不断涌现,冲击着人类的生活方式和思维方式:智能移动设备、人工智能、云计算、物联网、社交网络和各种各样的“共享”等,使人类认知世界的方式和方法发生了巨大变化。在这些平台和技术的运用中,流淌、堆积着一个强大的资源——大数据!人们对数据的认识和运用由此发生了根本性变化,大数据从技术变成了产业和科学,数据的价值因其“大”而“全”受到前所未有的重视。如果说过去人类社会的发展是由机械驱动、电力驱动或网络驱动的话,那么现在和未来就是由大数据来驱动人类社会的进步。大数据的快速发展和多样性给人们带来巨大的挑战,同时大数据又给各方面带来意想不到的价值和机遇。

大数据涌现:大数据之繁在于其“大”,不仅指其容量的数据单位由TB级别跨越到了DB级别,还体现在多样性、处理速度和复杂度等方面,海量的数据已如决堤之洪流涌入人们的生活,大量信息源产生的数据已远远超越目前人力所能处理的范围,需要人们探索如何对这些数据进行管理及运用;大数据的根本在于“数据”,在互联网及相关平台上利用新技术来采集、存储和分析激增的数据。

大数据价值:大数据之重在于其“全”,蕴含在大数据中的价值使得大数据已经成为信息产业中最具潜力的蓝海,人们赋予数据更多的意义,使数据成为信息资源的载体,具有了资本特性;大数据的价值在于运用,大数据在各个行业的广泛应用,促进社会价值的快速提升才是其最终目的。这也使得学习及掌握大数据处理工具和获得解决方案显得十分迫切。大数据的出现将会对社会各个领域产生深刻影响,“用数据来说话、用数据来管理、用数据来决策、用数据来创新”是这个时代的鲜明特征。大数据技术将对社会各层面的现在和未来产生巨大价值,包括决策、预测和洞见等。

大数据人才:大数据时代需要一大批具备大数据知识和技能的人才,一方面,要有一部分专业人才,不断研究大数据科学和技术;另一方面,其他领域的人才也应该能充分了解大数据并能和自己的专业领域结合,有效地将大数据科学和各行业的应用相结合,推动新技术和新应用的发展,这两个方面的人才都是不可或缺的。因此,以不同的需求,从不同的角度学习和了解大数据是本书编写的基本出发点。

本书的读者对象是社会科学类的高等院校相关专业开设“大数据”有关课程的本科生、研究生,以及各行各业的经济、管理人员。此外,本书对于信息技术专业和理工科类专业的学生,以及有一定实践经验的IT技术人员,也具有一定的参考价值。

本书的编写力求理论联系实际,结合一系列了解和熟悉大数据理念、技术与应用的学习和实践活动,把大数据的相关概念、基础知识和技术技巧融入在实践中,使学生保持浓厚的学习热情,加深对大数据技术和运用的兴趣、认识、理解和掌握。努力让非技术专业的人看懂数据科学的知识和理论及方法。本书在应用部分特别关注医疗、旅游、金融和制造业的典型行业的应用。例如,电子病历的改革、大数据在旅游业中的应用、大数据在金融业中的应用,以及大数据在制造业中的应用,具有较强的行业实践性。为相关章节的知识应用提供了现实场景,以加深读者对大数据实际应用的认识。另外,本书大量应用了直观的图表说明,这些都使本书的逻辑更加清晰,便于理解。

本书由天津财经大学教师和研究生团队编写。参加编写工作的人员具体分工为:杨尊琦、林海负责大纲的制定、全书的校改和第1章的撰写等工作;朱笑笑负责第2章和第8章的撰写;潘婧炜负责第3章和第9章的撰写;王雅萌负责第4章和第5章的撰写;张琳负责第6章和第7章的撰写;刘君玲负责第10章和第11章的撰写。本书在编写过程中参考了很多优秀的教材、专著和网上资料,在此对所有被引用文献的作者表示衷心的感谢。

特别要感谢机械工业出版社的鼎力支持,以及本书编辑的辛勤工作。由于编者水平和能力有限,书中难免有不当之处,希望读者朋友给予指正,不吝赐教。

编 者