
会员
Spark SQL入门与实践指南
更新时间:2019-12-06 16:38:46 最新章节:9.9 本章小结
书籍简介
SparkSQL是Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。全书分为4篇,共9章,第一篇讲解了SparkSQL发展历史和开发环境搭建。第二篇讲解了SparkSQL实例,使得读者掌握SparkSQL的入门操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用SparkSQL挖掘数据,一步一步带领读者学习SparkSQL强大的数据挖掘功能。第四篇讲解了SparkSQL优化的知识。本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。
品牌:清华大学
上架时间:2018-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
最新上架
- 会员人本智造(以人为本的智能制造)体现了工业特别是制造业未来发展的重要趋势,是未来工业(工业5.0)的核心使能技术,是新一代智能制造的重要技术方向。本书深入阐述面向工业5.0的人本智造最新研究成果,包括人的数字孪生、人机协同作业、人机团队合作等,以及相关典型案例,展现了当前国内外人本智造领域的技术进展和应用前景。本书是《人本智造:面向新工业革命的制造模式》一书的姊妹篇,可为从事机械制造业科学研究、企业工业9.6万字
同类书籍最近更新
- 会员本书有选择地介绍了电脑维修技术和电脑故障检修的一些常见问题。全书共322问,内容涵盖了与电脑电路及其故障检修相关的电子基础知识,手工操作基础,电路识图知识,以及电脑的电路与检修方法等。本书对各个问题进行了细致的解答,使读者更易于掌握和理解各个相关问题。本书适合从事电子产品维修的技术人员,以及各职业院校相关专业的学生,还有对电脑电路感兴趣的所有电子爱好者阅读。自动化5.3万字
- 会员本书概要地介绍了局域网技术的发展和理论基础,重点介绍了局域网的设计方法,高速局域网的组建与管理,服务器的基本配置与管理,Web服务器的配置与管理,无线局域网的组建与管理,局域网路由的配置与管理,局域网维护基础,局域网的安全设置与管理,局域网的运行管理与维护等内容,并根据网络工程实践,为读者提供了一些局域网组建、管理与维护的典型案例。自动化21.7万字