- PySpark大数据分析与应用
- 戴刚 张良均主编
- 1775字
- 2025-01-07 16:58:54
序
PREFACE
随着大数据时代的到来,移动互联网和智能手机迅速普及,多种形态的移动互联网应用蓬勃发展,电子商务、云计算、互联网金融、物联网、虚拟现实、智能机器人等不断渗透并重塑传统产业,而与此同时,大数据当之无愧地成为新的产业革命核心。
2019年8月,联合国教科文组织以联合国6种官方语言正式发布《北京共识——人工智能与教育》,《北京共识》中提出:“通过人工智能与教育的系统融合,全面创新教育、教学和学习方式,并利用人工智能加快建设开放灵活的教育体系,确保全民享有公平、适合每个人且优质的终身学习机会”。这表明基于大数据的人工智能和教育均进入了新的阶段。
高等教育是教育系统中的重要组成部分,高等院校作为人才培养的重要平台,肩负着为社会培育人才的重要使命。2018年6月21日召开的新时代全国高等学校本科教育工作会议首次提出了“金课”的概念。“金专”“金课”“金师”迅速成为新时代高等教育的热词。如何建设具有中国特色的大数据相关专业,以及如何打造世界水平的“金专”“金课”“金师”“金教材”是当代教育教学改革的难点和热点。
实践教学是指在一定的理论指导下,通过实践引导,使学习者获得实践知识、掌握实践技能、锻炼实践能力、提高综合素质的教学活动。实践教学在高校人才培养中处于重要地位,是巩固和加深理论知识的有效途径。目前,高校大数据相关专业的教学体系设置过多地偏向理论教学,课程设置冗余或缺漏,知识体系不健全,且与企业实际应用契合度不高,学生很难将理论转化为实践应用技能。为了有效解决该问题,“泰迪杯”数据挖掘挑战赛组织委员会与人民邮电出版社共同策划了“大数据技术精品系列教材”,这恰与2019年10月24日教育部发布的《教育部关于一流本科课程建设的实施意见》(教高〔2019〕8号)中提出的“坚持分类建设”“坚持扶强扶特”“提升高阶性”“突出创新性”“增加挑战度”原则契合。
“泰迪杯”数据挖掘挑战赛自2013年创办以来,一直致力于推广高校数据挖掘实践教学,培养学生数据挖掘的应用和创新能力。挑战赛的赛题均为经过适当简化和加工的实际问题,来源于各企业、管理机构和科研院所等,非常贴近现实的热点需求。赛题中的数据只做必要的脱敏处理,力求保持原始状态。“泰迪杯”数据挖掘挑战赛围绕数据挖掘的整个流程,从数据采集、数据迁移、数据存储、数据分析与挖掘到数据可视化,涵盖企业应用中的各个环节,与目前大数据专业人才培养目标高度一致。“泰迪杯”数据挖掘挑战赛不依赖数学建模,甚至不依赖传统模型的竞赛形式,这使得“泰迪杯”数据挖掘挑战赛在全国各大高校反响热烈,且得到了全国各界专家学者的认可与支持。2018年,“泰迪杯”增加了子赛项——数据分析技能赛,为应用型本科、高职和中职技能型人才培养提供理论、技术和资源方面的支持。截至2021年,全国共有超1000所高校,约2万名研究生、9万名本科生、2万名高职生参加了“泰迪杯”数据挖掘挑战赛和数据分析技能赛。
本系列教材的第一大特点是注重学生的实践能力培养,针对高校实践教学中的痛点,首次提出“鱼骨教学法”的概念。以企业真实需求为导向,学生学习技能时紧紧围绕企业实际应用需求,将需掌握的理论知识通过企业案例的形式进行衔接,达到知行合一、以用促学的目的。第二大特点是以大数据应用为核心,紧紧围绕大数据应用闭环的流程进行教学。本系列教材涵盖企业大数据应用中的各个环节,符合企业大数据应用真实场景,使学生能从宏观上理解大数据技术在企业中的具体应用场景及应用方法。
在教育部全面实施“六卓越一拔尖”计划2.0的背景下,对如何促进我国高等教育人才培养体制机制的综合改革,以及如何重新定位和全面提升我国高等教育质量,本系列教材将起到抛砖引玉的作用,从而加快推进以新工科、新医科、新农科、新文科为代表的一流本科课程的“双万计划”建设;落实“让学生忙起来、管理严起来和教学活起来”措施,让大数据相关专业的人才培养质量有质的提升;借助数据科学的引导,在文、理、农、工、医等方面全方位发力,培养各个行业的卓越人才及未来的领军人才。同时本系列教材将根据读者的反馈意见和建议及时改进、完善,努力成为大数据时代的新型“编写、使用、反馈”螺旋式上升的系列教材建设样板。
汕头大学校长
教育部高等学校大学数学课程教学指导委员会副主任委员
“泰迪杯”数据挖掘挑战赛组织委员会主任
“泰迪杯”数据分析技能赛组织委员会主任
2021年7月于粤港澳大湾区