1.1.2 工业大数据的发展历程

“数据无处不在”,围绕产品制造全生命周期的各个阶段,存在众多来源丰富、类型多样、结构复杂的用于描述产品、物料、设备、能源、技术、管理、人员、环境等各种生产要素的数据资源。这些数据对象存在于客观世界,但由于受到人类采集水平的限制,其可获得性难以保障。在这个意义上可以说,数据采集技术的发展史代表了工业大数据的发展历程。图1.1描述了工业大数据发展的四个典型阶段。

图1.1 工业大数据的发展历程

第一阶段为“自动化数据”。20世纪70年代,在第三次工业革命发展初期,人类已经采用计算机和电子技术实现了生产系统自动化。在该阶段,通过PLC系统可以获得生产设备的运行数据,包括机器设备的各种工况参数。这些数据主要应用于机理模型的构建、自动化系统的闭环控制功能,尚未应用到企业运作管理层。

第二阶段为“工业现场总线数据”。20世纪90年代初,在第三次工业革命发展末期,随着工业现场总线、智能仪器仪表等技术的出现,现场设备的数据采集方式扩展至SCADA、DCS、MES系统,设备工况数据和环境数据的采集精度和采集速度得到了极大提高。这一阶段的采集数据的应用范畴已经扩展至企业管理和产品设计层,可以应用于企业ERP、MRP、PDM等应用系统,数据分析手段主要是各种数据统计技术。

第三阶段为“物联网数据”。21世纪初,在第四次工业革命发展初期,互联网加速了物与物、人与物之间的互联互通,物联网技术由此产生。物联网通过各种信息传感器、射频识别技术、全球定位系统、红外感应器、激光扫描器等各种装置与技术,实现对物品和过程的智能化感知、识别和管理。物联网的数据采集速度和数据规模相比工业现场总线数据实现了一个质的飞跃。例如,单个数控机床设备每秒产生的数据可以达到400MB,数据量存储也在GB、TB级以上。数据呈现来源复杂、类型多样、规模海量、结构异质、低质高密度、多模态等特征。在数据来源方面,不仅包含现场生产系统的机器数据和环境数据,还包含来自企业各个应用系统的与运营管理相关的业务数据,以及企业外部供应商和产品用户数据。在数据类型方面,不仅包含数据库的结构化数据,还包含邮件、HTML、报表、资源库等半结构化数据和视频、音频、图片、图像、文档、文本等非结构化数据。这些数据经过数据挖掘、浅层学习等分析手段,可以帮助企业开展生产系统优化,提升企业经营管理水平,实现个性化制造,达到企业提质增效的目的。

第四阶段为“人机物数据”。当前,在新一代信息技术的推动下,人机物之间通过数据建立了紧密的映射关系,人、信息、物理三元世界之间实现了互联互通,企业生产经营活动的边界延伸至以人机物三元世界为共融的统一整体。在此背景下,企业已经具备跨域跨层海量人机物大数据的实时采集能力,即从企业间供应链横向集成(跨域)与企业内部纵向集成(跨层),采集与“人”相关的社会网数据、与“机”相关的供应商及产品用户的互联网数据、与“物”相关的企业内部物联网数据。这些跨域跨层人机物数据来源更加复杂、类型更加丰富,结构异质、体量庞大的特征愈发明显。在数据采集手段方面,采用网络爬虫可以从网页中抽取非结构化数据,使多结构类型数据的获取成为可能。物联网数据向人机物数据的延伸和拓展迫切需要更加有效的大数据分析手段,因此以深度学习为代表的深层机器学习技术孕育而生并得到快速发展。深度学习可以处理复杂的大规模数据并从中挖掘数据之间的深度关联,能够在一定程度上满足工业大数据分析高可靠性的要求。在该阶段,利用人机物数据的深度学习,可以极大地提升企业的智慧决策水平,推动企业向智能制造的转型升级。