第1章 大数据——超越喧嚣

如果没有大数据,感觉就像高速公路上的聋哑人。

——Geoffrey Moore

如果在玩职场bingo游戏时,划掉过去三月中工作时接触的专业术语将有很大的可能获胜,这些术语有数字化转型、数据战略、转型见解、数据湖、湖仓一体、数据科学、机器学习以及人工智能。众所周知,数据是组织成功的关键因素,依靠数据和人工智能的组织显然优于竞争者。根据希捷(https://oreil.ly/J8fjX)赞助的一项IDC研究,到2025年,捕获、收集或复制的数据量预计将增长到175ZB。捕获、收集或复制的这些数据被称为Global DataSphere(全球数据世界),有以下三类来源。

核心

传统或基于云的数据中心。

边缘

加强的基础设施,如信号塔。

端点

个人计算机、平板计算机、智能手机和物联网(I o T)设备。

该研究还预测:到2025年,49%的Global DataSphere将驻留在公有云环境中。

也许有读者会好奇:“为什么要存储这些数据,有什么好处?”答案很简单。所有这些数据相当于世界各地的不同语言单词,每个都提供一小片信息,如同拼图。以一种有意义的方式将其拼接一起将讲述一个故事,它不仅会告知还会改变企业、人甚至世界的运行方式。大多数成功的企业已经利用数据来了解其业务的增长动力和感知客户的体验,并采取正确的行动;查看“漏斗”,即客户获取、采用、参与和留存,现在已成为产品投资融资的通用语。这些类型的数据处理和分析称为商业智能(BI),并被归类为“离线洞察”(offline insight)。从本质上讲,数据和洞察对于呈现发展趋势至关重要,企业领导人可以据此采取行动。然而,该工作流与企业运作的核心业务逻辑是分开的。随着数据平台的日益成熟,从所有客户那里得到的一个重要信号是,他们开始收到更多的请求,要求在他们的数据湖上运行更多的场景。

企业利用数据来了解其业务的增长动力和感知客户的体验,而后使用数据来设定目标,并通过更好的支持和更新的功能来提升客户体验。还可以制定更好的营销策略来发展业务,提高效率,降低产品和企业的建设成本。星巴克(Starbucks)是一家遍布全球的咖啡店,它使用所有可能的数据来持续衡量和改善其业务。星巴克使用它的移动APP数据,并将其与自己的订单系统相关联,以便更好地了解消费者的消费习惯并有针对性地发送营销活动。星巴克的咖啡机上使用传感器,每隔几秒就会发送健康数据,对这些数据进行分析可以改进咖啡机的可预测性维护。同时这些联网的咖啡机还可以下载配方,而无须人工干预。

数据也用于世界拯救计划,如Zamba项目(https://oreil.ly/emc3D),该项目利用人工智能在非洲偏远丛林进行野生动物研究和保护,并利用物联网和数据科学创建循环经济,以促进环境可持续性发展。