1.7 智能实践

在20世纪60年代,人工智能和机器学习等理论已经发展得比较完善了,但是由于当时条件有限,特别是在计算能力上的限制,在数据处理的算法方面一直没有能够落地的技术。随着云计算的发展,带来了计算能力革新性的提升,人工智能这些基于大数据的技术终于在当今再度繁荣,带来了数据智能。

在运营上,数据智能的实践可以分为两方面:商务运营(Business Operation)和技术运营,如图1-8所示。

图1-8 数据智能在运营中的应用

在商务运营上,数字智能可以带来商务模式的创新。数据智能可以提供相当准确的预测、分类,以满足诸如定制化营销、广告精准投放、人脸识别、语言交互、自动驾驶等场景需求。这些会在本书的第2部分“大数据与数据智能”里做详细的介绍。在第2部分的第11章“企业大数据实施策略”中,在商业模式的创新上有具体的讲解。

在技术运营上,或者说在运维上,数据智能体现在技术运营的数据能力上,也就是AIOps上。下面对AIOps做简单介绍。

在互联网时代的早期,在当时的用户规模和商业模式下,技术运营工作大部分是由运维工程师手工完成,这被称为人肉运维时代。随着互联网业务急速扩张、用户规模指数级增长,云计算服务的类型变得越来越多,系统规模变得越来越庞大和复杂,运维人力成本的增长也终于达到了无法忍受的程度,自动化运维的概念应运而生。用机器的自动化来执行重复的手工运维工作,解放运维工程师的双手,大大减少了人力成本,更提高了技术运营的效率,同时,这也是AIOps的一个重要思考点和起步点。

2019年互联网用户规模已经突破40亿,在全球有一半的人口“触网”的背景下,全球排名前100的互联网应用,任何一天的数据量都是PB级的。这些顶级互联网应用的系统规模、复杂度、变更速度以及对稳定性、安全、成本、效率的要求已经远远超过了“基于人为指定规则”的自动化系统所能够掌控的范畴,技术运营的瓶颈已经不再是运维工作的执行,而是运维工作的决策。

全球颇具权威的IT研究与顾问咨询公司Gartner在2016年便提出AIOps的概念,并预测到2020年,AIOps的采用率将会达到50%。AIOps不依赖人为指定规则,主张基于人工智能算法从海量运维数据中持续学习,不断提炼并总结规则。AIOps在自动化运维的基础上,增加了一个人工智能大脑,从监控系统采集到的海量数据中发现规则并根据实时环境态势数据做出分析决策,指挥自动化指令的执行,达到技术运营的高效率、低成本和服务高可靠性这些整体目标。

截至2019年,从AIOps已经取得的落地成果来看,其市场发展正处于从早期先行者市场跨越到主流实用主义者市场的关键阶段。AIOps已经在多个行业多个场景实现了单点突破,并逐步形成包含学术研究、技术预研、产品研发、用户场景的AIOps生态。当前最大的挑战在于如何从点到面,将多个单场景的实践方案提升到一个能为众多企业用户服务的通用化AIOps平台。

AIOps的讲解在本书的第4部分展开。在这部分将介绍近两三年国内领先的互联网企业的AIOps落地实战案例和来自一线实践的心得体会。