1.2 企业级RPA应用1.0到4.0

2018年年初,知名咨询公司Everest Group给出了一份报告,该报告调查了来自欧洲、亚洲、大洋洲和北美洲的近72家全球性企业,其中98%的企业已经开始使用RPA。该报告分别从RPA的解决方案、RPA软件的安全性、RPA软件的可扩展性及RPA的全面性这4个维度进行了展开描述。

1.2.1 RPA 1.0时代

在RPA 1.0时代,最令人瞩目的是Excel的宏。1993年,Excel第一次以Office套件的形式进入办公软件,开始支持VBA(Visual Basic for Applications)。VBA是一款功能强大的工具,它使Excel形成了独立的编程环境。通过使用VBA和宏,人们可以把手工步骤自动化。VBA允许用户创建消息输入框来获得用户输入的信息。

除Excel的宏外,屏幕抓取和简单脚本的编写也诞生于RPA 1.0时代,其代表者是JavaScript。

最初创建JavaScript是为了“make web pages alive(激活网页)”,因此,JavaScript的最初命名为LiveScript。用JavaScript编写的程序称为脚本。脚本可以直接写在网页的HTML中,并在页面加载时自动运行。JavaScript可以做与网页操作、用户交互和Web服务器相关的所有事情。

例如,在浏览器中的JavaScript能够:

(1)将新的HTML添加到页面,更改现有内容,或修改样式。

(2)通过JavaScript脚本获取用户鼠标点击、指针运行和键盘按键等与计算机交互的操作事件。

(3)通过网络将请求发送到远程服务器,下载和上传文件(即AJAX和COMET技术)。

(4)获取并设置cookie,向访问者提问并显示消息。

(5)记住客户端上的数据(“本地存储”)。

注意:网页上的JavaScript无法读写硬盘上的任意文件,不能直接访问操作系统,而这正是JavaScript最大的一个弊端。

如图1-1所示,总体而言,虽然JavaScript能够很好地支持当前的动态页面或静态页面,但是无法与其他网站、其他服务器或本地操作系统进行交互。

图1-1

1.2.2 RPA 2.0时代

在RPA 2.0时代,流行的RPA产品开发平台有UiPath、BluePrism、Automation Anywhere和WorkFusion等。它们广泛应用于业务流程外包(Business Process Outsourcing,BPO)和共享服务市场中。此阶段的产品允许用户以可视化的方式、使用拖放功能建立流程管理工作流,从而将重复的工作自动化。该工作流主要针对的是有固定规则的、结构化的数据。这种方式降低了用户的使用门槛,用户无须拥有专业的编码知识即可迅速获取数据与搭建流程。

1.UiPath

UiPath是高度可扩展的机器人过程自动化工具,用于将任何桌面或Web应用程序自动化,它允许全球企业为组织设计和部署机器人劳动力。UiPath的特点如下:

(1)UiPath可以托管在虚拟终端或云环境中。

(2)UiPath可以为许多应用程序提供支持,如Web(Orchestrator)和桌面应用程序(UiPath Studio和UiPath Bot)。

(3)自动登录功能可运行机器人。

(4)与.NET、Java、Flash、PDF、Legacy或SAP配合使用的抓取方案,绝对准确。

2.Blue Prism

Blue Prism通过自动化,帮助企业运行手动的、基于规则的后台重复办公流程,不仅使企业的业务运作变得更加敏捷,而且可以降低成本,提升效益。该工具提供了类似设计师的流程图,具有拖放功能,可自动执行各种业务流程。Blue Prism的特点如下:

(1)拥有强大且功能丰富的分析套件。

(2)不需要编程技能即可实施。

(3)可建立高效的、自动化的端到端业务流程。

(4)改进的控制室可提供实时反馈。

3.Automation Anywhere

Automation Anywhere 可将常规RPA与智能元素(例如,语言理解或读取任何非结构化数据)结合在一起,它的特点如下:

(1)可实现业务和IT运营的智能自动化。

(2)使用Smart自动化技术。

(3)可将复杂的任务快速自动化。

(4)可将任务分配给多台计算机。

(5)提供无脚本自动化。

4.WorkFusion

WorkFusion是软件即服务(SaaS)在线开发计算平台,通过获取机器人处理过程中产生的数据,监视机器人自动化的投入产出比(ROI),帮助人们管理企业内部所有部署的机器人。WorkFusion的特点如下:

(1)只需按一下按钮即可自动化执行任务。

(2)可根据需要部署机器人,实现企业级自动化。

(3)可与不同工作站上的多个用户进行协作。

(4)可在整个团队中实现自动化。

1.2.3 RPA 3.0时代

在介绍RPA 3.0时代之前,先介绍几个基本概念——结构化数据与非结构化数据,以及规则性流程与非规则性流程,帮助读者理解RPA 3.0时代出现的原因。

1.结构化数据与非结构化数据

结构化数据是指可以通过数据库二维逻辑表来表示的数据,它严格地遵循数据格式与长度规范,主要通过关系数据库进行存储和管理,如表1-1所示。

表1-1

非结构化数据是指数据结构不规则或不完整,即没有预定义的数据模型,不方便用数据库二维逻辑表来表示的数据,如办公文档、文本、图片、HTML、各类报表、图像、音频和视频信息等。

例如,虽然每家保险公司都有自己的保单,并且各保险公司保单的内容都属于结构化数据,但是若想对不同保险公司的保单信息进行提取,则通常是没有一个具体的数据模型可以涵盖所有不同类型的保单信息的。因此对于这种业务场景而言,各个公司不同的保单信息其实也属于非结构化数据。

2.规则性流程与非规则性流程

一般来说,规则性流程可以使用流程图进行展示,即可以对流程实施过程中的所有情况进行穷举。

例如,一个部门的请假流程:首先员工填写固定的休假申请表单或表格,然后将其提交到直属经理。若直属经理审批,则请假成功。若直属经理否决,则请假失败。

非规则性流程在很大程度上是依靠人为的经验或情感来实施的,并没有非常明确的指引。

例如,每年公司都会对员工进行绩效评估,纵使大部分公司都有一定的指标来衡量各个员工的绩效,但是在评分过程中,仍然会依赖人为的情感因素或是横向团队的对比数据,这种就属于非规则性流程。一般来说,对非规则性流程进行流程自动化的实施是非常困难的。

如今,市面上的部分RPA产品已经进入RPA 3.0时代,如Automation Anywhere、WorkFusion等。这些产品通过嵌入光学字符识别或光学字符读取器(Optical Character Recognition,OCR)的功能,以及机器学习,可以处理非结构化数据及非规则性流程。

OCR是指将手写或印刷文档通过电子或机械转换为可机器编码的文本,是从纸质数据中获取数字数据的一种形式。例如,把扫描的文档、文档的照片、场景的照片或叠加在图像上的字幕文字等转换为可机器编码的文本。

OCR实施场景如图1-2所示。

第1步,将需要处理的纸质版本文档通过扫描仪转换成图片。

第2步,使用OCR把这些图片转换为可机器编码的文本,如发票号、订单号、订单金额等。

第3步,使用RPA进入系统待录入界面,录入第2步中的可机器编码的文本。

第4步,将结果保存到指定目录。

图1-2

1.2.4 RPA 4.0时代

在此之前,虽然所有的RPA产品都是基于图形化开发的,大大降低了程序开发的难度,但根据笔者的经验,即便对非程序员进行一个月的(每天大概4个小时)封闭式培训,依然不佳。但是,当进入RPA 4.0时代之后,RPA产品便具有深度学习(即神经网络学习)的能力。通过录像机器人学习并且模拟员工日常操作,在学习一定次数之后,即可不通过任何代码的编译来模拟人类,从而使流程自动化或智能化。