3.1 控制范式

移动机器人被设计用来完成各种任务。最基本的任务能够四处移动,并可以避开障碍物到达某个给定的目标点。其他任务包括追踪气味、绘制未知地形图纸、对声音和手势做出回应、关注以人为中心的环境(博物馆、剧院、机场等)。

最简单的机器人至少包含一组配对的传感器与执行器。配置更多的传感器和执行器可以提高机器人的能力,增加其多样性。其他重要的参数是对机器人的约束,以及对过程、安全考量、自我保存和优化性能的约束。本章主要讨论机器人的控制范式和体系结构,并尝试在工程上实现上一章所提概念。

一个好的控制范式包含三个重要方面:闭环控制、实时响应以及克服传感器误差的鲁棒性。闭环控制是其中一个关键。这点可从最简单的一种机器人——巡线机器人的例子中看到。该类机器人装有一个光传感器,它会跟踪一条用某种颜色标记的线(通常是黑色或白色)。任何偏离直线的不理想偏差都是由光传感器和电机之间的感知运动对来避免的。ANIMAT的推论假设有一个眼睛盯着路面的虚拟动物,如图3.1所示。闭环与开环的信息流对比则如图3.2所示。如果没有光传感器,机器人将无法跟踪这条线,它将会在线段端部指向的方向上任意移动。

缺少反馈机制 反馈在控制系统和电子学中是一个很重要的概念,并且结果表明基于反馈的闭环系统比开环系统更为稳定。将使机器人无法与环境进行交互,流程图中对此进行了解释。此外,移动机器人应该具有最小延迟的实时响应。该组传感器执行器配对是由一个微控制器进行调节,并由一组控制规则和参数所构成。通常,这是在准确性和延迟时间之间进行的权衡。第三点是,传感器容易出现故障,并会给出错误的和有噪音的读数。在这种情况下,该系统需要在某一领域的实际应用中保持良好的运行。因此,移动机器人的控制应该采用并行的方法进行组织,包含柔性降级并高雅地处理异常,如此一来,单一的硬件或软件模块故障就不会妨碍机器人的总体目标。

设计一款机器人有三种广义方法。第一种方法简称SPA(sense-plan-act),它遵循了传统人工智能的概念。它在20世纪50年代早期兴起,通过处理感官信息来生成计划和地图是这种方法的基础。机器人必须绘制出详尽的、近似的环境地图用以进行导航,其中,建筑物近似为长方体,云近似为球体,人近似为一个椭圆形的头、一个圆柱形的躯干以及较小的圆柱形手臂,道路近似为一组平坦的直线段等。当绘制出了这样的环境地图,机器人必须从中找到合适的路径以到达目标点。

图3.1 基于ANIMAT的巡线者——一个一直盯着路面的人工动物。该模型等同于一个基本的带有光传感器的线跟踪器。然而,这样一个只有光传感器的设计不会有太多的实用价值。一个高鲁棒性的设计应有一圈光或超声波传感器,以及其他先进的硬件、反馈方式和传感器融合,并考虑到摩擦、不平坦地形以及其他环境因素的影响

图3.2 闭环系统。在a)中,光传感器会考虑到与环境的交互,线追踪器会对线进行跟踪,直到线的末端;在b)中,没有光传感器,机器人没办法获得环境的任何相关信息,将进行没有任何目标或动机的随机移动。这种情况下,机器人将不会优雅地停止移动,并很可能会导致一些碰撞

这种方法可以概括为一个结合了Google地图的《我的世界》(Minecraft)。即使是20世纪60年代后期最好的电脑也无法制作出像今天的《我的世界》或Google地图,但其理念却大致相同。正如第1章所讨论的,Nilsson[253]通过制作基于网格的(先验的)地图设计了Shakey的导航。这种方法依赖于从环境中获取的信息,然后对这些信息进行处理,从而实现智能移动。由于与传感器的范围相比,空间显然是无限的,机器人的移动将通过一个循环过程进行,在这个过程中,传感器感知环境,微处理器制定在这种环境中的导航规划,最后执行器将触发运动。

第二种方法则依据行为主义原则[52,53],这个原则里不需要制作一个先验地图,而是机器人凭借在所处环境中接近实时的传感器读数搭配即时驱动,并利用这个感知-运动对开始移动,该方法中没有良好的规划或者地图,类似动物与所处环境的交互。这种方法取消了先验的规划,并将环境动态实时处理为即时信息。这种方法在导航和其他低级任务中非常有效,但是我们将发现,它不能扩展到更高级别的任务上。

第三种方法,既包含规划,又包含行为主义。这样的建构可以在大多数最先进的机器人中看见。在后面的章节中,我们将讨论混合架构对于以人为中心的机器人和机器人伦理的重要性。

1.协商式方法(协议法),需执行前进行细致规划。在导航环境中实施时,机器人必须在开始移动之前设计详细的环境地图。

2.反应式方法,主体将根据环境来行动,没有提前规划。从动物和昆虫世界获得的灵感,当看到障碍物时会向左转也许是最简单的反应式范式。当主体跨多个传感器、通过各种并行任务行动时,反应式范式将生成基于行为的机器人设计方法。

3.混合法,两种方法的结合,严谨的规划将以一种被动方式进行执行。

下一章是关于神经科学家及控制论专家Valentino Braiten-berg做的一些思维实验,为基于简单感知运动设计的行为发展提供了很好的例子。它扩展了反应式方法对设计机器人的描述。

SR图(刺激反应图)

刺激反应(Stimulus Response,SR)图是用图像呈现受到刺激(Stimuli,S)导致反应(Response,R)而产生的反应式行为。由Ronald Arkin在20世纪90年代初期所发展。

通过将SR图叠加在一起,可以设计出完整的智能体控制机制,正如Braitenberg的车辆-3c一样简单,如图3.6所示。传统上,简单行为被放在下端,复杂行为被放在上端,如图3.19所示。

对行为的等价代数方法可使用函数进行表示:

其中,行为为β,给定的刺激为s,导致的回应为r。

[1] 反馈在控制系统和电子学中是一个很重要的概念,并且结果表明基于反馈的闭环系统比开环系统更为稳定。