2.3.2 自主AI智能体设计原则

Toda的模型从广义来说是构建在感官运动原则的基础上的,食菌者缺乏明显的大脑活动能力,所以尽管它们是非常优秀的铀挖掘者,但永远不会听到它们吹口哨或一起歌唱来活跃气氛。毕竟,食菌者模型没有考虑情感和动机。大约20年后,首先是Braitenberg,然后是Pfeifer,用简单的感官运动原则设计了情感(即爱、恨、吸引等)模型,并证明反应模型也会促生情感和价值体系。这就产生了问题:自主、情感和价值体系就意味着智能吗?食菌者和它之后的改进是智能吗?答案将引导我们去探究具身认知的典型特征[354]

1.认知是情境性的。与一般概念上的认知不同,具身认知是一种情境性活动。智能体与真实世界环境交互,然后由感知与行动配对而产生认知。情境性认知包含一个连续的过程,在这个过程中感知信息连续在传感器中流动,促生运动行为,进而以与任务相关的方式改变环境。走路、拧紧螺丝、打开一盏灯都是一些情境性认知的例子。Wilson指出很大一部分人类认知是“离线”进行的,没有任何与任务相关的输入和输出,当然也就没有任何明显的环境参与,从定义上来讲就是非情境性的。创造性思维过程(如写信或编写音符)就是例子。

2.认知是有时间压力的。具身认知经常伴随着“实时”和“运行时”这样的术语。因为具身认知是情境性的,它要求来自环境的实时响应。如果没有满足时间压力,就会导致“表征瓶颈”,并且如果没有连续的进化响应,系统将无法构建起一个完整的符号模型。基于行为的方法是对这些瓶颈的一种补救,它通过将实时的情境性行动视为认知活动的基础,进而动态地生成适合于情境的行动,从而显著地减轻时间压力。然而,这样的情境性认知模型不能被扩展,因此没办法促生出人类认知模型。

3.主体将认知工作转移到环境中。情境性主体尝试以策略方式利用环境,通过控制环境来处理手头的工作,而不是完全形成对相关行为的系统响应。例如,指南针导航利用了地球的磁场排列,从而能够找到正确的方向。类似地,在装配任务中,零件的排列或使用几乎是按照预期成品的顺序和空间关系进行的。这些转移发生的原因是,通常存在信息处理的限制、注意力的物理限制以及智能体可用的工作内存的限制。心理学和行为主义的概念证实了这一点,在本章后面可以看到。

4.环境是认知系统的一部分。认知不是大脑的一种活动,而是分布于主体与情境中(当它们交互时),是持续性的智能体-环境交互的结果。因此,情境和情境性主体是一个统一的系统。相似的观点已经由Uexkull从生物学的角度表达出来了,我们也会在后面讨论。

5.认知是为了行动。不像传统人工智能的认知,具身认知总是以行动为导向的。感知是动态的、实时的,并且与运动行动同时发生。

6.离线认知是基于自身的。当不处于环境中时,解耦主体中的认知过程是由类似于感觉信息处理和运动控制的仿真的心智结构驱动的。内心世界的概念将会在后面有意识的主体的内容中详细讨论。

因此,食菌者可以被认为有最基本的认知行为。然而,就这种主体的心理状态而言,这个模型还是不完整的,所实现的认知过程的层次也非常低。极具说服力的一个观点是,思维必须被理解为智能体本身不断与环境交互的一个属性。生物进化见证了从单细胞有机体的纯粹反应,到人类的认知思维的成长。也就是说,我们的提升是从具有感知传感和运动的基础技能的生物开始的,这些生物的认知更多是由直接、实时与环境的交互组成,而非大脑互动。因此,从这一论点来说,感官运动处理是一种底层智能行为。食菌者揭示了一系列开发人工自主AI智能体的设计原则和指导方针[262]

1.完全的智能体,也就是“食菌者原则”。具身AI智能体应该是:

(a)自主的。具有在没有人类干预的情况下在真实世界中执行指派的任务的能力。

(b)自我维持的。它们能自己维持运行很长时间。

(c)具身的。在真实世界中,它们必须被设计为动态系统。尽管仿真有用,但却不足以了解智能体世界的动态。

(d)情境的。智能体世界的动态是从智能体的角度进行控制的,由经验去充实。

“食菌者原则”与传统的人工智能不一致,主体是由其实体和情境定义的。然而,完全满足以上四个标准的主体目前还不存在。

2.生态位。第一条原则只有在智能体成为世界中的生态位时才有意义。AI智能体通常缺乏人类智能所具有的普遍性和广泛性,而且常常是为特定的生态位而设计的。行为的执行是通过智能体与世界交互提供的能力而在真实世界中完成。例如,线跟踪器不会注意到任何像“向前移动”这样的命令,只有它的传感器能够感知到它应该跟随的黑/白线时才会有所动作。类似地,多机器人系统中的群集算法是为考虑足够大的群集被设计出来的,而且被发现在机器人数量比较少时无效。生态位可以被看作是将智能体与本地环境紧密联系在一起的关系。它的概念与传统人工智能形成了鲜明的对比,它不再是程序员编码的计算机程序,智能被定义为智能体和本地环境的交互作用。

3.并行过程。源于生物学的观察证实,认知是一系列并行过程的重叠。这些过程彼此并行运行,松散结合,异步而且只需少量或者不需要集中控制。缺乏集中控制会将表现降低为仅仅是反射性的运动。而这成了一个争论的主题:在缺乏集中控制的情况下,是否能真正开发出更高层次的类人认知 在第9章,这个争论将从人工意识的角度进一步讨论。。对人类而言,我们的认知能力是五官的重叠,再结合大脑的记忆和推理,很明显的是,我们参与的各种各样的活动比那些昆虫和鼠类等要更多样化。但是,如我将在之后讨论的,这个原则已经非常成功了,而且促进了基于行为的方法在设计移动机器人方面的发展。

4.学习机制和“价值原则”。“价值原则”从广义上来说是指智能体能够判断什么对于自己有利,即有一组价值观。隐式价值观可以通过监督学习或调节传感器响应来开发。

5.感官运动协调。在前面的两个原则中提出的初级层次的认知(如移动),将会用感官运动模型来体现。这意味着分类、感知和记忆应该被看作感官运动的协调,更多依赖于反应表现而非独立模块。

6.生态平衡。为了让每一个人工智能体有最优表现,传感器、处理和行动之间需要有一个同步。例如,装配有精密复杂运动传感器的机器人不能有低的处理能力(如搭配初级PIC微处理器)。否则会增加时滞和瓶颈,影响其性能。

7.良好的设计,用于具身智能体发掘智能体世界交互及生态位。假设一个机器人的任务是沿逆时针方向围绕一个5米见方的正方形运动。这个工作可以通过一个程序来完成,即让该机器人每5米直角转弯一次。或者用另一个方法,用一个光传感器和一个根据机器人轨迹制作的黑条来实现,编程为每当这个黑条结束时机器人进行直角转弯。第一个方法会因为摩擦和其他阻力而产生误差,在几次运行之后开始给出错误的轨迹。但是这个问题的第二个解决方案是与本地环境紧密联系在一起的,并且总是会给出正确的轨迹,直到机载电池耗尽。这个原则比表面看起来更有用,特别是在群体机器人中,这将会在第6章讨论。

2.4节将讨论源于自然界的灵感是如何塑造基于智能体的机器人的。

Moravec悖论

Moravec观察到,设计和开发基本的感官运动技能需要比让其获得高级逻辑推理能力更广泛的资源。可以看到,让人工主体玩跳棋游戏或者回应智商测试,要比让其复制一岁婴儿的感知和运动技能容易得多(示例如图2.3所示)。

图2.3 停车场问题。停着的车下面的数字是多少?要解答这个相当简单的问题,用人类的能力只需把这个图翻转过来即可,而算法途径却失败了。汽车图像为在pixbay上的CC图像

这个悖论是因为我们试图通过编程途径去重建生物智能实体而产生的。生物系统规则,如人类认知,在数十亿年的进化过程中通过与环境的交互不断进化,已经编码到我们的遗传物质之中。我们仍然不知道大多数这些过程是如何工作的,并且诉诸近似的数学模型来在人工领域中复制它们。一些研究者确实指出,争论的焦点在于人工智能研究者、哲学家和心理学家在智能上还未达成一致的定义。然而,人类大脑与人工智能的对比可以给我们一些启示。在人类大脑中,连接的神经元储存记忆,通过从外部世界广泛接收的感觉来分配信息和生成想法,并且通常会联系从多年学习中获得的记忆和刺激反应,从而对任何给定的情境提供不同的响应。我们对外部世界的感知是由感觉器官决定的,它们会影响我们的精神状态。另一方面,CPU是在数字逻辑上构建起来的,遵循算法规则。人类感知的简单方面通常不能由计算基础解决,而这一般发生在非常初级的阶段,比如一岁的婴儿身上。而跳棋游戏或智商测试是可以通过算法方法解决的问题,因为其规则是已知的,并且可以被编程到AI智能体。

[1] 在第9章,这个争论将从人工意识的角度进一步讨论。