- 趣读数字经济
- 李晓雨 冯丽伟 沈根海
- 3888字
- 2024-12-31 19:48:48
1.3 算力、算法与数据:人工智能的核心
决定人工智能“智商”的核心因素有三个:算力规模、算法模型的精巧度、数据的质量和数量。
至于三者的关系,打个比方,用燃气灶炒菜,算力是燃气,算法是厨艺,数据就是食材,做出的菜品就是深蓝、阿尔法狗、ChatGPT等人工智能产品。想做出好菜,三者缺一不可。
1.算力——人工智能的基础
算力,是人工智能的基础,也是数据与算法的基础支撑,更是推动人工智能迈向规模化、多元化与创新化的决定性力量。
算力,靠的是芯片。GPT-1只需要在8枚GPU上训练一个月,而GPT-2需要在256枚Google Cloud TPU v3上训练(费用为256美元/小时),训练时长未知。到GPT-3,算力费用已经是千万美元级别。ChatGPT光从模型训练算力来看,至少需要上万枚英伟达GPU A100,单次模型训练成本超过1 200万美元(约合8 000万元)。
ChatGPT之所以能对答如流,靠的是一秒内处理数十亿个单词的算力,更是上万枚英伟达GPU A100和H100提供的强大算力支持。
在国内,云计算技术专家公认的说法是,1万枚英伟达GPU A100芯片是做好AI大模型的算力门槛。
然而,由于美国限制高性能GPU供应,目前国内云厂商拥有超过1万枚GPU(以英伟达中低性能产品为主,如A10)的企业不超过5家,其中拥有1万枚英伟达GPU A100芯片的企业最多只有1家。
目前,AI大模型的推理、训练高度依赖英伟达的GPU芯片。缺少芯片会导致算力不足,算力不足意味着无法处理庞大的模型和数据量,会极大地降低AI推理和模型训练的准确度。
2.算法——人工智能的灵魂
算法是人工智能的灵魂,是人工智能的逻辑规则大脑。这些年来人工智能的飞速发展,正是因为深度学习算法的出现。
ChatGPT本质上是一个由浮点数参数表示的深度神经网络大模型,属于深度学习的框架,并在算法上有所突破,能很好地容纳和分析大数据。个别国产大语言模型容易出现过载等问题,就是因为算法处理不了更大的数据量。
GPT-1和GPT-2开源,GPT-3没有可靠的开源软件。目前,有的国产大语言模型实际是用开源软件加上中文语料处理的,所以中文效果并不理想。
我国人工智能产业发展过度依赖开源代码,真正属于中国原创的代码并不多。
开源代码可以拿来用,但专业性、针对性不够,不能满足具体任务的实际要求。在获得同样数据的情况下,以开源代码运行,AI深度学习之后或许能输出结果,但由于训练框架固定、算法限制,在实际应用中很难达到预期效果,而且难以修改、完善、优化算法。尤其面对专业性强的研究任务,一旦被“卡脖子”,将非常被动。
打个比方,赛跑时,如果运动员的运动鞋量身定制,贴合脚型,辅助发力,则更容易取得好成绩。
同理,用开源代码“调教”出的AI,其效果不会太惊艳。仅仅依靠开源代码和算法,无法支撑中国的人工智能产业发展。
只有掌握核心代码,才能在未来的AI“智力大比拼”中拥有胜算,这就需要有以数学为基础的原始核心模型、代码和框架创新。
如果从底层算法做起,整个数学模型、算法设计、模拟训练就能一脉相承,不仅可以协同优化,而且可以根据需求随时修改,从而真正解决实际问题。这需要数学家的参与,需要有一批人才能沉下心来做自己的底层框架和核心算法。相应地,我们的教育也要更加重视数学和编程人才的培养。
3.数据——人工智能的食粮
数据是人工智能的食粮。现在,深度学习是人工智能发展的主流方向,非常依赖大数据。
数据作为AI学习的基础资源,数据质量和训练数据量对AI性能至关重要,不亚于模型大小。比如,Deepmind的Chinchilla语言模型只有700亿个参数,但经过更广泛的数据训练,可以胜过有1750亿个参数的GPT-3。
GPT-1用了约5GB的文本数据,GPT-2用了40GB,GPT-3猛增到45TB。而对于GPT-4,OpenAI没有透露具体参数数量和使用的训练数据,将“竞争环境”列为保密的原因。
ChatGPT的用户普遍反馈用英文提问得到的回答更加精准,而用中文提问则答案的错误率较高,根本原因就在于其语料库里中文只有5%,且数据质量较差。高质量的数据能够为好的参数打好地基,否则就像用沙子做地基,不可能盖出高楼。
看起来,既然中文语料库是ChatGPT难以逾越的壁垒,那么这正是中国版ChatGPT崛起的大好机会。然而尴尬的是,复旦大学发布的国内第一个对话式大型语言模型MOSS,回答英文问题的水平也同样高于中文问题。对此,复旦大学邱锡鹏教授解释称,英文作为科研主流语言,在学术界和工业界得到广泛应用,积累了大量高质量的语料数据,这为英文自然语言处理的研究提供了极大的优势。根据相关数据,MOSS学习的英文单词数量是中文的十倍。
的确,英文作为科研主流语言,全球范围内大量的学术期刊、网页、书籍等,都可以成为ChatGPT的训练数据来源。比如《自然》《柳叶刀》等,这类专业学术期刊能提供大量优质数据,帮助ChatGPT的写作更清晰、更有条理。除此之外,英文网站占全球网站总量近60%,而中文网站目前仍不足2%。
这是我国发展自然语言处理技术的过程中不得不重视的问题。因此,语料库的构建不能只局限于简体中文语料库,要能理解多种语言,才能构建一流的中文语料库。单纯靠人海战术和低人力成本建一个简体中文语料库,并不能解决这一问题。
在ChatGPT发布之前,很多人认为我国的人工智能技术水平不仅稳居世界第二,还与美国共处世界第一梯队,已经十分接近美国。但ChatGPT推出之后,我们发现,我国仍有很长一段路要追赶。
人工智能技术正在从以编程/软件为中心的1.0阶段,快速进入以数据为中心的2.0阶段。ChatGPT等人工智能大模型的出现,正在推动AI技术的通用化和泛化,AI开始脱“虚”向“实”,越来越多地参与控制、管理和优化物理世界的运行,成为引领新一轮科技革命和产业变革的战略性技术。在这场科技革命里,中国不但不能落下,更要努力成为领跑者。
即使强如GPT-4,仍属于弱人工智能,中国还有时间和机会。
4.弱人工智能、强人工智能和超人工智能
人工智能根据能力可划分为三个层级:弱人工智能、强人工智能、超人工智能。
弱人工智能专注于且只能解决特定领域问题。
比如阿尔法狗能在围棋方面战胜李世石,但你让它炒两个菜试试。
弱人工智能本质上还是“数数”,只是数得比较快。现在主要的算法基本离不开穷举法和概率统计,多是数据映射、数据拟合、概率统计等数学运算。
虽然GPT-4在某些方面表现得很神奇,但思维方式仍然局限于模式匹配和统计推理,并不能像人类一样,通过思考和逻辑推理去解决问题,距离强人工智能还有较远距离。
强人工智能,又称通用人工智能或完全人工智能,指的是可以胜任人类所有工作的人工智能,即真正能思考和解决问题的人工智能。
简单来说,就是人可以做什么,强人工智能就可以做什么。一般认为它有自我意识,有和生物一样的各种本能,比如生存和安全需求;可以独立思考问题,有自己的价值观和世界观,在某种意义上可以看作新物种。
这种定义过于宽泛,缺乏一个量化的标准。一般认为,可以称得上强人工智能,起码需要具备以下能力。
(1)基于一定抽象能力的学习能力。目前的深度学习技术需要大量的训练数据,而人类学习却不需要。比如,教小孩子认猫,只要看两三只狸花猫就够了,当他再看到外观差异较大的奶牛猫、暹罗猫,甚至无毛的巴比诺猫等,也能轻松认出是猫而不是狗。但换作AI,起码需要经过上万张图片的训练,才可能具备类似能力。两者的区别在于抽象能力,对AI而言,需要实现少样本、无监督的学习,但目前的进展还很有限。
(2)足够的知识广度,包括常识性知识和跨领域知识的应用能力。很多常识,即便是两岁儿童也能理解和预测,比如丢出的物体会下落、两点之间直线最短等直观的物理过程,但AI需要学习相应的物理学知识才能掌握。常识,不仅包括人类所认知的万事万物,更包括这些事物相互作用的准则和因果关系,以及行为模式和价值判断。
常识有多重要?以自动驾驶为例,AI要靠学习已知路况积累经验,但当遇到学习资料里没有的危险时,能不能像人一样正确处理?这就需要通过某种方法让AI掌握一些类似常识的知识,让其在危险来临时首先确保驾车人与行人的安全,路况过于极端时安全减速并靠边停车等。
目前,AI被训练得精通某一特定领域,但缺乏生活常识的输入,故表现得与人类差异较大。同时,跨学科知识的交融越来越重要,缺乏另一领域的知识也会导致AI表现较差。
(3)面对复杂的不确定因素,进行推理、规划、决策、解决问题的能力。人类具有联想、类比能力,能实现跨领域的推理,比如神探福尔摩斯可以根据嫌疑人的一顶帽子中遗留的发屑、沾染的灰尘,推理出嫌疑人的生活习惯,甚至家庭、婚姻状况,并制订下一步的计划,但现在的AI显然办不到。
(4)从感知智能到认知智能,灵活使用自然语言进行交流的能力。感知智能模拟人类的“视听”,认知智能在感知的基础上形成“自我的认知”,当前正处于从感知智能向认知智能阶段发展的“感知增强智能”过渡期。现在的AI,看似能与人自然对话,实际不能真正理解语义。强人工智能起码要实现认知智能,能理解用户实际意图,比如能听懂“你等着”之类的弦外之音。
(5)整合上述能力,实现既定目标的能力。我们大概可以想象一个满足上述能力要求的人工智能会表现出怎样的行为特征,而这样一个强人工智能或通用人工智能,基本上能完成所有人类工作。
一般认为,强人工智能和弱人工智能的工作原理是完全不同的,很可能基于量子计算机和量子网络,而不是现在的计算机的代码格式,比如不再用带正负电荷的电子分别表示0和1来编程。
当然,也有一些研究者认为,强人工智能只需要具备胜任人类所有工作的能力就可以了,未必需要人类的意识。总之,一旦牵涉“意识”,强人工智能的定义和评估标准等就会变得异常复杂,而人们对于强人工智能的担忧也主要来源于此。
超人工智能,即超级的强人工智能,各方面都比人类强大得多,基本上可以理解为全知全能的上帝。
超人工智能的定义最为模糊,因为没人知道超越人类最高水平的智慧是怎样的一种存在,到底会表现出何种能力。超人工智能更多存在于科幻场景下,比如斯嘉丽主演的《超体》。