前言

我们正处于以数字技术为引领、以人工智能为趋势的全新发展范式中。当网络信息社会步入高速发展阶段,数字经济快速崛起时,人工智能便成为了社会关注的焦点。

2023年以来,ChatGPT和大模型技术引发全球关注,人工智能不再是离日常生活很远的科技话题,而是成了每个人在工作和生活中都可以使用的工具。甚至有专家推断,在未来社会中不会使用ChatGPT的人,将如同当前不会使用互联网和智能手机的人一样,在智能社会里寸步难行。在惊叹人工智能技术快速发展的同时,我们也需要更加关注人工智能带来的安全挑战,为此我们希望这本书能够让读者更加客观、全面地认识ChatGPT和大模型,以及它们给安全带来的机遇和挑战。

在第1章,我们对ChatGPT进行了全面的分析解读,介绍了ChatGPT的基本特征和技术创新点,尤其是对ChatGPT底层的大模型技术进行了深入的分析,并且回答了为何ChatGPT可以轻松地与人交流,未来科技创新的风口在哪里,以及针对个人来讲,如何把握住这次人工智能的发展浪潮。我们希望通过这一章的讲解能够让大家对ChatGPT和大模型有一个全面的了解,不但知道它们的优势,同时也能发现它们的不足。

在第2章,我们重点介绍了GPT-4。作为OpenAI最新推出的自然语言大模型,GPT-4不但开启了新的发展历程,而且有望成为通用人工智能发展的初级阶段。但是拉长时间线来看,GPT-4也只是人工智能发展历程的一个节点,我们需要更加客观地看待它的价值。

在第3章,我们帮助大家梳理了大模型[1]的发展历程,尤其是自然语言大模型是如何进入大众视野的。在这一章,我们分析了Transformer的注意力机制(Attention)以及OpenAI这家当前广受关注的公司。同时,我们结合当前业内关注的焦点,重点分析了大模型创新过程中大众普遍关心的4个问题。

在第4章,我们分析解读了人工智能时代的安全挑战,着重强调了在数字世界中,安全是经济社会平稳运行的基石,而数字技术的发展是一把双刃剑,一方面提升了我们的工作和生活质量,另一方面也让网络攻击者可以利用新的技术工具对基础设施、民生事业开展更加复杂的攻击,这种攻击不但带来了更大范围的破坏,还将引发新的安全挑战。

在第5章,我们重点分析了大模型带来的安全挑战。事实上ChatGPT只是一款人工智能产品,其底层的大模型才是这轮人工智能发展的关键所在。但是大模型并非完美无缺,它不但经常使ChatGPT“一本正经地胡说八道”,还面临诸多困难和挑战,以至于“深度学习之父”辛顿也对大模型的发展频频发声,担忧其安全风险以及可能给人们带来的危害。

在第6章,我们分析了ChatGPT带来的安全风险。本章重点分析了网络安全、个人隐私保护、版权保护、伦理风险等领域。尤其是在网络安全领域,我们已经发现ChatGPT在降低网络攻击门槛、网络诈骗、恶意代码、数据泄露等方面暴露出了诸多问题和挑战,这为后续安全人员和监管部门制定相应的政策措施提供了实践依据。

在第7章,我们从另外一个角度分析如何利用ChatGPT来提升安全防护能力。事实上,技术没有对错之分,如何发挥其作用主要在于使用它的人。所以,如果把ChatGPT应用到网络安全防护上,也可以有效地帮助网络防护人员提升工作效率,更快地发现潜在安全风险,提升安全能力。

在第8章,我们从整个行业的角度来分析ChatGPT对经济社会的影响,重点聚焦ChatGPT的局限性、引发的思考等,帮助大家更加客观、深入地理解这轮人工智能发展浪潮的关键点,避免人云亦云,甚至迷失其中。在这一章,我们还分析解读了国内科技公司已经推出的大模型,帮助大家厘清国内外大模型发展的不同点。

人工智能的发展不是一蹴而就的,目前通过多种类型大数据的不断积累和综合利用,大模型算法的不断升级,人工智能有了质的飞跃。每一寸的进步都需要日拱一卒的努力,同时各种不确定性问题也在叠加。

2023年7月,国家互联网信息办公室联合其他部委正式发布了《生成式人工智能服务管理暂行办法》,这也是国家首次针对当前的生成式人工智能领域发布规范性政策。我国人工智能技术的发展目前属于国际第一梯队,在科研上基本覆盖了大部分细分领域,总体发展进程与欧美国家同步。在市场规模方面,截至2022年,我国人工智能产业规模已达到约3500亿元,巨大的市场规模与主体数量也为我国人工智能产业的创新带来了无限可能和机遇。当下,虽然我们理想中的人工智能尚未实现,但通用人工智能无疑将成为未来人工智能的发展趋势。

在未来,更高级别的通用人工智能的实现,将带来人工智能产品和技术的巨大突破,对人类社会产生深远影响。我们正处于一个不断向前的人工智能时代,也是不断探索未知的人工智能时代。

希望我们每个人都能成为此轮人工智能发展浪潮中的弄潮儿。


[1]大模型也被称为大规模预训练模型(Large Pre-trained Language Model),其核心特点是在大规模无标注数据上进行训练,学习出一种特征和规则。基于大模型进行应用开发时,使用者可以对大模型进行微调(在小规模有标注数据集上进行二次训练),也可以不进行微调,就可以完成多个应用场景的任务,实现通用的智能能力。