ChatGPT原理与架构:大模型的预训练、迁移和中间件编程在线阅读
会员

ChatGPT原理与架构:大模型的预训练、迁移和中间件编程

程戈
开会员,本书免费读 >

计算机网络人工智能10.6万字

更新时间:2024-04-25 18:20:57 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

程戈
主页

同类热门书

最新上架

  • 会员
    本书结合人形机器人研究中各类先进方法,系统地介绍了驱动人形机器人运动的基础知识、推导过程以及应用案例,阐述了人形机器人的运动学、动力学表示方法,解释了ZMP的概念及其与地面反作用力的关系,描述了人形机器人双足行走行为的生成和控制方法,并拓展了其他多种动作的实现方法,最后介绍了动力学建模、仿真和高效动力学的计算方法。
    (日)梶田秀司编著计算机8.7万字
  • 会员
    这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AIAgent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领
    刘聪 沈盛宇 李特丽 杜振东计算机11.2万字
  • 空间计算是一种不断发展的以三维世界为中心的计算形式和交互形式,是以计算机视觉为基础的高阶应用。其核心是使用AI、计算机视觉和扩展现实将虚拟体验融入物理世界,让用户摆脱屏幕的束缚,自然地与数字世界中的对象互动,就像与真实世界中的对象互动一样。随着生成式AI的爆发,空间计算平台将拥有更加丰富的内容,将在很大程度上改变我们的生活和工作,重新定义商业模式,并改变我们与技术和整个世界互动的方式,推动我们进入
    (美)凯西·哈克尔 伊雷娜·克罗宁计算机12.1万字
  • 会员
    本书面向初学者介绍智能计算的相关概念、典型应用,采用研究性学习方法和P-MASE模型,按照引入问题、寻找方法、问题分析、问题求解、效果评价的模式,讲授智能计算编程、数据获取和预处理、数据可视化、预测数据的值、分类问题、聚类分析、神经网络、智能图像识别、时间序列数据的处理等知识,并给出了两个综合案例。本书深入浅出、案例丰富、可操作性强,适合作为高校智能计算相关课程的入门教材,也适合相关技术人员学习参
    李敏 赵宏 李兴娟主编计算机10.1万字
  • 会员
    本书向数据科学家、数据工程师、架构师和业务分析师展示了如何使用领先的图数据库模型TigerGraph,目标是向读者介绍图数据结构、图分析和图机器学习的概念、技术和工具。三位作者介绍了涵盖多种当代业务需求的真实使用案例。读者将探索从互联数据中获取价值的三阶段方法:连接、分析和学习。几乎每章的开头都列出了对应的三个方面的目标:学习图分析和机器学习的概念;用图分析解决特定问题;了解如何使用GSQL查询语
    (美)维克多·李等计算机12.5万字
  • 会员
    ChatGPT是当下最新、最热门的工具、效率工具,但为什么不同的人使用效果天差地别,整体上来说:一是认知上的不足;二是方法上的不足。这正是本书要解决的问题。本书不仅让读者会用ChatGPT,更尝试让读者意识到自己需要构建一个完整的学习体系,同时本书提供构建这个学习体系的方法。有了这个学习体系,才能真正用好ChatGPT,也不止能用好ChatGPT。读者能够根据自己的需求,用好ChatGPT,既不停
    常青计算机22.5万字
  • 会员
    本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神
    瞿炜 李力 杨洁计算机14.8万字
  • 人工智能(AI),尤其是生成式语言模型和生成式人工智能(AIGC)模型,正以惊人的速度改变着我们的世界。驾驭这股潮流的关键,莫过于探究自然语言处理(NLP)技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅,让其亲身感受,并动手搭建语言模型。本书主要内容包括N-Gram,词袋模型(BoW),Word2Vec(W2V),神经概率语言模型(NPLM),循环神经网络(RNN),Seq2Seq(S2
    黄佳计算机14万字
  • 在人工智能的研究中,既包括对于人类理性思维的模拟,还包括对人类感性思维的计算。本书重点讲述的文本情感分析技术就属于后者。该技术源于自然语言处理领域,但也有别于一般的自然语言处理任务。文本情感分析面向的处理对象是社交媒体中产生的用户评论文本,该文本的特点是带有大量的用户主观情感信息,因此该技术的核心是通过自动分析评论文本来进行情感的理解。文本情感分析技术已有20余年的研究历史,凝聚成了多项研究任务和
    秦兵 赵妍妍 林鸿飞 王素格 徐睿峰计算机23.3万字