深度强化学习理论与实践在线阅读

深度强化学习理论与实践

龙强 章胜编著
开会员,本书8折购 >

计算机网络计算机理论、基础知识12.5万字

更新时间:2024-12-27 22:26:05 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

龙强 章胜编著
主页

同类热门书

最新上架

  • 《重构知识:在线知识传播的疆域、结构与机制》旨在探究社会化媒体知识分享平台的知识分享行为规律、知识疆域结构特征、知识构建的动力机制以及知识普惠的技术实现。依托于当前人文社会科学新文科建设总体要求,本书基于传播学理论视野,利用信息科学计算技术,结合复杂网络分析框架,致力于解决当前传播学现实问题。具体而言,本研究旨在探究基于互联网技术的知识传播,提高知识传播效率,推进知识普惠,探究信息技术能够惠及广泛
    张伦 李永宁计算机11.1万字
  • 《剪映短视频剪辑与运营标准教程(全彩微课版)》围绕剪映短视频的创作展开,由浅入深、全面系统地对短视频的拍摄、剪辑、发布、运营等环节进行介绍,不仅能让新手制作出精彩的短视频,还可以让有一定后期剪辑基础的读者掌握更多创意效果的制作方法。《剪映短视频剪辑与运营标准教程(全彩微课版)》共9章,内容包括短视频剪辑基础知识、素材拍摄技法、短视频剪辑工具—剪映的基本功能、短视频字幕处理、音效的添加、视频转场特效
    张晓涵编著计算机6.3万字
  • 《Web3.0》针对当下火热的Web3.0话题,介绍Web3.0的相关专业知识、技术实现方法及应用前景。全书共9章,第1章介绍了Web3.0的基本知识;第2、3章介绍了Web3.0的基础技术栈和拓展技术栈;第4章介绍了Web3.0的生态构建,包括去中心化自治组织、开放式金融、加密货币、代币经济与数字市场、数字身份、创造者经济、注意力经济等;第5章阐述了Web3.0的行业应用;第6章介
    成生辉计算机13万字
  • 本书以SPSS28.0中文版为平台,以实用为原则,由浅入深,全面系统地介绍SPSS的基本功能和实际应用方法。本书涉及面广,从SPSS基本操作开始介绍,覆盖大部分常用功能和高级统计分析方法。本书共11章,内容包括SPSS基础知识、建立与整理数据、SPSS基本统计分析、假设检验、非参数检验、方差分析、相关分析、回归分析、聚类和判别分析、统计图形和SPSS数据分析综合应用。在介绍的过程中,图文并茂地对
    李同 张丽娜编著计算机10.2万字
  • 本书以网络安全为主线,对计算机网络安全所面对的各种威胁、表现形式、解决技术、应对方案等知识进行讲解,让读者全面掌握网络安全技术的应用方法和防范措施。全书共10章,内容包括计算机网络安全概述、网络模型中的安全体系、常用渗透手段及防范、病毒与木马的防范、加密与解密技术、局域网与网站安全、身份认证及访问控制、远程控制及代理技术、灾难恢复技术等。在正文讲解过程中,穿插了知识点拨注意事项动手练等板块,以助读
    钱慎一 徐明明编著计算机12.3万字
  • 《可持续设计:数字·多元·安全》是国际体验设计大会的演讲案例的论文集,汇聚了当下具有影响力的数位国内外知名企业的设计师、商业领袖、专家的大量实践案例与前沿学术观点,分享并解决了新兴领域所面临的新问题,为企业人员提供丰富的设计手段、方法与策略。
    胡晓编著计算机19.5万字
  • 本书深入剖析了互联网主导下的数字广告系统,详细阐述了如何通过数据驱动的产品技术、计算算法和动态定价模型来推进广告主的数字营销,并使其在广告领域与技术广告体系全面融合。同时,本书还探讨了数字化升级对广告业流程的影响,包括市场研究、内容匹配、定制化广告、广告竞投以及消费者沉浸式互动和用户忠诚度提升等营销职能。这些内容共同构建了数字化和智能化广告发展的综合知识体系。全书分为三篇(共10章):第一篇为基础
    顾明毅计算机30.5万字
  • 会员
    本书源于斯坦福大学的相关课程,主要介绍不确定状态下的决策算法,涵盖基本的数学问题和求解算法。本书共分为五个部分:首先解决在单个时间点上简单决策的不确定性和目标的推理问题;然后介绍随机环境中的序列决策问题;接着讨论模型不确定性,包括基于模型的方法和无模型的方法;之后讨论状态不确定性,包括精确信念状态规划、离线信念状态规划、在线信念状态规划等;最后讨论多智能体系统,涉及多智能体推理和协作智能体等。本书
    (美)米凯尔·J.科申德弗 (美)蒂姆·A.惠勒 (美)凯尔·H.雷计算机25.7万字
  • 在物联网及大数据被广泛应用的时代背景下,计算机网络在人们的日常生产生活中的应用比重越来越大,并潜移默化地改变着人们的生产生活方式。在计算机网络中,应用最广泛的是局域网。本书对局域网的组建、管理与维护进行全面剖析,向读者揭开局域网的神秘面纱,在熟悉局域网知识要点的同时,重点培养读者的动手能力和专业思维能力。全书共9章,内容包括局域网概述、局域网基础技术、局域网网络设备、无线局域网的组建、局域网规划与
    梁树军 殷知磊编著计算机10.8万字