完结作品(1)
会员
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍
基础知识12.5万字
网站合作:傅女士 fuli.a@yuewen.com
双新用户(设备和账号都新为双新用户)下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天
Copyright (C) 2025 qbook.qq.com All Rights Reserved 上海阅文信息技术有限公司 版权所有
粤公网安备 44030002000001号 增值电信业务经营许可证:粤B2-20090059 互联网ICP备案号: 粤B2-20090059-5 沪ICP备14016804号-3 举报电话:010-59357051 营业执照
网络文化经营许可证:沪网文 (2023) 3296-228号 网络出版服务许可证:(署)网出证(沪)字第055号 互联网宗教信息服务许可证:沪(2023)0000015