会员
强化学习:原理与Python实现
更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结
书籍简介
全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
- 会员本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理人工智能17.2万字
同类热门书
最新上架
- 会员本书系统介绍了数据结构与算法的基本概念和相关知识,既注重理论,又注重算法设计,更突出代码实现,是一本着眼于数据结构与基本算法的教学实践的教材。本书介绍了线性表、队列与栈、树与优先级队列、集合与静态查找表、动态查找表、排序、外部查找与排序、图、最小生成树与最短路径、算法设计思想等内容,将数据结构的理论与真实应用的实践紧密结合,从各种数据结构的代码实现到火车票管理系统的代码实现,手把手地指导读者学习数计算机15.5万字
- 会员本书在编写过程中坚持理论性和实用性相结合,力求与互联网行业技术发展同步,着重提高读者Web交互界面设计和制作的能力。全书共9章,内容包括交互界面设计概述、Web交互界面设计基础、Web交互界面技术概述、HTML5和CSS3基础、Web交互界面设计案例、HTML5和CSS3进阶、JavaScript基础、Web交互界面开发、综合案例:网站交互界面开发。本书系统地介绍Web交互界面设计与制作的全过程,计算机11.2万字
- 会员本书涵盖了SpringCloudAlibaba框架的八大核心技术主题,分别是注册中心、远程调用、负载均衡、配置中心、服务网关、消息通信、分布式事务和服务可用性。并且,通过一个系统性的项目案例,讲解企业级微服务系统开发的工程实践。其间提供大量的设计图例和示例代码,更提供配套的视频教程。对于每个主题,书中采用“技术概念和特性→框架使用方法→项目案例实战→核心原理和源码剖析”的方式讲解,使读者递进式计算机12.9万字
- 会员本书为软件测试初学者量身打造,从零开始,覆盖软件公司招聘的基本要求。全书分为16章,涵盖了软件测试的核心概念、功能测试方法、Linux基础知识、MySQL数据库管理、Web自动化测试框架、HTTP接口测试、Charles抓包工具的使用、Python接口自动化测试、AI赋能软件测试,以及如何制作求职简历等内容。此外,本书还提供精选面试题及参考答案,助力读者通过面试。全书知识体系循序渐进,紧跟读者需求计算机19.1万字
- 会员这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。无论你是深度学习初学者,还是希望提升RAG应用技能的开发者,本书都将为你提供宝贵的参计算机8.4万字
- 会员本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入了大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计9章。第1章讲解C++基础知识,涉及语法、数组、字符串、结构体和指针;第2章带读者感受算法之美,涉及算法复杂度、函数和递归;第3章讲解线性表的应用,涉及顺序表、链表、栈和队列,以及STL中的常用函数和容器;第4章讲解树的应用,涉及树、二叉树、二叉树遍历、哈夫曼树和二叉搜计算机9万字
- 会员这是一本可帮助读者迅速掌握Drools的精髓并将其应用于实际项目,为企业构建智能决策系统提供可用经验和方法的专业技术书。全书以作者15年实战经验为基础,以作者在支付系统中的风控、反洗钱业务板块实际运用Drools规则引擎并构建一套完整的规则引擎体系为基础,以CSDN上超36万阅读量的规则引擎专栏文章为参考,以近3.7万人购买的收费视频课程为蓝本,从入门知识、底层原理、一线架构到实战项目深入解读运用计算机10.9万字
- 会员基于当前Web3世界的快速发展,零知识证明在落地应用方面取得了快速进展。本书从技术原理和相关具体工程实现的角度对其进行介绍。本书第1章从总体上回顾了Web3的发展,以及当前的表现形态,第2章和第3章从最简洁的数学层面向读者介绍了零知识证明是什么,以及如何构建零知识证明。第4章从技术层面介绍了Web3世界中零知识证明的主流实现方案,第5章从应用层面介绍了零知识证明在Web3世界中的一些典型计算机21万字
同类书籍最近更新
- 会员本书注重理论与实践紧密结合,系统介绍算法设计方法、分析技巧和C++编程实战。作者本着“易理解,重实用”的指导思想,结合多年的教学经验,以算法设计策略为主线,沿着“算法思想—算法设计—构造实例—算法描述—算法分析—C++实战”的思路组织学习内容,共包括算法及基础知识、贪心法、分治法、动态规划、搜索法、随机化算法、线性规划问题与网络流、数论算法及计算几何算法和NP完全理论等9章内容。程序设计16.9万字