强化学习:原理与Python实现在线阅读
会员

强化学习:原理与Python实现

肖智清
开会员,本书免费读 >

计算机网络编程语言与程序设计12.2万字

更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结

立即阅读
加书架
下载
听书

书籍简介

全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理
    肖智清人工智能17.2万字

同类热门书

最新上架

  • 会员
    本书系统介绍了数据结构与算法的基本概念和相关知识,既注重理论,又注重算法设计,更突出代码实现,是一本着眼于数据结构与基本算法的教学实践的教材。本书介绍了线性表、队列与栈、树与优先级队列、集合与静态查找表、动态查找表、排序、外部查找与排序、图、最小生成树与最短路径、算法设计思想等内容,将数据结构的理论与真实应用的实践紧密结合,从各种数据结构的代码实现到火车票管理系统的代码实现,手把手地指导读者学习数
    俞勇 翁惠玉 傅凌玥 周聪计算机15.5万字
  • 会员
    本书在编写过程中坚持理论性和实用性相结合,力求与互联网行业技术发展同步,着重提高读者Web交互界面设计和制作的能力。全书共9章,内容包括交互界面设计概述、Web交互界面设计基础、Web交互界面技术概述、HTML5和CSS3基础、Web交互界面设计案例、HTML5和CSS3进阶、JavaScript基础、Web交互界面开发、综合案例:网站交互界面开发。本书系统地介绍Web交互界面设计与制作的全过程,
    张晓颖 石磊主编计算机11.2万字
  • 会员
    本书涵盖了SpringCloudAlibaba框架的八大核心技术主题,分别是注册中心、远程调用、负载均衡、配置中心、服务网关、消息通信、分布式事务和服务可用性。并且,通过一个系统性的项目案例,讲解企业级微服务系统开发的工程实践。其间提供大量的设计图例和示例代码,更提供配套的视频教程。对于每个主题,书中采用“技术概念和特性→框架使用方法→项目案例实战→核心原理和源码剖析”的方式讲解,使读者递进式
    郑天民计算机12.9万字
  • 会员
    本书主要讲述了游戏设计中最基础的方法论,并针对每则理论提供相应的设计实例进行说明。就布局谋篇而言,全书依序涵盖了一个游戏策划从未入行到需要负责某个模块所需掌握的主要知识方法。第一部分的主题是游戏通识知识,即关于游戏行业这个整体的基础知识。第一章对游戏的本质进行剖析,着重从用户、反馈、体验等角度展开论述。第二章对游戏团队的游戏制作过程进行说明。第三章对游戏的未来发展趋势作出分析。第二部分讲述了游戏策
    李宇编著计算机17.4万字
  • 会员
    本书为软件测试初学者量身打造,从零开始,覆盖软件公司招聘的基本要求。全书分为16章,涵盖了软件测试的核心概念、功能测试方法、Linux基础知识、MySQL数据库管理、Web自动化测试框架、HTTP接口测试、Charles抓包工具的使用、Python接口自动化测试、AI赋能软件测试,以及如何制作求职简历等内容。此外,本书还提供精选面试题及参考答案,助力读者通过面试。全书知识体系循序渐进,紧跟读者需求
    江楚编著计算机19.1万字
  • 会员
    这是一本全面讲解RAG技术原理、实战应用与系统构建的著作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。无论你是深度学习初学者,还是希望提升RAG应用技能的开发者,本书都将为你提供宝贵的参
    汪鹏 谷清水 卞龙鹏计算机8.4万字
  • 会员
    本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入了大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计9章。第1章讲解C++基础知识,涉及语法、数组、字符串、结构体和指针;第2章带读者感受算法之美,涉及算法复杂度、函数和递归;第3章讲解线性表的应用,涉及顺序表、链表、栈和队列,以及STL中的常用函数和容器;第4章讲解树的应用,涉及树、二叉树、二叉树遍历、哈夫曼树和二叉搜
    陈小玉计算机9万字
  • 会员
    这是一本可帮助读者迅速掌握Drools的精髓并将其应用于实际项目,为企业构建智能决策系统提供可用经验和方法的专业技术书。全书以作者15年实战经验为基础,以作者在支付系统中的风控、反洗钱业务板块实际运用Drools规则引擎并构建一套完整的规则引擎体系为基础,以CSDN上超36万阅读量的规则引擎专栏文章为参考,以近3.7万人购买的收费视频课程为蓝本,从入门知识、底层原理、一线架构到实战项目深入解读运用
    朱智胜计算机10.9万字
  • 会员
    基于当前Web3世界的快速发展,零知识证明在落地应用方面取得了快速进展。本书从技术原理和相关具体工程实现的角度对其进行介绍。本书第1章从总体上回顾了Web3的发展,以及当前的表现形态,第2章和第3章从最简洁的数学层面向读者介绍了零知识证明是什么,以及如何构建零知识证明。第4章从技术层面介绍了Web3世界中零知识证明的主流实现方案,第5章从应用层面介绍了零知识证明在Web3世界中的一些典型
    高承实主编计算机21万字

同类书籍最近更新

  • 会员
    本书注重理论与实践紧密结合,系统介绍算法设计方法、分析技巧和C++编程实战。作者本着“易理解,重实用”的指导思想,结合多年的教学经验,以算法设计策略为主线,沿着“算法思想—算法设计—构造实例—算法描述—算法分析—C++实战”的思路组织学习内容,共包括算法及基础知识、贪心法、分治法、动态规划、搜索法、随机化算法、线性规划问题与网络流、数论算法及计算几何算法和NP完全理论等9章内容。
    王秋芬 赵刚彬编著程序设计16.9万字