《强化学习精要:核心算法与TensorFlow 实现》用通俗幽默的语言深入浅出地介绍了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程,到各种复杂的强化学习算法,读者都可以从本书中学习到。本书除了介绍这些算法的原理,还深入分析了算法之间的内在联系,可以帮助读者举一反三,掌握算法精髓。书中介绍的代码可以帮助读者快速将算法应用到实践中。 《强化学习精要:核心算法与TensorFlow 实现》内容翔实,语言简洁易懂,既适合零基础的人员入门学习,也适合相关科研人员研究参考。

作者

冯超,毕业于中国科学院大学,滴滴出行AI Labs时空数据组专家算法工程师,曾任小猿搜题算法负责人之一。自2016年起在知乎开设技术专栏《无痛的机器学习》,发表与深度学习和强化学习相关的文章,文章以轻松幽默的语言、细致深入的分析为特点,得到了广泛的关注。曾撰写深度学习进阶领域口碑技术书《深度学习轻松学:核心算法与视觉实践》。

查看全部
目录

前言

第一部分 强化学习入门与基础知识

1 引言

2 数学与机器学习基础

3 优化算法

4 TensorFlow入门

5 Gym与Baselines

6 强化学习基本算法

第二部分 最优价值算法

7 Q-Learning基础

8 DQN的改进算法

第三部分 基于策略梯度的算法

9 基于策略梯度的算法

10 使策略单调提升的优化算法

11 Off-Policy策略梯度法

第四部分 其他强化学习算法

12 稀疏回报的求解方法

13 Model-based方法

第五部分 反向强化学习

14 反向强化学习入门

15反向强化学习算法2.0

查看全部
书评
查看更多
请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400