《强化学习精要:核心算法与TensorFlow 实现》用通俗幽默的语言深入浅出地介绍了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程,到各种复杂的强化学习算法,读者都可以从本书中学习到。本书除了介绍这些算法的原理,还深入分析了算法之间的内在联系,可以帮助读者举一反三,掌握算法精髓。书中介绍的代码可以帮助读者快速将算法应用到实践中。 《强化学习精要:核心算法与TensorFlow 实现》内容翔实,语言简洁易懂,既适合零基础的人员入门学习,也适合相关科研人员研究参考。
前言
第一部分 强化学习入门与基础知识
1 引言
2 数学与机器学习基础
3 优化算法
4 TensorFlow入门
5 Gym与Baselines
6 强化学习基本算法
第二部分 最优价值算法
7 Q-Learning基础
8 DQN的改进算法
第三部分 基于策略梯度的算法
9 基于策略梯度的算法
10 使策略单调提升的优化算法
11 Off-Policy策略梯度法
第四部分 其他强化学习算法
12 稀疏回报的求解方法
13 Model-based方法
第五部分 反向强化学习
14 反向强化学习入门
15反向强化学习算法2.0

