机读格式显示(MARC)
- 000 01122nam0 2200253 450
- 010 __ |a 978-7-5641-8321-9 |d CNY109.00
- 100 __ |a 20190528e2019 em y0chiy50 ea
- 200 1_ |a 深度强化学习实践 |9 shen du qiang hua xue xi shi jian |d Deep reinforcement learning hands-on |f Maxim Lapan著 |z eng
- 210 __ |a 南京 |c 东南大学出版社 |d 2019
- 215 __ |a 16,523页 |c 图 |d 24cm
- 330 __ |a 本书是关于最新DL工具及其局限性的全面指南。在应用于真实环境之前,你得评估包括交叉熵和策略梯度在内的多种算法。试试Atari的虚拟游戏和像Connect4这样的家庭最爱。本书介绍了RL的基础知识,为你提供了编写智能学习代理所需的原理,用以承担一系列艰巨的实际任务。了解如何在“网格世界”环境中实现Q-learning,教你的代理购买和交易股票,发现自然语言模型如何推动了聊天机器人的火爆。
- 510 1_ |a Deep reinforcement learning hands-on |z eng
- 606 0_ |a 机器学习 |x 算法 |j 英文
- 701 _0 |c (俄) |a 拉潘 |9 la pan |c (Lapan, Maxim) |4 著
- 801 _0 |a CN |b ZPHC |c 20190528
- 905 __ |a ZPHC |d TP181/23