机读格式显示(MARC)

000 01122nam0 2200253 450

001 0000694582

005 20190904163800.0

010 __ |a 978-7-5641-8321-9 |d CNY109.00

100 __ |a 20190528e2019 em y0chiy50 ea

101 0_ |a eng |g chi

102 __ |a CN |b 320000

105 __ |a a z 001yy

106 __ |a r

200 1_ |a 深度强化学习实践 |9 shen du qiang hua xue xi shi jian |d Deep reinforcement learning hands-on |f Maxim Lapan著 |z eng

205 __ |a 影印版

210 __ |a 南京 |c 东南大学出版社 |d 2019

215 __ |a 16,523页 |c 图 |d 24cm

330 __ |a 本书是关于最新DL工具及其局限性的全面指南。在应用于真实环境之前，你得评估包括交叉熵和策略梯度在内的多种算法。试试Atari的虚拟游戏和像Connect4这样的家庭最爱。本书介绍了RL的基础知识，为你提供了编写智能学习代理所需的原理，用以承担一系列艰巨的实际任务。了解如何在“网格世界”环境中实现Q-learning，教你的代理购买和交易股票，发现自然语言模型如何推动了聊天机器人的火爆。

510 1_ |a Deep reinforcement learning hands-on |z eng

606 0_ |a 机器学习 |x 算法 |j 英文

690 __ |a TP181 |v 5

701 _0 |c (俄) |a 拉潘 |9 la pan |c (Lapan, Maxim) |4 著

801 _0 |a CN |b ZPHC |c 20190528

905 __ |a ZPHC |d TP181/23