机读格式显示(MARC)

000 01089nam 2200277 450

001 0001232327

005 20230504124800.0

010 __ |a 978-7-302-62554-4 |d CNY89.00

100 __ |a 20230410d2023 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a 深度强化学习理论与实践 |A Shen Du Qiang Hua Xue Xi Li Lun Yu Shi Jian |f 龙强, 章胜编著

210 __ |a 北京 |c 清华大学出版社 |d 2023

215 __ |a 355页 |c 图 |d 24cm

225 2_ |a 计算机技术开发与应用丛书 |A Ji Suan Ji Ji Shu Kai Fa Yu Ying Yong Cong Shu

320 __ |a 有书目

330 __ |a 本书核心内容分为三部分，第一部分为经典强化学习，包括第2-4章，内容有动态规划法、蒙特卡罗法、时序差分法；第二部分为深度强化学习，包括第6-8章，内容有值函数近似算法、策略梯度算法、策略梯度法进阶；第三部分介绍深度强化学习的经典应用案例——AlphaGo系列算法。

410 _0 |1 2001 |a 计算机技术开发与应用丛书

606 0_ |a 机器学习 |A Ji Qi Xue Xi |x 研究

690 __ |a TP181 |v 5

701 _0 |a 龙强 |A Long Qiang |4 编著

701 _0 |a 章胜 |A Zhang Sheng |4 编著

801 _0 |a CN |b ZPHC |c 20230410

905 __ |a ZPHC |d TP181/123