机读格式显示(MARC)
- 010 __ |a 978-7-302-62554-4 |d CNY89.00
- 100 __ |a 20230410d2023 em y0chiy50 ea
- 200 1_ |a 深度强化学习理论与实践 |A Shen Du Qiang Hua Xue Xi Li Lun Yu Shi Jian |f 龙强, 章胜编著
- 210 __ |a 北京 |c 清华大学出版社 |d 2023
- 215 __ |a 355页 |c 图 |d 24cm
- 225 2_ |a 计算机技术开发与应用丛书 |A Ji Suan Ji Ji Shu Kai Fa Yu Ying Yong Cong Shu
- 330 __ |a 本书核心内容分为三部分,第一部分为经典强化学习,包括第2-4章,内容有动态规划法、蒙特卡罗法、时序差分法;第二部分为深度强化学习,包括第6-8章,内容有值函数近似算法、策略梯度算法、策略梯度法进阶;第三部分介绍深度强化学习的经典应用案例——AlphaGo系列算法。
- 410 _0 |1 2001 |a 计算机技术开发与应用丛书
- 606 0_ |a 机器学习 |A Ji Qi Xue Xi |x 研究
- 701 _0 |a 龙强 |A Long Qiang |4 编著
- 701 _0 |a 章胜 |A Zhang Sheng |4 编著
- 801 _0 |a CN |b ZPHC |c 20230410
- 905 __ |a ZPHC |d TP181/123