欢迎加入51折客联盟
51折客联盟
  • 搜淘宝
  • 搜京东
  • 搜拼多多
微信扫一扫

关注微信公众号
查券更方便


深度强化学习 理解强化学习的基本设计 基于策略迭代方法求解网格世界的代码 机策略梯度与REINFORCE算法 算法中减少方差的方法
深度强化学习 理解强化学习的基本设计 基于策略迭代方法求解网格世界的代码 机策略梯度与REINFORCE算法 算法中减少方差的方法
73.3元¥73.3预计返¥ 0
活动结束时间:01-01 08:00 累计销量 :

手机淘宝扫码领券购买

  • 商品详情