首页/强化学习reward曲线震荡是怎么回事呢?/
共3个回答0条评论

强化学习reward曲线震荡是怎么回事呢?

使用了SAC算法,曲线在后期达到较优值后,突然发生骤降。调整学习率后发现影响不大,甚至难以收敛,请问应该如何调整?如果需要调整神经网络层数和单元数,应该调整策略...

显示全部
南京信息大学bb
排序方式:被封时间
时间排序由新到旧

1

  • 1
  • 跳至
Copyright © 2022 GreatFire.org