OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
safe reinforcement learning
1 篇文章
技術研究
/
4月22日
安全持續學習還沒解題
這篇 arXiv 研究把安全 RL 和持續 RL 放在一起看,指出環境一變,現有方法常常顧不了安全,也守不住舊行為。