OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
sharpness dimension
1 篇文章
技術研究
/
4月22日
邊界不穩定為何反而更會泛化
這篇論文把高學習率下的混沌訓練,連到泛化能力,並用 Hessian 光譜定義新的 sharpness dimension。