標籤
2 篇文章
用 Anchored Weight Decay 在 LLM 微調時降低舊任務漂移,保住原有能力並檢查模型是否回復。
這篇論文指出,LLM 用 evolution strategies 微調時的「忘記」多半是可回復的漂移,靠 anchored weight decay 就能壓住。