返回首頁

標籤

generalization

泛化描述模型在未見資料、不同分佈或更長推理條件下仍能維持表現的能力。這個主題常連到邊界穩定性、Hessian 光譜、訓練動態,以及 LLM 在換地圖、拉長序列時的失效模式。

2 篇文章