標籤
Test-time training 指模型在推論階段也能依輸入資料做小幅更新,常見於長上下文 LLM、4D 重建與持續感知任務,用來減少遺忘、提升即時適應與跨 chunk 推理穩定性。
2 篇文章
FSM 用彈性 test-time training 穩住長序列 4D 重建的記憶更新,降低遺忘與記憶瓶頸,讓多 chunk 推論更可行。
這篇論文把 test-time training 做成可直接嵌入 LLM 的推理更新機制,讓模型在長上下文下用 fast weights 即時適應,不必整個重訓。