標籤
fine-tuning
微調是把通用模型改造成特定任務工具的關鍵步驟,常見於新詞注入、指令對齊與多模態適配。重點不只在訓練技巧,也在初始化、資料分佈、VRAM 需求與語言覆蓋,直接影響生成品質與部署成本。
4 篇文章

技術研究/5月11日
Microsoft GoalCover 找出微調缺口
Microsoft Research 的 GoalCover 會在微調前找出資料缺口,並在 Qwen-3-14B 的金融摘要任務上提升 reward 分數。

技術研究/5月5日
5 步建出 1930 截止 LLM 測試台
用 5 個步驟建立一個 1930 截止的 LLM 測試台,驗證歷史推理與無污染泛化。

區塊鏈/4月3日
新詞初始化別再只取平均
GTI 在微調前先把新詞錨定到有意義的嵌入位置,避免平均初始化讓 token 擠成一團,進而影響生成式推薦的表現。

產業動態/3月26日
2026 年企業 AI 為何更靠 RAG
RAG 已從展示用技術走進企業預算。原因很直接:公司要的是能讀取最新內部資料、可追溯、可控權限的 AI,而不是只會背舊訓練資料的聊天模型。到了 2026 年,真正有用的重點在檢索品質、權限治理、即時資料連接與合規設計。