標籤
大型語言模型(LLM)正從聊天工具走向基礎AI層,牽動模型訓練、推理成本、能力評測、提示工程與可解釋性等議題。這個主題也涵蓋模型安全、企業合作與部署策略,影響產品設計與算力布局。
2 篇文章
這篇論文在談怎麼把 LLM 當成訓練時的輔助訊號,選擇性地做正則化,提升推薦模型,但不必重寫整套推薦系統。
AE-LLM 主打大型語言模型的自適應效率最佳化,想在不固定耗算力的前提下,讓模型依工作負載調整效率;但摘要沒有公開完整 benchmark 細節。