新聞趨勢比較排行學習 Claude Code

新聞趨勢比較排行學習 Claude Code

標籤

DPO

2 篇文章

5 步建出 1930 截止 LLM 測試台

技術研究/5月5日

5 步建出 1930 截止 LLM 測試台

用 5 個步驟建立一個 1930 截止的 LLM 測試台，驗證歷史推理與無污染泛化。

用 rubric 讓視覺偏好訓練更精準

技術研究/4月15日

用 rubric 讓視覺偏好訓練更精準

rDPO 用每個圖文任務的專屬 rubric 取代粗粒度偏好訊號，讓視覺偏好最佳化更細緻，並在過濾與 benchmark 上帶來提升。

內容

新聞
AI 趨勢總覽
LLM 模型比較 2026
AI 排行與熱門榜單

分類

模型發布
AI Agent
技術研究
區塊鏈

工具

AI 術語表
LLM API 費用計算機
AI 發展時間軸 2024–2026
開發者提示詞庫

關於

編輯團隊
OG 預覽
RSS Feed

© 2026 OraCore.dev

v4.37.3—