OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
rubric
1 篇文章
技術研究
/
4月15日
用 rubric 讓視覺偏好訓練更精準
rDPO 用每個圖文任務的專屬 rubric 取代粗粒度偏好訊號,讓視覺偏好最佳化更細緻,並在過濾與 benchmark 上帶來提升。