標籤
2 篇文章
RecursiveMAS 把多代理協作改成潛在空間的遞迴計算,主打更少 token、更快推論,摘要宣稱平均準確率提升 8.3%。
Parallel-SFT 用多語言等價程式做 SFT,想讓後續 code RL 的零樣本跨語言轉移更穩,特別是低資源程式語言。