返回首頁

標籤

LLM reasoning

LLM 推理指模型在數學、物理與多步驟任務中進行規劃、驗證與錯誤修正的能力。這個主題涵蓋強化學習、pre-train space 訓練、以及用物理模擬器產生合成資料,反映模型如何從答案生成走向可檢驗的推理。

2 篇文章