OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
diffusion LLM
1 篇文章
技術研究
/
4月30日
TIDE 讓跨架構蒸餾可行
TIDE 針對 diffusion LLM 的跨架構蒸餾,加入噪聲感知權重與 tokenizer 感知目標,讓 0.6B 學生模型更接近大模型表現。