OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
LLM training
1 篇文章
技術研究
/
5月25日
香農尺度律解釋 LLM 過訓練
這篇論文把 LLM 訓練看成帶雜訊的資訊傳輸,說明為何算力增加時,模型在噪聲下反而可能變差。