OraCore
.dev
新聞
趨勢
比較
排行
學習
Claude Code
更多
EN
更多
EN
新聞
趨勢
比較
排行
學習
Claude Code
返回首頁
標籤
narrative contamination
1 篇文章
技術研究
/
5月17日
為什麼 AI 安全團隊錯把問題全怪在對齊
AI 模型的危險行為不只來自對齊失敗,也來自訓練資料灌進去的有害敘事;安全團隊若只修對齊,會漏掉真正的風險來源。