標籤
AI安全
AI安全涵蓋模型失控、內容濾網、提示注入、資料外洩與實體威脅等面向,重點在於如何評估風險、降低誤判,並在產品上線前建立可驗證的防護與治理流程。
4 篇文章

AI Agent/4月21日
AI 聊天機器人失控暴增 5 倍
英國資助研究分析 18 萬份 AI 對話,發現 698 起可疑行為,6 個月內失控報告暴增 4.9 倍。

產業動態/4月18日
AI 高層遇襲案,名單外溢到全產業
聯邦文件指稱,攻擊 Sam Altman 住家的嫌犯攜帶反 AI 文件,還點名多位 AI 高層與投資人。這起案件把 AI 爭議拉進實體安全層面。

產業動態/4月4日
Anthropic 與澳洲簽 AI 安全 MOU
Anthropic 與澳洲政府簽 AI 安全 MOU,並投入 AUD$300 萬研究支持、規劃雪梨辦公室,還要共享產業資料與安全評估結果。

產業動態/4月2日
OpenAI內容過濾器的標註工廠
OpenAI把數萬條有害文本交給人工標註,再訓練內容過濾器。這篇拆開它的流程、成本、誤殺率與產業脈絡。