標籤

AI security

AI security 聚焦模型、應用與基礎設施的風險管理，從 jailbreak、提示注入、資料外洩到自動化漏洞偵測都涵蓋在內。對開發者而言，它關乎模型上線前的評估、權限邊界與攻擊面控制。

5 篇文章

Microsoft Build 2026：先管住 AI 再談加速

Microsoft 在 Build 2026 把安全往前推，從程式碼、agents 到模型都加上治理與偵測。MDASH、Agent 365、Defender 與 GitHub 的整合，重點是把可利用漏洞、權限與資料風險一起管起來。

我把 Anthropic 的 Project Glasswing 拆成一套可直接複製的 cyber audit 工作流，讓你能拿去做模型安全測試。

這篇教你替 AI 助理建立最小權限、資料隔離、加密、稽核與高風險審批，做出可落地的安全基線。

Claude Mythos 與 GPT-5.5 的 benchmark 結果顯示，自主瀏覽器漏洞利用已是現實能力，不是未來威脅。

AVISE 是一個開源 AI 安全評估框架，主打模組化漏洞測試。論文用 25 個 jailbreak 測試案例與自動判定流程，驗證 9 個模型都能被攻破。