標籤
AI security 聚焦模型、應用與基礎設施的風險管理,從 jailbreak、提示注入、資料外洩到自動化漏洞偵測都涵蓋在內。對開發者而言,它關乎模型上線前的評估、權限邊界與攻擊面控制。
1 篇文章
AVISE 是一個開源 AI 安全評估框架,主打模組化漏洞測試。論文用 25 個 jailbreak 測試案例與自動判定流程,驗證 9 個模型都能被攻破。