[RSCH] 3 分鐘閱讀OraCore 編輯部

為什麼華府低估了 AI 安全模型的風險

華府把 AI 安全模型當成政策邊角料,這是錯的。像 Anthropic 的 Mythos 這類系統已經能大規模找出高嚴重度漏洞,代表攻防能力正在被模型化與放大。

分享 LinkedIn
為什麼華府低估了 AI 安全模型的風險

華府低估了 AI 安全模型的風險,因為它們已經把漏洞發現變成可大規模複製的能力。

華府把 AI 安全模型當成政策邊角料,但它們其實已經在放大攻擊能力。Anthropic 表示,Mythos 已經找出數千個高嚴重度漏洞,涵蓋所有主流作業系統與瀏覽器,這不是實驗室花招,而是能力結構改變的訊號。下一代模型不只會寫字、寫程式,還會壓縮從發現缺陷到利用缺陷的時間。對監管者、企業與資安團隊來說,這代表「AI 安全」不再只是聊天機器人胡說八道的問題,而是基礎設施風險。

第一個論點:漏洞發現正在被模型工業化

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

華府應該重視這件事,第一個原因很直接:AI 安全模型正在把找漏洞變成可擴張的流程。人類研究員可能花上數天或數週追一條邏輯鏈,但能掃描、推理、反覆試驗的模型,卻能以機器速度在大規模程式碼庫中產生候選結果。Anthropic 對 Mythos 的描述是「數千個高嚴重度漏洞」,這已經不是效率提升,而是量級變化。

為什麼華府低估了 AI 安全模型的風險

當產出單位變成「數千」,問題就不再是模型能不能幫助防守,而是攻擊者會不會先拿到同樣的工具。資安產業早就依賴自動化做掃描與分流,因為規模本來就比英雄式救火重要。差別在於,前沿模型現在能把模式辨識、程式理解與快速迭代整合在同一個系統裡。這意味著優勢會流向能跑更多搜尋、測更多假設、把更多發現串成利用路徑的一方。

第二個論點:政策真正面對的是雙重用途,不是炒作

第二個原因是,這種能力天生就是雙重用途。能找出瀏覽器、作業系統或應用堆疊弱點的模型,也能幫攻擊者排序目標、修正 payload、加速利用。這正是 Mythos 這類系統之所以有政治意義的地方。政策制定者很容易把模型展示視為廠商宣傳,但當一個系統被描述為能在核心基礎設施上找出高嚴重度漏洞時,它就不再只是產品簡報,而是戰略能力。

我們以前也見過這種模式:通用技術的第一個有用部署,往往也是第一個危險部署。真正的政策錯誤,是只在事後處理看得見的濫用。這對一種可被複製、可被微調、可被包進 agent 工作流的能力來說太慢了。華府應該盯的是會產生槓桿的環節:漏洞研究的存取權、模型對真實系統的評估方式,以及那些能把「找漏洞」一路推進到「產生 exploit」的部署治理。

反方可能怎麼說:防禦收益可能大於攻擊風險

最強的反方論點是,像 Mythos 這樣的模型,最終會先強化防禦,而不是攻擊。這個說法不是空話。大多數組織資源不足,大多數軟體都有缺陷,任何能更快找出漏洞的工具,都有機會降低暴露面。若模型真的能在瀏覽器與作業系統中發現問題,它也能加速修補、加固與程式碼審查,這些都是人類難以追上的工作量。

為什麼華府低估了 AI 安全模型的風險

但這個論點只能說明「值得使用」,不能推出「可以放心擴散」。同一個模型能幫大型企業資安團隊,也能幫犯罪集團、國家級操作員或漏洞 брокер 一樣的灰色市場玩家。政策上真正該做的,不是阻止防禦用途,而是要求明確的控制邊界:把防禦性評估和開放式攻擊協助分開,並在大規模部署前做嚴格稽核。限制很清楚,想拿到收益,就得接受隔離與監管。

你能做什麼

工程師、PM 與創辦人都該把 AI 安全模型當成有爆炸半徑的基礎設施,而不是一則研究新聞。若你要導入,先定義允許的工作流,把高風險動作全數記錄,任何可能串成 exploit chain 的步驟都要保留人工核准。若你要採購,別只看 benchmark,還要問供應商能不能提供評測結果、存取控制與濫用監測。若你在華府,現在就該為雙重用途寫政策,別等市場把一個能比多數團隊更快找出數千個嚴重漏洞的模型,正常化成日常工具。