為什麼華府低估了 AI 安全模型的風險

OraCore Editors

返回首頁

[RSCH] 2026年5月25日3 分鐘閱讀OraCore 編輯部

為什麼華府低估了 AI 安全模型的風險

華府把 AI 安全模型當成政策邊角料，這是錯的。像 Anthropic 的 Mythos 這類系統已經能大規模找出高嚴重度漏洞，代表攻防能力正在被模型化與放大。

雙重用途 AI安全模型 Anthropic 漏洞發現 Mythos

分享 LinkedIn

華府低估了 AI 安全模型的風險，因為它們已經把漏洞發現變成可大規模複製的能力。

華府把 AI 安全模型當成政策邊角料，但它們其實已經在放大攻擊能力。Anthropic 表示，Mythos 已經找出數千個高嚴重度漏洞，涵蓋所有主流作業系統與瀏覽器，這不是實驗室花招，而是能力結構改變的訊號。下一代模型不只會寫字、寫程式，還會壓縮從發現缺陷到利用缺陷的時間。對監管者、企業與資安團隊來說，這代表「AI 安全」不再只是聊天機器人胡說八道的問題，而是基礎設施風險。

第一個論點：漏洞發現正在被模型工業化

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

華府應該重視這件事，第一個原因很直接：AI 安全模型正在把找漏洞變成可擴張的流程。人類研究員可能花上數天或數週追一條邏輯鏈，但能掃描、推理、反覆試驗的模型，卻能以機器速度在大規模程式碼庫中產生候選結果。Anthropic 對 Mythos 的描述是「數千個高嚴重度漏洞」，這已經不是效率提升，而是量級變化。

當產出單位變成「數千」，問題就不再是模型能不能幫助防守，而是攻擊者會不會先拿到同樣的工具。資安產業早就依賴自動化做掃描與分流，因為規模本來就比英雄式救火重要。差別在於，前沿模型現在能把模式辨識、程式理解與快速迭代整合在同一個系統裡。這意味著優勢會流向能跑更多搜尋、測更多假設、把更多發現串成利用路徑的一方。

第二個論點：政策真正面對的是雙重用途，不是炒作

第二個原因是，這種能力天生就是雙重用途。能找出瀏覽器、作業系統或應用堆疊弱點的模型，也能幫攻擊者排序目標、修正 payload、加速利用。這正是 Mythos 這類系統之所以有政治意義的地方。政策制定者很容易把模型展示視為廠商宣傳，但當一個系統被描述為能在核心基礎設施上找出高嚴重度漏洞時，它就不再只是產品簡報，而是戰略能力。

我們以前也見過這種模式：通用技術的第一個有用部署，往往也是第一個危險部署。真正的政策錯誤，是只在事後處理看得見的濫用。這對一種可被複製、可被微調、可被包進 agent 工作流的能力來說太慢了。華府應該盯的是會產生槓桿的環節：漏洞研究的存取權、模型對真實系統的評估方式，以及那些能把「找漏洞」一路推進到「產生 exploit」的部署治理。

反方可能怎麼說：防禦收益可能大於攻擊風險

最強的反方論點是，像 Mythos 這樣的模型，最終會先強化防禦，而不是攻擊。這個說法不是空話。大多數組織資源不足，大多數軟體都有缺陷，任何能更快找出漏洞的工具，都有機會降低暴露面。若模型真的能在瀏覽器與作業系統中發現問題，它也能加速修補、加固與程式碼審查，這些都是人類難以追上的工作量。

但這個論點只能說明「值得使用」，不能推出「可以放心擴散」。同一個模型能幫大型企業資安團隊，也能幫犯罪集團、國家級操作員或漏洞 брокер 一樣的灰色市場玩家。政策上真正該做的，不是阻止防禦用途，而是要求明確的控制邊界：把防禦性評估和開放式攻擊協助分開，並在大規模部署前做嚴格稽核。限制很清楚，想拿到收益，就得接受隔離與監管。

你能做什麼

工程師、PM 與創辦人都該把 AI 安全模型當成有爆炸半徑的基礎設施，而不是一則研究新聞。若你要導入，先定義允許的工作流，把高風險動作全數記錄，任何可能串成 exploit chain 的步驟都要保留人工核准。若你要採購，別只看 benchmark，還要問供應商能不能提供評測結果、存取控制與濫用監測。若你在華府，現在就該為雙重用途寫政策，別等市場把一個能比多數團隊更快找出數千個嚴重漏洞的模型，正常化成日常工具。

// 相關文章

為什麼華府低估了 AI 安全模型的風險

第一個論點：漏洞發現正在被模型工業化

訂閱 AI 趨勢週報

第二個論點：政策真正面對的是雙重用途，不是炒作

反方可能怎麼說：防禦收益可能大於攻擊風險

你能做什麼

CRDT 讓副本不用鎖也能同步

後決定性分散系：自治基礎設施新框架

用因果法量化任務可學性

RL 先接管再放手

OmniGameArena 讓 VLM 遊戲代理更好比

TurboQuant 在 Google 測試中省下 6x KV 快取