[IND] 3 分鐘閱讀OraCore 編輯部

5 個 AI 模型變得更危險的原因

5 種前沿 AI 變得更難釋出的原因:可信存取、雙重用途、政府監管與開源擴散。

分享 LinkedIn
5 個 AI 模型變得更危險的原因

這篇整理 5 個前沿 AI 變得更難公開釋出的原因,幫你判斷哪些風險正在改變模型上線方式。

項目存取模式風險焦點
GPT-Rosalind可信存取計畫生物與化學濫用
Claude Mythos合格客戶網路與雙重用途任務
GPT-5.4-Cyber限制釋出資安濫用
開源前沿模型公開下載能力快速擴散

1. 可信存取正在變成高階模型的常態

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

OpenAIAnthropic 不再把每一個前沿模型都當成公開發表。GPT-Rosalind 和 Claude Mythos 都沒有直接開放給一般使用者,而是只給審核過的用戶、合作夥伴或內部控管完善的組織。

5 個 AI 模型變得更危險的原因

這會改變產品設計本身。從大規模消費級上線,轉向審批門檻、使用審查與夥伴限定存取,決定誰能先接觸最強系統。

  • OpenAI:GPT-Rosalind 採可信存取計畫
  • Anthropic:Claude Mythos 只給合格客戶
  • 存取審核可包含內控與合作夥伴篩選

2. 生物與化學已成為釋出風險類別

文章最清楚的例子是生命科學。GPT-Rosalind 主打化學、生物與實驗設計,但這些能力也可能被用來協助危險的生物工作。

這就是雙重用途問題。合法研究與有害實驗在模型層面常常很像,讓政策難寫、也更難執行。

  • 可用於:藥物發現、實驗規劃、研究支援
  • 風險在於:病原體優化、有害實驗設計
  • 現況:部分系統會擋下高風險病毒突變問題

3. 資安工具更容易衡量,也更容易限制

網路安全是另一個推動限制的主要領域。Anthropic 曾讓 Claude Mythos 服務政府單位與企業,用來找漏洞與修補系統,但同樣能力也可能幫助攻擊者探測弱點。

5 個 AI 模型變得更危險的原因

和生物風險相比,資安風險更具體。比起預測一條可能很久才會發生的生物傷害鏈,判斷模型能不能破解現有系統,通常更直接。

資安雙重用途例子:
- 找出軟體漏洞
- 產生利用思路
- 協助防禦者更快修補
- 幫助攻擊者做偵察

4. 政府監管正在從概念變成壓力

文章顯示,一個越來越強的主張是:高風險 AI 的存取,不該只由私營公司決定。美國國會議員 Mark DeSaulnier 認為聯邦政府有角色,ControlAI 的 Connor Leahy 則把 AI 風險決策比作政府管制有毒污染。

這場爭論已經不再抽象。Anthropic 與白宮的關係據稱有所改善,NSA 也開始使用 Claude Mythos,顯示這些選擇正在變成公共政策的一部分。

  • 支持監管者希望有外部規則決定釋出門檻
  • 公司則主張可信存取可兼顧風險與使用
  • 政策爭議也包含「誰算合格研究者」

5. 開源模型可能還是會把能力擴散出去

就算公司把最強系統鎖起來,開源模型仍可能快速追上。Epoch AI 估計,開源模型只比領先的專有模型落後約 3 到 7 個月,代表相近能力可能很快就會出現在公開世界。

這帶來難解的取捨。限制存取也許能先放慢擴散,但如果開源持續進步,能力最後還是可能脫離單一公司的控制。

  • 開源模型可被自由下載與本地執行
  • 與專有模型的落差:約 3 到 7 個月
  • 風險:更快擴散到攻擊者,且公司控制更少

怎麼挑

如果你最在意短期政策,重點是可信存取與政府監管;如果你關心技術風險,先看資安與生物這兩個領域,因為它們已經直接影響模型能否對外開放。

如果你想判斷前沿 AI 接下來會往哪裡走,就盯住開源擴散。就算有更多限制,這篇文章的核心提醒仍是:最新模型未必能長期維持私有,誰來控制它們的爭論只會更大。