標籤
2 篇文章
OpenAI 把 GPT-5.5-Cyber 做成受限的實用資安工具,這比追求更大範圍的自治更正確,也更可能先做出真正有用的產品。
Anthropic 傳出 Mythos 測試分數高於 Claude Opus 4.6。若 SWE-bench、推理與資安數字屬實,開發者會感受到明顯差距。