Blackwell 會贏,因為 agentic AI 需要全堆疊基礎設施
Blackwell 是 agentic AI 最值得押注的基礎設施,因為它在可量測的規模效率上,已經把晶片競爭升級成整套平台競爭。

Blackwell 是 agentic AI 最值得押注的基礎設施,因為它在可量測的規模效率上,已經把晶片競爭升級成整套平台競爭。
NVIDIA 的 Blackwell Ultra NVL72 不只是跑出新基準的漂亮數字,而是第一次把 agentic AI 的需求,轉成可量測的基礎設施優勢;在 Artificial Analysis 的 AgentPerf 結果裡,它對 Hopper 的效率提升,最高可達每兆瓦 20 倍的 agents 數量。
第一個論點
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
agentic AI 不是單次問答,而是把模型呼叫、工具呼叫、檔案讀取、程式修改與重試串成長鏈。這代表延遲不是單點成本,而是會在任務流程中一路累積。當一個 agent 要維持上下文走完數十步時,任何薄弱的基礎設施都會被放大成失敗率。

AgentPerf 的價值就在於它不是拿傳統 inference 指標來裝飾自己。它來自 12 種以上程式語言的真實 coding agent 軌跡,測的是更接近生產環境的壓力。能同時撐住更多 agent 任務、還維持回應與 token rate 門檻的平台,做的是更多有用工作,不只是吐出更好看的吞吐圖。
第二個論點
Blackwell 的優勢不是外觀,而是架構。GB300 NVL72 的 headline 數字,是每兆瓦最多可支援 20 倍於 Hopper 的 agents,這不是行銷話術,而是 rack-scale 設計的結果。72 顆 GPU 被綁成一個系統,像 DeepSeek V4 Pro 這類大型 MoE 模型才能更有效率地分攤執行。
軟體堆疊把這件事再往前推一步。CUDA kernel 讓通訊與運算重疊,TensorRT LLM 則把輸入處理與輸出生成拆開,讓各階段可以獨立調校。這就是 Blackwell 真正的領先點:它降低的是 agentic 工作負載最討厭的協調稅,把更多電力預算留給實際產出。
反方可能怎麼說
最強的反對意見是,NVIDIA 等於在替自己出題、自己打分。AgentPerf 是新基準,公開結果只涵蓋一部分模型類型,而且它模擬的是工具呼叫,不是直接執行真實工具。懷疑者也會指出,真正的部署還取決於軟體品質、編排、網路拓樸與模型選型,不會只看加速器本身。

這個質疑成立,但不足以推翻結論。基準測試不必一次涵蓋所有生產變數,它只需要把真正的瓶頸隔離出來。agentic AI 的核心壓力,本來就是長鏈 inference 與協調成本,而 AgentPerf 至少比單次推論測試更接近這個現實。
限制也很清楚:AgentPerf 是早期訊號,不是宇宙真理。但作為採購訊號,它已經強到足以改變決策邏輯。若一個平台在接近真實的 coding 軌跡下,能以更低功耗支撐更多 agent concurrency,買方就應該把它當成評估起點,再用自己的工作負載做驗證。
你能做什麼
如果你是工程師,不要再把 agent 系統當成聊天端點優化,改去量 end-to-end 任務完成率、並發數與每個成功工作流的瓦特成本。如果你是 PM 或創辦人,向供應商要 agentic benchmark,不要只看 generic inference 圖表,並把基礎設施決策建立在每美元、每瓦能產出多少有效工作上。Blackwell 的領先已經說得很清楚:在 agentic AI 裡,全堆疊效率本身就是產品。