[IND] 6 分鐘閱讀OraCore 編輯部

Data Center World 2026:AI逼爆機房設計

Data Center World 2026 上,Oracle、Nvidia、Google 都說 AI 正逼機房重做供電、散熱與網路。

分享 LinkedIn
Data Center World 2026:AI逼爆機房設計

AI 正把資料中心從機櫃優化,推到供電、散熱和網路一起重做的階段。

Data Center World 2026Oracle Cloud InfrastructureNvidiaGoogle 都講得很直白。AI 工作負載已經不是多幾台伺服器而已。它直接改掉整座機房的設計邏輯。

最誇張的地方,是機櫃密度。以前 30 到 40 kW 算常見。現在 AI 機櫃常常往數百 kW 走。某些設計甚至碰到 MW 級。

數字代表什麼來源
30–40 kW舊世代機櫃密度Google 的 Varun Sakalkar
數百 kWAI 時代常見密度Google 的 Varun Sakalkar
MW 級新一代機櫃設計上限Google 的 Varun Sakalkar
220+ 個媒體資產TechTarget 與 Informa Tech 的數位網路規模出版方揭露
5000 萬+ 專業受眾出版方宣稱的觸及規模出版方揭露

AI 讓機房變成兩種世界

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

這次最有意思的點,是 AI 訓練和推論已經分家。OCI AI 基礎架構副總裁 Ram Nagappan 說,現在不能用同一套思路看兩者。

Data Center World 2026:AI逼爆機房設計

訓練叢集要把幾萬顆 GPU 綁在一起。低延遲很重要。實體距離也很重要。你要把算力、網路、交換器都拉到很近,才不會讓通訊成本炸掉。

推論就不一樣了。它更在意可用性、回應時間和擴展性。講白了,訓練像工廠。推論像服務窗口。工程目標完全不同。

Nagappan 的說法很直接:你在建資料中心時,兩者都要考慮。 這句話很實際。因為舊式機房假設工作負載相對穩定。現在這個假設已經不太成立。

  • 訓練偏向高密度 GPU 叢集。
  • 推論偏向服務穩定和擴展。
  • 兩種模式現在常在同一座機房內。
  • 所以佈局、備援、網路都要重畫。

機櫃密度已經不是原本那套

Google Cloud 的 Varun Sakalkar 直接講,業界已經離開過去那種 30 到 40 kW 的機櫃時代。現在很多 AI 機櫃都在數百 kW。

這不是單純把電加大而已。你一旦把密度拉上去,整個系統都要跟著改。進線方式、散熱路徑、機櫃結構、施工流程,全都會牽動。

Sakalkar 用了一句很準的話:我們不是在設計一個機櫃,我們是在設計一個系統。 這句話很有份量。因為機櫃已經不是最小單位。現在是整個供電與散熱鏈一起算。

這也解釋了為什麼很多機房團隊開始重做規格書。以前是先看空間,再看電。現在常常是先看電,再看熱,最後才看空間。順序整個倒過來。

  • 舊機櫃:30–40 kW。
  • AI 機櫃:數百 kW。
  • 新設計:朝 MW 級靠近。
  • 規劃單位:系統,不是單櫃。

電力才是真正卡關點

Nvidia 能源系統首席工程師 Sean James 說得很直白。現在先卡住的,常常不是 GPU,而是電力。

Data Center World 2026:AI逼爆機房設計

很多業者會先用 behind-the-meter generation,也就是自有或場內發電。這能先把專案往前推,但不是長期答案。James 也講得很清楚:這是好的止痛藥,不是最終解法。

原因很簡單。AI 叢集不只吃電多。它還會讓負載波動很大。訓練一跑,電網壓力就跟著上來。這種波動甚至會一路影響到電廠端。

所以儲能開始變重要。它可以平滑尖峰,撐住瞬間掉壓,也能幫機房更好地對接電網要求。說白了,AI 機房現在不只是資料中心問題,還是能源工程問題。

“Behind-the-meter power is a good stopgap. It’s not the preferred long-term solution.” — Sean James, Nvidia

液冷不再是選配

散熱這題,現在幾乎沒有太多爭論空間了。Sakalkar 直接說,Liquid cooling is here。剩下的問題是怎麼標準化。

這件事聽起來很平常,實際上很麻煩。液冷會改變機櫃設計、維修流程、零件供應鏈,連驗收和上線步驟都要重寫。你不能再把它當成一個外掛模組。

James 也提到,液冷擴張後,接頭數量、管路配置、備品管理都會變複雜。再加上用水議題,很多地區還得面對法規和永續壓力。這些都不是小事。

我覺得最現實的結論是:高密度 AI 機房,液冷已經接近預設值。還在把它當試驗案的團隊,設計節奏會慢人一拍。

  • 液冷已接近高密度 AI 的預設方案。
  • 機房會同時存在液冷與風冷區域。
  • 用水量開始變成設計條件。
  • 標準化比證明可行更重要。

速度也在改變建設方式

AI 不是只改硬體。它也在改工地節奏。James 說,現在很多團隊把工作移到場外先做,還會提早完成設計,避免下一代 GPU 一來就整個重來。

這就是為什麼模組化架構一直冒出來。它讓業者能更快上線,也保留一點彈性。畢竟 GPU 規格和供電需求變得太快,等你蓋完,規格可能又變了。

在更大的尺度上,Sakalkar 說 hyperscaler 開始把整個 campus 當成產品。這句話很有意思。因為價值單位已經不是一棟樓,而是一整個可擴充園區。

這會影響採購、施工順序、供應鏈協調,還有分階段上線的方式。以前是先蓋建物,再慢慢塞設備。現在常常是設備和基礎設施一起到位。

  • 前置設計變得更重要。
  • 模組化能縮短上線時間。
  • campus 變成新的產品單位。
  • 設備和基礎設施要一起規劃。

這波變化其實早就有跡可循

AI 把資料中心推進新階段,不是一天發生的。只是這次的速度太快,讓很多原本能慢慢修的問題,變成一次要全改。從 Open Compute Project 到各家雲端廠商,大家其實早就在談高密度、開放式機房和更好的電力管理。

只是以前這些討論比較像前瞻規劃。現在不一樣。GPU 叢集、液冷、儲能、變電、網路拓樸,已經全部綁在一起。你不能只升級其中一項,因為其他項會跟著卡住。

這也會拉開不同業者的差距。大型雲端廠商有錢、有供應鏈、有土地,也有能力把整個 campus 一次規劃好。中小型機房如果還用舊思路,會越來越難接 AI 專案。

我自己的判斷很簡單。接下來 12 到 24 個月,真正有競爭力的機房,不是電費最低的那種,而是能把供電、液冷、網路和施工節奏一起協調好的那種。

下一步看誰能先把系統整合好

這場變化的核心,不是某個單一技術。而是整套基礎設施一起升級。誰能先把電、熱、網路和交付速度整合好,誰就比較有機會吃到 AI 需求。

如果你是機房、雲端或硬體團隊,現在最該問的不是「要不要上 AI」。而是「現有設計能撐到幾百 kW 嗎?」如果答案很模糊,代表你該重畫圖了。

講白了,AI 已經把資料中心從機電工程,推成系統工程。這題不是靠補丁能解。你得從頭算一次。