AI 需求把雲端支出推高 29%
Q4 2025 全球雲端基礎設施支出達 1109 億美元,年增 29%。AI 訓練、推論與雲端工作負載一起拉高 hyperscaler 投資。

全球雲端基礎設施支出在 Q4 2025 衝到 1109 億美元。年增 29%。這不是小波動,是整個市場一起加碼。
說白了,錢主要花在 AI。訓練、推論、資料處理,全部都在吃伺服器和 GPU。雲端大廠只能跟著擴容量,不然客戶一多就塞車。
問題也很直接。企業一邊喊要上 AI,一邊又盯著成本。結果就是雲端支出往上跑,採購團隊卻還在算每個 Token 的成本。
為什麼帳單一直變大
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
這波支出成長,核心就是容量。AWS、Google Cloud、Microsoft Azure 這些 hyperscaler,現在買的不只是機器,是整套 AI 基礎設施。

AI 訓練很吃 GPU。推論也不便宜,尤其是高頻請求、長上下文、RAG 這些場景。你如果把模型放進產品主流程,雲端帳單通常會先嚇你一跳。
另一個原因是企業工作負載沒有停。傳統 SaaS、資料倉儲、串流分析、備份與災難復原,這些都還在。AI 只是把原本就不低的雲端支出,再往上疊一層。
- GPU 採購和機房建置同步增加
- 推論流量把即時算力需求拉高
- 企業把更多資料搬上雲
- 大型模型服務吃掉更多網路與儲存資源
誰在付錢,誰在賺錢
這筆錢不是平均分。Microsoft、Amazon、Google 這類大廠,因為掌握雲端、AI 平台和銷售通路,最容易把需求轉成營收。
但客戶端的感受通常沒那麼美好。很多團隊會先做 PoC,再發現正式上線後成本比預期高 2 倍,甚至 3 倍。這時候大家才開始認真看 cache、batching、量化和模型路由。
NVIDIA 也在這波裡面吃到大量需求。因為雲端擴容的核心硬體,很多還是繞不開它的 GPU 生態。講白了,雲端大廠買卡,最後還是得看供應鏈。
“The AI boom is very real, and it’s very expensive.” — Satya Nadella
跟其他雲端時期比,這次有什麼不同
以前雲端成長,主力是搬遷和數位轉型。現在不一樣,AI 是直接吃算力。差別在於,傳統雲端多半是穩定流量,AI 則是高峰明顯,而且單次請求成本高很多。

另一個差別是投資節奏。過去企業常常先省錢,再慢慢上雲。現在很多公司是先買算力,再想怎麼把產品做出來。這種順序,會讓支出先衝很快。
如果把幾家主要供應商放一起看,差距也很明顯。Oracle Cloud 主打資料庫與企業客戶。DigitalOcean 則偏中小團隊。IBM Cloud 走的是既有企業關係。AI 時代的錢,還是更偏向能拿到大規模 GPU 與網路資源的人。
- 傳統雲端:搬遷、儲存、SaaS 為主
- AI 雲端:GPU、推論、向量資料庫為主
- 傳統工作負載:成本相對可預測
- AI 工作負載:成本波動更大
台灣團隊該怎麼看
對台灣開發者來說,這代表兩件事。第一,AI 產品不只要看模型效果,也要看雲端成本。第二,架構能力會變重要,因為省 10% 成本,可能直接影響毛利。
很多團隊現在都在改做法。有人把大模型請求拆成多段。有人先用小模型過濾,再丟大模型。也有人把熱門內容快取起來,避免每次都重算。這些都不是花招,是生存技能。
如果你在做 SaaS、客服、搜尋或內容生成,我會建議你先算三個數字:每次請求成本、每月峰值流量、以及模型切換後的節省幅度。這三個數字,比 Demo 好不好看更重要。
接下來會怎麼走
我覺得接下來半年,雲端支出還會繼續偏高。原因很簡單,AI 需求沒有退燒,企業也還在試著把它塞進產品和內部流程。
真正的變數是效率。如果模型更省 Token,或推論硬體更便宜,雲端帳單才可能慢下來。反過來說,只要大家還在拼命上 AI,雲端大廠的資本支出就很難停。
對開發者來說,現在最實際的問題不是「要不要用 AI」,而是「怎麼用得不爆預算」。先把成本算清楚,再談規模,會比較像在做生意,不是在燒錢。