OpenAI 豪賭算力,AI 經濟學變了
OpenAI 年化營收傳出已超過 200 億美元,但晶片、電力與資料中心支出也一路暴衝。需求很真實,問題是帳怎麼算得過去,這正是 AI 產業現在最難迴避的現實。

OpenAI 在 2025 年傳出年化營收超過 200 億美元。這數字很大,但另一個數字更刺眼:它牽動的基礎設施承諾,已經不是幾個機櫃,而是用 GW 來算的電力規模。
講白了,AI 需求真的有起來。只是需求越高,不代表生意越好做。當每多一個使用者,都可能多出一筆不小的推論成本,營收成長有時反而像在追著帳單跑。
這也是我覺得現在最值得看的地方。AI 競爭已經不只是模型誰比較聰明,而是誰能用更低成本,把同樣的回答穩定送出去。
OpenAI 為什麼開始淡化對 Nvidia 的依賴
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
過去幾年,Nvidia 幾乎就是高階 AI 晶片的代名詞。H100 到 Blackwell,大家搶著買,因為訓練大模型就是要最強的通用加速器。這件事到現在都沒變。

但市場開始分成兩塊。訓練是一門生意,推論是另一門生意。訓練要的是極限效能,推論更在意延遲、功耗、單次查詢成本,還有整體資源利用率。
所以你會看到 OpenAI 不再只盯著單一供應商。它傳出跟 Cerebras 談推論算力,也傳出租用 Google TPU,還跟 Broadcom 合作自研推論晶片,並交給 TSMC 以 3 奈米製程生產。
這不是為了湊熱鬧。這比較像財務壓力逼出來的選擇。若推論成本壓不下來,產品越成功,帳單越難看。對一家使用量狂飆的公司來說,這很傷。
- OpenAI 在 2025 年的年化營收,傳出已超過 200 億美元。
- 對比 2023 年約 20 億美元,兩年內規模差了 10 倍。
- 部分產業說法認為,Google TPU 在特定推論情境的效率,可超過同級 GPU 方案 2 倍以上。
- 市場也傳出 OpenAI 與 Broadcom 的自研推論晶片,目標在 2026 年量產。
更大的訊號很清楚。AI 已經不是一顆晶片打天下。訓練叢集和推論叢集,開始往不同方向最佳化,供應鏈也跟著分裂。
真正卡住 AI 的,可能不是晶片,是電
很多人談 AI 基礎設施,第一反應還是晶片缺貨。這沒錯,但說真的,電力常常更麻煩。你有一整棟加速器伺服器,若沒有足夠供電、散熱和電網接入,機器就只能擺著。
這也是為什麼 OpenAI 的算力故事,現在會一路連到公用事業、電池儲能、天然氣機組,甚至地方政府的能源規劃。AI 資料中心不再只是機房工程,它越來越像能源工程。
和 OpenAI 相關的基礎設施合作方,已經串成一整條長鏈。你會看到 Oracle、Crusoe、CoreWeave、Nvidia、AMD 和 Broadcom 都被點名。相關承諾規模傳出超過 26 GW,這已經是公用事業等級的需求。
Crusoe 在德州 Abilene 的案子很有代表性。外界描述該案規模已擴到 1.2 GW,分散在多棟建築。再加上和 Lancium 的合作,包含電池儲能、太陽能整合、天然氣備援,這已經不是單純買伺服器就能解決的事。
“America has a real opportunity to build a lot more datacenter capacity than any other country.”
— Satya Nadella
Microsoft 執行長 Satya Nadella 也多次提到,限制 AI 擴張的因素包含電力與施工能力。這點很實際。晶片短缺會拖慢部署,電力不足則會讓已經買下來的硬體直接閒置。
- AI 資料中心的限制,常見是供電、冷卻與電網接入,不只是 GPU 交期。
- 26 GW 這種量級,代表 AI 建設已經碰到區域能源規劃層級。
- 德州案場顯示,電池、太陽能、天然氣備援會一起上。
- 能快速拿到電力的營運商,接下來很可能比單純有機房空間的人更有優勢。
需求很熱,但商業模式還是有點尷尬
看表面數字,AI 市場確實很火。Microsoft 一直提到 Azure 受 AI 工作負載帶動。Google Cloud 也公開談過 Gemini API 使用量快速上升。連 TSMC 的資本支出計畫,都透露客戶還會繼續下單高階矽晶片。

但真正難的問題是,這些需求能不能變成健康毛利。原始素材提到,OpenAI 在某些時期的推論成本可能高於相關收入。若這個方向沒錯,很多動作就說得通了,像是自研晶片、找更便宜的推論供應商,甚至嘗試廣告等新變現方式。
我覺得這裡很像航空業或電信業,不太像大家熟悉的純軟體公司。使用量成長很快,聽起來很美。但如果每多一個活躍使用者,就要多燒不少算力和電費,規模不一定會先帶來利潤,反而可能先帶來壓力。
這也是為什麼「AI 是不是好生意」和「AI 有沒有需求」其實是兩個問題。前者看的是單位經濟,後者看的是市場熱度。現在市場對後者幾乎沒有懷疑,對前者則還在算帳。
- 素材提到 OpenAI 2026 年現金消耗可能達 170 億美元。
- 對比 2025 年約 90 億美元,壓力還在往上走。
- 長期基礎設施與租賃承諾,傳出到 2030 年可能上看數千億美元。
- JPMorgan 等金融機構已關注 AI 基建融資中的債務與私募信貸角色。
- Meta 也傳出動用私募信貸籌措大型資料中心資金。
這裡還有一個很多人忽略的點。當 AI 基建越來越靠債務與信貸撐起來,風險就不只留在模型公司本身。它會一路傳到雲端業者、建商、公用事業、地方銀行,還有能源供應商。
競品怎麼打,差異其實很明顯
如果把 OpenAI 放進整個產業來看,現在的競爭已經不是單純比模型榜單。Google 手上有 TPU、雲端、資料中心和自家模型。Microsoft 有 Azure、企業通路,還綁著 OpenAI。Meta 走開放權重和自建基礎設施路線。每一家都在用不同方式解同一題:怎麼把 Token 成本壓低。
OpenAI 的難點在於,它的產品熱度很高,API 與 ChatGPT 需求也很強,但它不是從硬體起家,也不是從公有雲起家。這代表它在供應鏈和資本結構上,要比 Google 這種垂直整合玩家更辛苦。
Nvidia 依然是最大贏家之一,這點短期很難變。問題是,Nvidia 最強的地方在訓練市場。當推論市場規模越來越大,專用晶片、客製 ASIC、TPU 這類方案就會開始搶份額。這不是 Nvidia 突然不行,而是市場需求本身變了。
- Google:自有 TPU、雲端平台、模型服務,整合度最高。
- Microsoft:企業客戶基礎深,Azure 能直接承接 AI 工作負載。
- Meta:靠自建資料中心與開放模型攤平成本。
- OpenAI:產品需求最強之一,但供應鏈掌控力相對較弱。
- Nvidia:訓練仍是核心優勢,推論則面臨更多專用硬體競爭。
對台灣供應鏈來說,這也很有感。因為不管是 GPU、TPU、ASIC,最後很多先進製程還是得看 TSMC。講白了,模型公司在比誰更會花錢,晶圓代工廠在看誰能持續下單。
台灣開發者該怎麼看這波變化
如果你是開發者,這波變化很直接。第一個影響是 API 定價不會只是產品策略,它會越來越受基礎設施成本牽動。模型供應商今天降價,背後可能不是佛心,而是推論效率變好了。
第二個影響是模型選型。以前很多團隊習慣先看 benchmark,現在要多看延遲、Token 成本、上下文長度、區域供應和 SLA。模型再強,若成本撐不住,專案上線後會很痛。
第三個影響是架構設計。越來越多團隊會採混合策略,大模型處理難題,小模型吃日常任務,再搭配快取、RAG、路由器和批次處理。這不是花招,這是把雲端帳單壓回可控範圍的基本功。
對企業採購也是一樣。你買的不是單一模型,而是一整套供應穩定性。包括算力來源、地區法規、資料駐留、服務中斷風險,還有價格會不會半年後又變。
接下來 24 個月,看四個數字就夠了
我會先看四個指標。第一是電力容量。第二是每 Token 推論成本。第三是企業付費轉換率。第四是新建叢集的利用率。這四個數字,會比模型榜單更早反映誰真的把生意做順。
若 OpenAI 和其他模型公司能在 2026 年前,把推論成本有效壓低,例如降到目前的一半附近,同時維持使用品質,那現在這波基建狂衝還算合理。若成本降不下來,市場就會開始重新評價整條 AI 產業鏈。
對開發者來說,最實際的建議很簡單。別只追最新模型,先把自己的工作負載分層。哪些請求一定要最強模型,哪些其實 1/5 成本就能解,先算清楚。AI 市場接下來比的,會是誰把效能、成本和供應穩定性一起顧好。
最後留一個問題給你。如果明年模型品質只進步 10%,但推論成本降了 60%,你會選哪一邊?我覺得多數公司最後會用錢投票。