[IND] 11 分鐘閱讀OraCore 編輯部

Red Hat AI 把電信 AI 變成堆疊

拆解 Mavenir 與 Red Hat 怎麼把 telco AI 包成可部署、可營運、可計費的堆疊,重點放在 Kubernetes、MLOps、vLLM 與 AgentOps。

分享 LinkedIn
Red Hat AI 把電信 AI 變成堆疊

我拆給你看 Mavenir 和 Red Hat 怎麼把電信 AI 包成可部署、可營運、可計費的堆疊。

我盯 telco AI 很久了,老實說,很多提案都很空。大家嘴上都在講 AI monetisation,好像只要把「AI」貼上去,錢就會自己長出來。可你一往下看,不是 demo,就是整頁架構圖,再不然就是一堆「平台化」的漂亮字。那種感覺真的很煩:如果我是電信商,我不要再聽一次 AI 口號,我要的是能上線、能維運、能算帳,還能跟財務講清楚下季為什麼要收費的東西。

我最近看到 Telecoms.com 這篇 Mavenir 與 Red Hat 的內容,才覺得這次比較像在講方法,不是在喊話。Red Hat CTO Chris Wright 把重點放在 Kubernetes-native foundation,加上 Red Hat AI、MLOpsvLLM inference 和 AgentOps。這種講法雖然還是有供應商腔調,但至少它在談 operating model,不是在畫 keynote 幻想。

別把 AI 當功能開關,先把它當服務堆疊

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

“Working with Mavenir, we're delivering an integrated solution supported on the Kubernetes-native foundation powered by Red Hat AI, which brings MLOps, vLLM inference and AgentOps capabilities.”

翻譯一下就是:Red Hat 和 Mavenir 想賣的不是一個模型,而是一整套可管理的 AI 服務堆疊。真正重要的不是模型本身,而是模型外圍那圈東西:部署、推理、生命週期管理、代理編排。這些才決定一個 AI 服務能不能撐過真實客戶的壓力。

Red Hat AI 把電信 AI 變成堆疊

我看過太多團隊卡在這裡。Notebook 跑得動,甚至容器也包好了,就以為差不多要收工。結果一進 production,沒人知道怎麼升版、怎麼回滾、怎麼觀測、怎麼加護欄。模型不是產品,模型周邊的操作系統才是產品。你如果管不住它,就不是可賣的服務,只是掛著帳單欄位的實驗室 demo。

實操寫法很簡單:在你談準確率之前,先問三個很土的問題。它跑在哪裡?怎麼更新?失敗時誰負責?這三題答不順,所謂 monetisation 大多只是簡報上的漂亮字。

  • 先定義服務邊界,再選模型。
  • 先想推理怎麼暴露給客戶,再想 prompt 要怎麼寫。
  • 第一版上線前,先寫好 rollback 路徑。

Kubernetes 不性感,但它就是把混亂壓下來的那層

Red Hat 一直把 Kubernetes-native infrastructure 掛在嘴邊,我反而覺得這是最有用的地方。電信環境最怕的就是每個新 workload 都長出自己的部署怪癖。Kubernetes 不會神奇地解決 AI,但它至少給你一個共同控制面,去包裝、跑起、管住這些服務。

如果你做過 operator 環境,就知道這件事有多重要。電信團隊最討厭 bespoke ops,因為 bespoke ops 會變成永久 ops。今天一個模型用一套方式部署,明天另一個模型又是另一套,最後 support 團隊在凌晨兩點要背三種失敗方式。Kubernetes-native 的價值,不是時髦,而是讓部署、政策、觀測至少能標準化一點。

我自己的做法是這樣:如果一個 AI 服務沒辦法被描述成可部署的 workload,而且 resource limit 說不清楚,那它還沒準備好進 telco。它只是穿著企業外套的 prototype。

實操寫法:不要先問 Kubernetes 夠不夠潮,先問這個 AI 服務是不是要跟網路功能、客戶系統或 edge workload 共存。如果答案是要,那共同 orchestration layer 就不是加分題,是基本配備。

  • 盡量讓 AI 服務共用一種部署模式。
  • 把 policy、observability、access control 放在平台層處理。
  • 假設營運成本會比模型本身活得更久。

MLOps 不是貼標籤,是把失控變成可重複

文章裡直接提到 MLOps,這就對了,因為真正的工作從這裡才開始。MLOps 不是模型跑通之後補貼的一張貼紙,而是讓模型更新變得可重複、可測試、可追蹤,最後可被信任。沒有這層,每次改版都會變成一場小型災難。

Red Hat AI 把電信 AI 變成堆疊

我喜歡這種 framing,因為它把 AI 拉回軟體 release management,而不是什麼神祕的資料科學儀式。這對電信商很合理,因為電信本來就懂 change control、release window、rollback。你如果能把 model update 接到這套習慣上,才有機會真的營運起來;如果你把它當手工藝,每次升版都會燒掉一個週末。

我自己碰過一個平台團隊,模型 drift 先被客戶發現,內部才後知後覺。很丟臉,但很常見,原因就是沒人真正擁有 lifecycle。MLOps 提供的是版本、測試、promotion、監控、retraining trigger 這些鉤子。沒有這些,所謂 AI monetisation 其實比較像 AI maintenance,只是發票看起來比較高級。

實操寫法:替 AI 服務做一份 release checklist,長得跟你平常的軟體 checklist 很像。模型版本要標、prompt 或 policy 要版本化、acceptance test 要寫、rollback threshold 要定。升版標準要跟網路服務一樣嚴,不然就別把它算進營收規劃。

vLLM 不是技術梗,是成本線開始動的地方

這篇特別提到 vLLM inference,我覺得這個細節很關鍵,因為很多 AI 熱情就是死在 inference cost。測試時你會愛上模型,看到帳單時你會恨它。推理階段才是 latency、throughput、GPU utilisation 變成會計問題的那一刻。

vLLM 重要的原因很直接:它是在更有效率地 serving large language models。你要真的把 AI 拿去賣,不是只要「它能跑」,而是要「每次請求的成本合理」。這就是 pilot 跟 business 的差別。軟體可以很漂亮,但經濟上不成立,一樣沒用。

我看到這裡的解讀是:Red Hat 與 Mavenir 想把 AI serving 變成平台問題,而不是客製工程案。這很聰明。電信商本來就習慣看 capacity、utilisation、service tiers。如果 inference 也能用同一套語言來管,定價和包裝就會順很多。

實操寫法:不要等上線後才算成本。先量 cost per inference、latency、concurrency、utilisation,在接近真實負載的情況下看。你如果不知道一個 request 到底多少錢,就別裝作可以報價。

我的簡單規則是:在你把 AI 服務擴大給更多人之前,先回答「使用量翻倍時成本會怎樣」這題,而且不要翻開 spreadsheet 就開始冒汗。

AgentOps 是下一個麻煩點,先管住再說

AgentOps 是這句話裡最有意思的詞,因為它直接指到下一個控制問題。當你從單一模型走到 agentic workflow,事情就開始變複雜。agent 會串工具、做決策、記憶上下文,還可能碰到比文字生成更危險的操作。

這也是很多 AI pitch 很粗糙的地方。demo 裡的 assistant 很貼心,真正上線時才發現它有 permissions、有 memory、有 tool access,還能做出昂貴或危險的動作。AgentOps 的目的,就是把這些東西變得可管。它關心的是 orchestration、權限、稽核、介入點。

我參加過不少 platform review,經驗很一致:只要 agent 能碰客戶資料或網路操作,會議氣氛立刻變。Security 團隊不再只是點頭,operations 會問 log 在哪,product 會問出事誰背鍋。這些問題都很合理,因為 agent 不是聊天機器人,它是有權限的自動化。

實操寫法:把 agent 當成 privileged automation,不要當成 fancy chat widget。先定義它能用哪些工具、哪些步驟需要人審、log 要留多久,再讓它靠近重要系統。你如果沒辦法用一段話講清楚它的邊界,那它還不該上 production,更不該碰 monetisation。

電信要的是產品,不是 AI 表演

我覺得這篇 Mavenir 和 Red Hat 的價值,在於它把 telco AI 往產品思維推了一點。這才是難的地方。電信商不是沒技術野心,而是常常缺一條從 capability 到 packaged offer 的路。AI 不會自動補上那條路,只會讓你忽略它時,成本變得更大。

我的結論很直白:如果你想在 telecom 裡 monetise AI,你需要的是一個能部署、能觀測、能治理、能定價的 stack。你需要 infra、platform、security、product 這幾群人真的坐下來講話,而不是每個人都把自己的需求翻成 buzzword。這很不浪漫,但就是工作本身。

實操寫法:先定一個 AI offer、一個目標客戶、一種 billing model、一個營運 owner。不要一開始就做產品組合。先做一個你真的能支援到底的服務,再把平台圍著它長出來,而不是反過來。

如果你的 AI 計畫唯一能做的事,就是讓參訪者點頭,那它不是計畫,它是表演。

可抄的模板

# Telco AI monetisation template

## Offer name
[用客戶語言命名,不要用模型名]

## Customer problem
[這個服務到底解決哪個營運或商業痛點?]

## Deployment model
- Runs on: Kubernetes-native platform
- Inference layer: vLLM or equivalent serving stack
- Lifecycle: MLOps pipeline for versioning, testing, rollback
- Agent control: AgentOps policies for tools, permissions, and audit logs

## Success metrics
- Cost per inference
- P95 latency
- Availability target
- Rollback time
- Human override rate for agent actions

## Operating model
- Product owner:
- Platform owner:
- Security owner:
- Support owner:

## Guardrails
- Approved data sources:
- Disallowed actions:
- Human approval required for:
- Logging and retention rules:

## Pricing model
- Per request
- Per tenant
- Per workflow
- Bundled with existing service

## Release checklist
1. Model version tagged
2. Inference capacity tested under load
3. Monitoring dashboards live
4. Rollback path verified
5. Security review signed off
6. Billing logic validated
7. Customer support runbook published

## Launch rule
Do not launch until one customer can be supported end-to-end by the named owners above.

上面這份模板是我把 Mavenir 與 Red Hat 的 framing 拆成可執行版本。它的結構是我原創的實操清單,但骨架來自原文對 Kubernetes-native AI、MLOps、vLLM inference、AgentOps 的強調。

來源:Telecoms.com。我加了實作順序、營運清單和模板化寫法;原文的產品框架來自 Chris Wright 的說法。補充背景可看 Red Hat OpenShiftRed Hat 的 Kubernetes 說明vLLM、以及 Mavenir