[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-kubernetes-becoming-ais-control-plane-zh":3,"tags-kubernetes-becoming-ais-control-plane-zh":33,"related-lang-kubernetes-becoming-ais-control-plane-zh":48,"related-posts-kubernetes-becoming-ais-control-plane-zh":52,"series-industry-b2f9469b-f74a-44b1-9e08-8b1539632542":89},{"id":4,"title":5,"content":6,"summary":7,"source":8,"source_url":9,"author":10,"image_url":11,"keywords":12,"language":21,"translated_content":10,"views":22,"is_premium":23,"created_at":24,"updated_at":24,"cover_image":11,"published_at":25,"rewrite_status":26,"rewrite_error":10,"rewritten_from_id":27,"slug":28,"category":29,"related_article_id":30,"status":31,"google_indexed_at":32,"x_posted_at":10,"tweet_text":10,"title_rewritten_at":10,"title_original":10,"key_takeaways":10,"topic_cluster_id":10,"embedding":10,"is_canonical_seed":23},"b2f9469b-f74a-44b1-9e08-8b1539632542","Kubernetes 正在變成 AI 控制平面","\u003Cp>KubeCon Europe 2026 吸引超過 13,500 人。年增約 10%。說真的，這數字不是重點。重點是 \u003Ca href=\"https:\u002F\u002Fwww.cncf.io\u002F\" target=\"_blank\" rel=\"noopener\">CNCF\u003C\u002Fa> 這次講得很直白：Kubernetes 不再只是跑網站和微服務。它正在變成 \u003Ca href=\"\u002Fnews\u002Fai-warfare-firms-defense-contractors-zh\">AI\u003C\u002Fa> 基礎設施的控制平面，尤其是 inference。\u003C\u002Fp>\u003Cp>這件事很現實。AI 已經不是 demo 場面。現在大家在意的是模型怎麼穩定服務、怎麼省 GPU、怎麼把延遲壓下來。講白了，訓練很貴，但 inference 才是每天都在燒錢的地方。\u003C\u002Fp>\u003Cp>如果你是做平台、SRE、或 MLOps，這波你躲不掉。因為 AI 工作負載開始長得像大型分散式系統。只是它更吃 GPU，也更怕配置亂掉。\u003C\u002Fp>\u003Ch2>KubeCon 為什麼這麼吵\u003C\u002Fh2>\u003Cp>這場在阿姆斯特丹舉辦的 KubeCon，是到目前為止最大的一屆。官方數字很猛：超過 13,500 名與會者，來自 100 多個國家，3,000 多家組織，還有接近 900 場 session。這不是小圈圈在自嗨。這是整個雲原生圈的主場。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775178595353-m3ll.png\" alt=\"Kubernetes 正在變成 AI 控制平面\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>更有意思的是，CNCF 還提到雲原生開發者人數快接近 2,000 萬。這代表什麼？代表 Kubernetes 不是邊角料工具。它早就變成很多公司預設的基礎層。\u003C\u002Fp>\u003Cp>今年的風向也很明顯。以前大家談 Kubernetes，常常是在講容器、service mesh、GitOps。這次不一樣。大家開始直接談 AI 基礎設施，還是從 inference 這種很難看的地方談起。這才是真實世界會碰到的問題。\u003C\u002Fp>\u003Cul>\u003Cli>13,500+ 人參加 KubeCon Europe 2026\u003C\u002Fli>\u003Cli>100+ 國家的人來現場\u003C\u002Fli>\u003Cli>3,000+ 組織參與\u003C\u002Fli>\u003Cli>接近 900 場 session\u003C\u002Fli>\u003Cli>雲原生開發者接近 2,000 萬\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這些數字背後的意思很簡單。Kubernetes 的生態夠大，才撐得住 AI 的新需求。GPU 排程、模型服務、流量路由、策略控管，這些都不是傳統 web app 會天天碰到的問題。現在它們全都進來了。\u003C\u002Fp>\u003Cp>所以這次 KubeCon 的訊號，不是「AI 很熱門」。而是「AI 已經進到基礎設施層」。這差很多。\u003C\u002Fp>\u003Ch2>AI 訊息為什麼這次真的落地\u003C\u002Fh2>\u003Cp>今年最值得注意的，不是某個花俏 demo，而是生態系本身的動作。\u003Ca href=\"https:\u002F\u002Fwww.nvidia.com\u002F\" target=\"_blank\" rel=\"noopener\">NVIDIA\u003C\u002Fa> 加入 CNCF 成為 platinum member，還把 GPU driver 捐給 Kubernetes SIG Node，當作 vendor-neutral DRA API 的參考實作。再加上 3 年 400 萬美元的支援計畫，這訊號很清楚。\u003C\u002Fp>\u003Cp>硬體廠願意把手伸進標準討論，代表 GPU 這層不能再各做各的。你如果還把 GPU 管理鎖在自家工具裡，最後只會讓部署更碎。AI 基礎設施最怕這種碎片化。因為碎片化就代表成本高，還很難移植。\u003C\u002Fp>\u003Cp>另外，CNCF 也宣布 \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fllmd\u002Fllmd\" target=\"_blank\" rel=\"noopener\">LLMD\u003C\u002Fa> 進入 sandbox。這個專案主打 Kubernetes 上的分散式 inference。這不是玩票。這代表社群開始把 inference 當成一級基礎設施問題，而不是附加功能。\u003C\u002Fp>\u003Cblockquote>“Inference is where the money is,” said Jensen Huang, CEO of NVIDIA, onstage at \u003Ca href=\"https:\u002F\u002Fwww.nvidia.com\u002Fen-us\u002Fon-demand\u002Fsession\u002Fgtcspring25-s81939\u002F\" target=\"_blank\" rel=\"noopener\">GTC 2025\u003C\u002Fa>.\u003C\u002Fblockquote>\u003Cp>這句話很直白，也很殘酷。訓練是一次性的。Inference 才是持續性的。只要使用者一直問、a\u003Ca href=\"\u002Fnews\u002Fmicrosoft-agent-framework-mcp-tool-options-zh\">gent\u003C\u002Fa> 一直跑、Token 一直吐，伺服器就一直在燒。\u003C\u002Fp>\u003Cp>CNCF 這次還把 Kubernetes AI conformance 擴大了。新的要求包含 Gateway API、inference-aware routing、disaggregated inference。這些名詞看起來很硬，但意思不難懂。傳統 load b\u003Ca href=\"\u002Fnews\u002Fpalantir-militaries-own-ai-targeting-calls-zh\">alan\u003C\u002Fa>cer 只管流量平均分配。AI inference 還要管 cache、prompt 延遲、GPU 記憶體利用率。這完全不是同一種問題。\u003C\u002Fp>\u003Cul>\u003Cli>NVIDIA 捐出 GPU driver 參考實作\u003C\u002Fli>\u003Cli>3 年 400 萬美元支援 CNCF 專案\u003C\u002Fli>\u003Cli>LLMD 進入 CNCF sandbox\u003C\u002Fli>\u003Cli>AI conformance 新增 inference-aware routing\u003C\u002Fli>\u003Cli>Gateway API 變成 AI 基礎設施的一部分\u003C\u002Fli>\u003C\u002Ful>\u003Cp>講白了，這次不是 conference theater。這是整個 stack 在對齊新的工作負載。AI 不是先有平台再找用途。是用途先爆量，平台只好跟著改。\u003C\u002Fp>\u003Ch2>數字告訴你，inference 才是主角\u003C\u002Fh2>\u003Cp>這次 keynote 提到一個很重要的預測。2023 年，大約三分之二的 AI 算力用在 training，三分之一用在 inference。到 2026 年底，這個比例預計會翻過來。到這個十年末，inference 需求還可能衝到 93.3 gigawatts 的算力規模。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775178584906-9gz5.png\" alt=\"Kubernetes 正在變成 AI 控制平面\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這種預測不能當成天條，但方向很明確。AI 的使用型態變了。以前大家是跑模型、看結果。現在是聊天、代理、工具呼叫、持續互動。每一次互動都會多吃 Token，也多吃 GPU。\u003C\u002Fp>\u003Cp>所以經濟模型也變了。Training 像一次性專案。Inference 像長期水電費。你可以不喜歡，但帳單每個月都會來。\u003C\u002Fp>\u003Cul>\u003Cli>2023 年：training 約占 2\u002F3 AI 算力\u003C\u002Fli>\u003Cli>2023 年：inference 約占 1\u002F3 AI 算力\u003C\u002Fli>\u003Cli>2026 年底：inference 預計超過 training\u003C\u002Fli>\u003Cli>十年末：inference 需求預估達 93.3 GW\u003C\u002Fli>\u003C\u002Ful>\u003Cp>這也解釋了為什麼 Kubernetes 被重新定義。它不是只管容器啟停。它要開始管 GPU 排程、模型服務、流量導向、資源切片。換句話說，它正在往 AI 的控制平面靠攏。\u003C\u002Fp>\u003Cp>如果你是平台團隊，這時候最該問的不是「能不能跑 AI」。而是「哪個地方最先炸」。通常會是 GPU 配額、路由策略、快取命中率，或者多叢集政策不一致。這些才是真正的痛點。\u003C\u002Fp>\u003Ch2>Uber 的案例很有說服力\u003C\u002Fh2>\u003Cp>這次大會也拿出一個很實際的案例：Uber。官方分享說，Uber 的 \u003Ca href=\"https:\u002F\u002Fwww.uber.com\u002Fen-US\u002Fblog\u002Fmichelangelo-machine-learning-platform\u002F\" target=\"_blank\" rel=\"noopener\">Michelangelo\u003C\u002Fa> 平台支援公司 100% 的 mission-critical ML。每個月訓練 20,000 個模型，5,300 個在 production，峰值每秒超過 3,000 萬次預測，還有大約 1,000 個 serving nodes。\u003C\u002Fp>\u003Cp>這些數字很有感。因為它證明 AI 基礎設施不是未來式。大公司早就在做，而且規模大到不能靠手工維運。你如果還把模型服務當成實驗室專案，現場很快就會教你做人。\u003C\u002Fp>\u003Cp>Uber 的案例也提醒我們，AI 平台跟一般 Web 平台有共通點，但差異更大。共通的是都要可觀測、可擴展、可回滾。差異是 AI 多了 GPU、模型版本、推論延遲、Token 成本，還有更難抓的資源競爭。\u003C\u002Fp>\u003Cul>\u003Cli>\u003Ca href=\"https:\u002F\u002Fkubernetes.io\u002F\" target=\"_blank\" rel=\"noopener\">Kubernetes\u003C\u002Fa> 已經能處理混合工作負載\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fwww.cncf.io\u002Fprojects\u002Fkyverno\u002F\" target=\"_blank\" rel=\"noopener\">Kyverno\u003C\u002Fa> 適合做策略控管\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fwww.cncf.io\u002Fprojects\u002Ftekton\u002F\" target=\"_blank\" rel=\"noopener\">Tekton\u003C\u002Fa> 適合把 pipeline 標準化\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fwww.cncf.io\u002Fprojects\u002Fdragonfly\u002F\" target=\"_blank\" rel=\"noopener\">Dragonfly\u003C\u002Fa> 對大規模分發很有幫助\u003C\u002Fli>\u003Cli>\u003Ca href=\"https:\u002F\u002Fwww.cncf.io\u002Fprojects\u002Ffluid\u002F\" target=\"_blank\" rel=\"noopener\">Fluid\u003C\u002Fa> 對資料存取模式很重要\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你把這些工具拼在一起看，會發現一件事。AI 基礎設施不需要從零發明新 OS。它需要的是雲原生堆疊往 GPU 和 inference 方向延伸，還要保有可攜性。這就是 Kubernetes 的價值。\u003C\u002Fp>\u003Cp>我自己的看法很直接。真正有用的不是某個單點產品，而是整套開放標準能不能接住這波需求。只要還能換供應商、能跨雲、能維持策略一致，企業就比較敢上量。\u003C\u002Fp>\u003Ch2>歐洲為什麼特別在意這件事\u003C\u002Fh2>\u003Cp>這次還有一個背景不能漏掉。CNCF 提到，歐洲目前是 CNCF 專案最大的區域貢獻者。這件事跟 AI 監管、資料主權、跨境部署都有關。\u003C\u002Fp>\u003Cp>在歐洲，大家對資料治理本來就比較敏感。當 AI 基礎設施進到 production，企業就會更在意資料放哪裡、模型怎麼跑、日誌怎麼存、誰能碰到哪些資料。這時候開放標準就很重要。\u003C\u002Fp>\u003Cp>因為標準一旦碎掉，企業就會被綁死。尤其是 inference 這種長期成本高的工作負載，誰都不想把未來 3 年的預算押在某一家黑盒平台上。\u003C\u002Fp>\u003Cp>歐洲也很適合推這類技術討論。因為它同時有大型企業、主權雲需求、開源社群，還有明確的法規壓力。這些因素疊在一起，會逼大家把 AI 基礎設施做得更透明。\u003C\u002Fp>\u003Ch2>接下來該怎麼看\u003C\u002Fh2>\u003Cp>我覺得這次 KubeCon 的訊號很清楚。Kubernetes 正在從 app orchestration，往 AI operations 移動。不是口號，是工作負載真的變了。inference、GPU、routing、policy，這些都已經是主戰場。\u003C\u002Fp>\u003Cp>如果你是平台工程師，現在最實際的做法是先盤點自己的 AI 服務。你有沒有 GPU 排程策略？有沒有 inference-aware routing？有沒有把模型服務跟一般 HTTP 流量混在一起？如果有，最好現在就拆。\u003C\u002Fp>\u003Cp>我的預測很簡單。接下來 12 到 18 個月，會有更多團隊把 Kubernetes 當成 AI 控制平面來用。先做標準化的人，會比較省錢，也比較好維運。你如果還在用零散腳本撐場面，之後會很痛。\u003C\u002Fp>\u003Cp>所以問題不是「Kubernetes 能不能做 AI」。問題是「你準備好把 AI 當 production 了嗎？」\u003C\u002Fp>","KubeCon Europe 2026 釋出明確訊號：Kubernetes 正從容器編排，轉向 AI 基礎設施控制平面，重點落在 inference、GPU 與開放標準。","www.efficientlyconnected.com","https:\u002F\u002Fwww.efficientlyconnected.com\u002Fkubecon-europe-2026-keynote-cloud-natives-ai-pivot-moves-from-hype-to-infrastructure\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775178595353-m3ll.png",[13,14,15,16,17,18,19,20],"Kubernetes","AI 控制平面","KubeCon Europe 2026","inference","GPU","CNCF","雲原生","MLOps","zh",1,false,"2026-04-03T01:09:30.415473+00:00","2026-04-03T01:09:30.385+00:00","done","a898f165-91d6-4e22-8f6e-042a9d516fdf","kubernetes-becoming-ais-control-plane-zh","industry","ebda74d3-8122-455a-addd-1ade341b2542","published","2026-04-07T07:41:13.643+00:00",[34,35,37,39,41,43,45,47],{"name":16,"slug":16},{"name":15,"slug":36},"kubecon-europe-2026",{"name":17,"slug":38},"gpu",{"name":13,"slug":40},"kubernetes",{"name":14,"slug":42},"ai-控制平面",{"name":20,"slug":44},"mlops",{"name":18,"slug":46},"cncf",{"name":19,"slug":19},{"id":30,"slug":49,"title":50,"language":51},"kubernetes-becoming-ais-control-plane-en","Kubernetes Is Becoming AI’s Control Plane","en",[53,59,65,71,77,83],{"id":54,"slug":55,"title":56,"cover_image":57,"image_url":57,"created_at":58,"category":29},"cd078ce9-0a92-485a-b428-2f5523250a19","circles-agent-stack-targets-machine-speed-payments-zh","Circle 推出 Agent Stack，瞄準機器速度支付","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778871663628-uyk5.png","2026-05-15T19:00:44.16849+00:00",{"id":60,"slug":61,"title":62,"cover_image":63,"image_url":63,"created_at":64,"category":29},"96d96399-f674-4269-997a-cddfc34291a0","iren-signs-nvidia-ai-infrastructure-pact-zh","IREN 綁上 Nvidia AI 基建","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778871057561-bukp.png","2026-05-15T18:50:37.57206+00:00",{"id":66,"slug":67,"title":68,"cover_image":69,"image_url":69,"created_at":70,"category":29},"de12a36e-52f9-4bca-8deb-a41cf974ffd9","circle-agent-stack-ai-payments-zh","Circle 推出 Agent Stack 做 AI 付款","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778870462187-t9xv.png","2026-05-15T18:40:30.945394+00:00",{"id":72,"slug":73,"title":74,"cover_image":75,"image_url":75,"created_at":76,"category":29},"e6379f8a-3305-4862-bd15-1192d3247841","why-nebius-ai-pivot-is-more-real-than-hype-zh","為什麼 Nebius 的 AI 轉型比炒作更真實","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778823044520-9mfz.png","2026-05-15T05:30:24.978992+00:00",{"id":78,"slug":79,"title":80,"cover_image":81,"image_url":81,"created_at":82,"category":29},"66c4e357-d84d-43ef-a2e7-120c4609e98e","nvidia-backs-corning-factories-with-billions-zh","Nvidia 出資 Corning 工廠擴產","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778822450270-trdb.png","2026-05-15T05:20:27.701475+00:00",{"id":84,"slug":85,"title":86,"cover_image":87,"image_url":87,"created_at":88,"category":29},"31d8109c-8b0b-46e2-86bc-d274a03269d1","why-anthropic-gates-foundation-ai-public-goods-zh","為什麼 Anthropic 和 Gates Foundation 應該投資 A…","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778796636474-u508.png","2026-05-14T22:10:21.138177+00:00",[90,95,100,105,110,115,120,125,130,135],{"id":91,"slug":92,"title":93,"created_at":94},"ee073da7-28b3-4752-a319-5a501459fb87","ai-in-2026-what-actually-matters-now-zh","2026 AI 真正重要的事","2026-03-26T07:09:12.008134+00:00",{"id":96,"slug":97,"title":98,"created_at":99},"83bd1795-8548-44c9-9a7e-de50a0923f71","trump-ai-framework-power-speech-state-preemption-zh","川普 AI 框架瞄準電力、言論與州權","2026-03-26T07:12:18.695466+00:00",{"id":101,"slug":102,"title":103,"created_at":104},"ea6be18b-c903-4e54-97b7-5f7447a612e0","nvidia-gtc-2026-big-ai-announcements-zh","NVIDIA GTC 2026 重點拆解","2026-03-26T07:14:26.62638+00:00",{"id":106,"slug":107,"title":108,"created_at":109},"4bcec76f-4c36-4daa-909f-54cd702f7c93","claude-users-spreading-out-and-getting-better-zh","Claude 用戶更分散，也更會用","2026-03-26T07:22:52.325888+00:00",{"id":111,"slug":112,"title":113,"created_at":114},"bd903b15-2473-4178-9789-b7557816e535","openclaw-raises-hard-question-for-ai-models-zh","OpenClaw 逼問 AI 模型價值","2026-03-26T07:24:54.707486+00:00",{"id":116,"slug":117,"title":118,"created_at":119},"eeac6b9e-ad9d-4831-8eec-8bba3f9bca6a","gap-google-gemini-checkout-fashion-search-zh","Gap 把結帳搬進 Gemini","2026-03-26T07:28:23.937768+00:00",{"id":121,"slug":122,"title":123,"created_at":124},"0740e53f-605d-4d57-8601-c10beb126f3c","google-pushes-gemini-transition-to-march-2026-zh","Google 把 Gemini 轉換延到 2026 年 3…","2026-03-26T07:30:12.825269+00:00",{"id":126,"slug":127,"title":128,"created_at":129},"e660d801-2421-4529-8fa9-86b82b066990","metas-llama-4-benchmark-scandal-gets-worse-zh","Meta Llama 4 分數風波又擴大","2026-03-26T07:34:21.156421+00:00",{"id":131,"slug":132,"title":133,"created_at":134},"183f9e7c-e143-40bb-a6d5-67ba84a3a8bc","accenture-mistral-ai-sovereign-enterprise-deal-zh","Accenture 攜手 Mistral AI 賣主權 AI","2026-03-26T07:38:14.818906+00:00",{"id":136,"slug":137,"title":138,"created_at":139},"191d9b1b-768a-478c-978c-dd7431a38149","mistral-ai-faces-its-hardest-year-yet-zh","Mistral AI 迎來最硬的一年","2026-03-26T07:40:23.716374+00:00"]