[TOOLS] 12 分鐘閱讀OraCore 編輯部

微軟把 Linux 變成 AI 基礎設施

我拆微軟這套 agentic stack,重點不是模型,是把 Linux、開源標準與治理一起當成 AI 基礎設施。

分享 LinkedIn
微軟把 Linux 變成 AI 基礎設施

我拆微軟這套 agentic stack,重點不是模型,是把 Linux、開源標準與治理一起當成 AI 基礎設施

我最近一直在看各種 agent 架構,越看越煩。很多團隊都很會講「讓 AI 幫你做事」,Demo 也都漂亮,結果一進到真實環境就開始露餡:底層作業系統不一致、容器映像來源說不清楚、代理彼此講不同語言、出了事又沒人能追。說白了,大家很愛把聰明的那層做很花,卻把最該穩的那層做得像臨時拼的。

我用這類 open source for AI 的論述看了一陣子,心裡一直有個結:如果你連機器底下跑的是什麼都沒講清楚,那你其實不是在做 agent 平台,你是在做一個會說話的風險堆疊。這次我看到微軟在 Open Source Blog 這篇文章,才覺得終於有人把那幾層 boring 的東西講對了。

真正重要的不是發表會,是底層先站穩

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

「我們宣布兩個更新,分別是 Azure Linux 4.0 在 Azure Virtual Machines 上的公開預覽,以及 Azure Container Linux 的正式可用。」

翻譯一下就是:微軟現在不是把 Linux 當成隨便可替換的底座,而是直接把它放進 AI 平台的設計裡。這件事我其實很買單,因為 agent 跟雲原生工作負載都一樣,根本不在乎你的簡報做得多漂亮,它們只在乎核心行為穩不穩、映像漂不漂、補丁節奏亂不亂。

微軟把 Linux 變成 AI 基礎設施

這篇文章把 Azure Linux 4.0 和 Azure Container Linux 拉出來講,不是為了炫技,而是在講一個很現實的事:如果你要讓 AI 工作負載可預測,就先讓它跑的機器可預測。前者是 Fedora 衍生、RPM 基礎的 Linux 發行版,後者則是以 Flatcar 為基底的容器最佳化系統。它們都在往更小的套件面、更穩的供應鏈、更一致的執行特性走。

我以前看過不少團隊想在通用 Linux 發行版上硬拗出「AI-ready」平台,結果就是先刪套件、再鎖映像、最後還是被 drift 打臉。這種做法很像先把地基蓋歪,再花三個月想辦法把牆扶正。你既然已經知道目標環境,幹嘛不直接用有意見的底層?

實操寫法很簡單:如果你有 Azure 工作負載,就把 node 與 container base image 當成平台決策,不是應用團隊自由選配。把 OS 選擇寫進平台文件,固定映像來源,升級流程當成基礎設施變更來測,不要把它當平常 patch Tuesday 那種可有可無的例行事。

  • 把 package footprint 壓小,攻擊面自然也會小。
  • 映像來源要可追溯,不要靠人腦記憶。
  • Host 與 container 的假設要對齊,不然 runtime drift 會在你最忙的時候冒出來。

微軟這次押開源,不是情懷,是因為封閉堆疊很快就會卡死

這篇文章很刻意提到歷史,我覺得這不是在賣情懷,而是在補論證。文中提到 2009 年 Hyper-V driver 貢獻進 Linux kernel,接著又說 Azure 上超過三分之二的 customer cores 跑的是 Linux,還提到 Microsoft 365、GitHub、OpenAI 的 ChatGPT 背後也站在 Linux 基礎上。這些句子看起來像在自我介紹,其實是在講一件很務實的事:規模越大,越不能把基礎設施關在黑盒子裡。

我自己踩過這種坑。以前有團隊想標準化到一套 vendor-managed stack,採購簡報看起來很順,真的進到 incident review 就完全不是那回事。問題不是功能少,是你看不到失敗模式。看不到,就沒辦法一起修;沒辦法一起修,就只能一直忍。開源不會自動解決一切,但至少它讓問題可以被討論、被對齊、被往上游修。

實操寫法是:你在選 AI 或 agent 平台元件時,直接問三個問題。第一,我能不能檢視它?第二,我能不能往上游貢獻?第三,我能不能在不重寫應用的情況下換掉它?如果三題都答不出來,你買的不是基礎設施,你買的是依賴焦慮。

  • 優先挑有活躍上游治理的專案。
  • 看你的供應商是貢獻者還是純消費者。
  • 只要 agent 會跨雲、跨 runtime,移植性就不該是附加題。

Agent 需要 runtime,但更需要契約

這篇最有意思的地方,是它沒有把 agent 當成一個漂亮的應用層名詞而已。微軟明講:從 cloud native 走到 AI native,是開源下一步的演化,而且 AI 也正在改變開源的建造方式。維護者已經開始用 coding agent 做 issue triage、產測試、review pull request;agentic 工具也開始接手 dependency update 和安全修補。這些都不難理解,因為這些事情本來就很適合自動化。

微軟把 Linux 變成 AI 基礎設施

但麻煩從這裡開始。當 agent 真正開始做事,你就不能只問它會不會做,還要問:誰批准的?哪個 policy 管的?事後怎麼 audit?這些如果不先定義,agent 只是把混亂自動化而已。我看過太多團隊在 demo 階段很爽,等到第一次安全審查就整個卡住,因為根本沒人說得出決策路徑。

文章裡點名了幾個微軟押的元件:Semantic KernelAutoGen、新的 Microsoft Agent Framework,還有 RayNVIDIA Dynamo、A2A 協定,以及 Agent Governance Toolkit。這些名字放在一起,意思很清楚:微軟想把「agent」從會聊天的 demo 名詞,變成有生命週期、可觀測、可控管的系統。

實操寫法:你如果也在做 agent 系統,請把 runtime 跟 controls 分開。前者管規劃、執行、工具呼叫;後者管身分、權限、記錄、審核。這兩層如果硬塞在一起,等你第一次碰到資安 review,會痛到懷疑人生。

互通性不是加分題,是多代理系統的命根子

文章對 Linux FoundationAgentic AI Foundation 的著墨很多。微軟說 AAIF 已經是 Linux Foundation 歷史上成長最快的專案之一,目標是定義 agent-to-agent communication、agent runtime、orchestration 的開放標準。這段我看了很有感,因為 agent 領域最容易出現的爛戲,就是每家都想發明自己的私有協定。

我見過太多「平台策略」最後變成翻譯層地獄。今天一個團隊做一個 agent,明天另一個團隊做另一個,最後整個組織要自己維護一層沒人想碰的轉接器。標準很無聊,但標準會救你。尤其當你不只一個 agent,不只一個供應商,不只一個 runtime 的時候,互通性就不是願景,是生存條件。

這篇把 AAIF 跟 CNCF 類比,我覺得很準。Kubernetes 之所以能進企業,不是因為它看起來很潮,而是因為生態系終於在周邊原語上形成共識。agent 也會走同一條路。如果它們不能跨框架、跨雲、跨語言乾淨溝通,那每個多代理部署最後都會變成客製整合案。

實操寫法:你在評估 agent 工具時,先看它講的是不是開放介面,而不是只會講自己的方言。如果你的 roadmap 會有多個團隊、不同供應商的 agent,一開始就把 protocol compatibility 當成硬需求,不要等到第二個整合案才發現自己蓋了圍牆。

  • 要求 agent 之間有清楚的訊息格式與錯誤回傳規則。
  • 不要接受只能在單一框架內跑的黑箱協定。
  • 把跨框架互通列進平台驗收條件。

安全不是收尾工作,agent 一有自主權就得先管住

這段是我最在意的。微軟直接說,保護開源現在不是 hygiene,而是讓 AI agent 真正做事的前提。這句話比很多 AI security 的空話都實際。文章點名 OpenSSFAlpha-Omega,也提到微軟做了分階段投資:先透過專家參與與自動化測試改善安全姿態,再投入第二輪去擴大可持續、以 AI 驅動的開源安全方案。它還提到 GitHub Secure Open Source Fund,每個專案提供 10,000 美元,外加三週教育、導師、工具與 check-in。

翻譯一下就是:微軟把 maintainer 當成供應鏈安全的一部分,而不是把他們當免費勞工。這點我覺得很對。你不可能靠對志願者大吼大叫來保護供應鏈,你只能把維護者當成真正的控制面,然後用資源和自動化把重複性的風險壓下去。

我自己待過那種把「安全」當季度報表的團隊,最後都很像在做道德管理,不是在做風險管理。只要 agent 開始能更新依賴、開 PR、修 container,你的信任模型就不能再靠手感。它必須從第一天就可機器讀取、可稽核、可追蹤。

實操寫法:先定 agent 能做什麼、不能做什麼,再讓它碰 production。每個 agent 產生的變更都要記錄 actor、tool、policy decision、timestamp;高風險動作要有人審;SBOM 與 provenance 檢查不能關。如果 agent 能改 code,它也能在你沒設防的時候幫你製造下一個 incident。

我最信的,其實是微軟列出的上游清單

文章最後列了一長串微軟有貢獻的專案:Kubernetes、Helm、containerd、Istio、Envoy、OpenTelemetry、ArgoCD、OPA Gatekeeper、Cilium、Dapr、KAITO、KubeFleet、Radius、Drasi、Copacetic、Dalec、Flatcar、Headlamp、Inspektor Gadget。老實說,不是每個名字都跟每個團隊有關,但這串清單很有用,因為它直接把微軟眼中的真實工作地圖攤開來了。

重點不在某個炫的 agent app,而是在底下那堆 plumbing:runtime、observability、policy、patching、dashboard。這就是我會信的地方。因為只要你真的跑過 production,就知道最常出事的不是那個會講話的層,而是下面那些沒人想碰、但一斷就全倒的層。

實操寫法:你也可以照這個方式盤點自己的 stack。把依賴的上游專案列出來,然後標記它們屬於 runtime、policy、安全、觀測、部署哪一類。如果你沒辦法一次畫完這張圖,代表你的平台比你以為的還脆。

可抄的模板

# Agentic 平台藍圖:給開源團隊直接用的版本

## 1) 底層作業系統
- 使用精簡、強化過的 Linux 發行版做 node 與 container base image。
- 固定映像來源,並公開升級策略。
- 把 host OS 變更視為平台變更,不是應用團隊的小修小補。

## 2) 執行層
- 將 agent 執行與治理分開。
- 規劃、工具呼叫、狀態管理放在同一層。
- 身分、政策、稽核、存取控制放在另一層。

## 3) 互通性
- 要求 agent-to-agent communication 使用開放介面與標準協定。
- 除非能清楚轉譯,否則不要用供應商私有訊息格式。
- 文件要寫清楚 agent 如何跨框架、跨雲、跨語言移動。

## 4) 安全控制
- 所有 agent 產生的變更都要有 provenance。
- 記錄每次動作的 actor、tool、policy decision、timestamp。
- 高風險操作一律要人類審核。
- 部署前先跑 SBOM、依賴掃描、映像檢查。

## 5) 上游策略
- 優先選擇有活躍上游治理的專案。
- 修補要回饋上游,不要默默分叉。
- 依 runtime、policy、安全、觀測、部署五類維護依賴地圖。

## 6) 驗收清單
- 我能不能檢視它?
- 我能不能往上游貢獻?
- 我能不能在不重寫應用的情況下換掉它?
- 我能不能在事後稽核每一次 agent 動作?
- 多個 agent 能不能不用客製轉接器就互通?

## 7) 可直接貼進文件的 policy 範本

agent_platform:
  base_os:
    distro: hardened-linux
    image_source: pinned
    upgrade_policy: platform-managed
  runtime:
    execution: isolated
    governance: separate
    identity: required
    audit_logging: enabled
  interoperability:
    protocol: open_standard
    vendor_lock_in: avoid
    cross_framework_support: required
  security:
    provenance: required
    sbom: required
    human_approval_for_high_risk: true
    dependency_scanning: required
  upstream:
    prefer_open_governance: true
    contribute_back: true
    maintain_dependency_map: true

如果是我明天要推 agentic system,我會先拿這份模板去改,再把 placeholder 換成自己實際用的技術。重點不是照抄微軟的產品,而是抄它的操作邏輯:底層先硬起來、介面先開出來、治理先寫清楚、上游先顧好。

這種東西看起來不性感,但真的能活。對我來說,這比任何「AI 會改變一切」的口號都實在。

來源致謝:本文主要拆解自 Microsoft Open Source Blog 的 From open source to agentic systems: Microsoft at Open Source Summit North America 2026,以及文中連結到的 Semantic KernelAutoGenMicrosoft Agent Framework 等公開資料;上面的模板與白話拆解是我自己的整理與延伸。