[IND] 6 分鐘閱讀OraCore 編輯部

AI 代理人開始做真工作

安全、會計和基礎架構團隊已開始上線 AI 代理人。新工具顯示,治理、稽核與信任,比噱頭更重要。

分享 LinkedIn
AI 代理人開始做真工作

這週很明顯。AI 代理人不再只在 demo 裡跑。CodenotaryQualysFloQastOracle 都把產品推進到企業流程裡。說白了,就是讓軟體去做原本卡在人類待辦清單的事。

這件事不只是技術新聞。企業現在問的不是「代理人會不會寫幾行程式」。他們問的是,誰能管它、怎麼限制它、出事怎麼追、以及它能碰哪些資料。這些問題比模型參數更實際。

而且,這波不是單一產品秀。安全、會計、資料庫、伺服器管理,全都開始接上 AI 代理人。這代表市場已經從「能不能做」走到「怎麼上線」。

安全先卡住,其他才有戲

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

這週最硬的主題是安全。Nudge Security 推出新的發現工具,用來找出員工自己建立的 AI 代理人。這很重要,因為影子 AI 正在變成影子自動化。風險不是想像出來的。

AI 代理人開始做真工作

數字也很直接。文中提到,80% 的組織已經看到 AI 代理人權限過大的風險。這不是小問題。這會直接影響採購、資安政策,甚至法務審查。講白了,沒有控管,很多公司根本不敢放行。

AgentMon 會追蹤代理人做了什麼、碰了哪些檔案、資料流到哪裡。Astrix Security 也把平台擴充到阻擋未授權的代理人部署。Black Duck 推出 Signal,盯住 CI/CD 裡的 AI 產碼。Palo Alto Networks 則把 Prisma AIRS 3.0 拉進自主 AI 系統防護。

  • 80% 的組織已看到 AI 代理人風險
  • AgentMon 追蹤行為、檔案與資料流向
  • Prisma AIRS 3.0 鎖定自主 AI 的防護
  • Black Duck Signal 盯 AI 產碼流程

這裡的重點很現實。企業買單的,不是會聊天的模型。企業買單的是稽核軌跡、權限控管、政策執行。你如果說不清楚代理人剛剛做了什麼,資安和法遵很快就會把你擋下來。

信任不是口號,是可讀性

信任是第二個卡點,而且更微妙。喬治亞理工的研究發現,年長者在 AI 代理人有清楚解釋時,會更願意信任它。單純丟一個「92% 確定」的分數,反而可能沒用,因為使用者不知道這個判斷怎麼來的。

這跟產品設計很一致。人們可以接受自動化,但前提是流程看得懂。只要代理人像黑盒子,尤其碰到醫療、財務、薪資這種場景,大家就會縮手。這很正常,因為出錯成本太高。

“The more complex the algorithm is, the more important it is to explain how it works.” — Fei-Fei Li

這句話現在還是很準。尤其當公司把代理人接進原本由員工處理的流程時,更需要能說明來源、依據、限制。能講清楚,它才比較像工具。講不清楚,它就像一個會亂按按鈕的實習生。

這週也看到另一種做法。IBMAuth0Yubico 合作做人為確認機制。高風險動作要真人批准,像是付款、改權限、送出敏感決策。這種設計很土,但很有用。

真正能賣的,是任務型代理人

這波市場也很務實。一般型代理人很會講故事,但任務型代理人比較好賣。Qualys Agent Val 會找安全問題,還能自動修一部分。FloQast Visual Agent Builder 讓會計團隊用拖拉方式做自訂代理人。Oracle AI Database 26ai 則把持久記憶和無程式碼 Private Agent Factory 放進企業流程。

AI 代理人開始做真工作

價格也開始變得很像正式軟體,而不是試驗品。Klient PSA 要在三週內推出 Hybrid Project Delivery,裡面有 8 個專門 AI 代理人一起跑。定價是每位使用者每月 15 美元,外加每個 AI 代理人一次性 1,000 美元。這種寫法很直接,代表代理人已經變成帳單上的一個欄位。

數據也很能說明問題。Fujitsu 的 Application Transform 宣稱,讀舊程式碼、寫設計文件的速度快了 97%。它還說文件品質提升 60%,完整度提升 95%。另外,69% 的分析團隊已經在用 AI 流程,44% 則已經在跑代理人平台。這些都不是邊角料數字。

  • Klient PSA:每人每月 15 美元,外加每個代理人 1,000 美元
  • Fujitsu:設計文件產出快 97%
  • Fujitsu:文件品質提升 60%
  • 分析團隊:69% 已用 AI 流程,44% 已跑代理平台

當然,代理人越多,不代表結果越好。先前也有觀察提到,多代理系統常常比單一代理人更差,因為它們不太會向專長讓路。這點很刺耳,但很真。很多團隊只是因為架構名字聽起來很猛,就急著多塞幾個 agent

這週透露的,是下一階段的市場樣子

真正的變化,不是 AI 代理人出現了。是公司開始補齊周邊機制。像是監控、批准、記憶、協調、成本控制,這些都一起上桌。Samsara 在看車隊和機器人的 physical AI。LG InnotekApplied Intuition 把感測器和模擬接到自駕車。NVIDIA 也在跟能源公司做 AI factories,讓算力像電網資產一樣被管理。

這代表什麼?代表代理人正在變成 production software。不是聊天機器人加權限。真正會贏的團隊,會很快回答 4 個問題:它做了什麼、為什麼這樣做、誰批准的、花了多少錢。答不出來,就很難擴大。

如果你這季要評估 AI 代理人,我會建議先選一個重複流程,再加一層控制。挑輸入清楚、輸出清楚、而且有真人負責的任務。先跑小範圍,再看例外處理。這樣比較不會把公司資料直接丟去賭。

我的判斷很簡單。接下來 12 個月,最有價值的代理人產品,不會是最會講 AGI 的那種。會是最無聊、最穩、最能交代責任的那種。它們會默默縮短審核時間、抓出政策違規、留下完整紀錄。這才是企業真的會掏錢的地方。

台灣團隊接下來該看什麼

台灣公司如果想跟上,重點不是先做一個很炫的 agent demo。先看資料權限、API 紀錄、以及誰能按下送出鍵。這三件事沒處理好,後面再多模型都沒用。

我覺得最先落地的,會是客服、內部稽核、財務對帳、和雲端維運。這些工作都有固定規則,也有清楚例外。很適合先用 AI 代理人做半自動流程,再慢慢拉高自治程度。

如果你是工程團隊,現在就可以問一個問題:我們的 LLM 只是會回答,還是能留下可追蹤的工作紀錄?差別就在這裡。前者是玩具,後者才像能上線的軟體。