[AGENT] 10 分鐘閱讀OraCore 編輯部

Claude 開始幫你操作電腦

Anthropic 正在測試 Claude 的新功能。你用手機下指令,它就能在你的電腦上開 App、用瀏覽器、改檔案、填試算表。重點不只是炫技,而是 AI agent 正從聊天框走向真正代勞的軟體。

分享 LinkedIn
Claude 開始幫你操作電腦

Anthropic 最近秀了一個新功能。你人在外面,只要用手機丟一句話,Claude 就能直接操作你自己的電腦,把事情做完。

示範很生活化。使用者快遲到,請 Claude 把簡報匯出成 PDF,再附到會議邀請裡。Claude 在桌機上自己完成整套流程。講白了,這已經不是「告訴你怎麼做」,而是「它去幫你做」。

這件事看起來像小更新,其實很有火藥味。各家 AI 公司都想把產品從聊天視窗,推到會點按鈕、開軟體、改檔案、收尾雜事的 agent。誰先把這段做穩,誰就更接近下一個主戰場。

Claude 正往真正 agent 靠近

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

這次功能的核心很直接。手機上的 prompt,會轉成你電腦上的實際操作。Anthropic 說,Claude 可以開啟應用程式、使用 web browser,也能填寫 spreadsheets。

Claude 開始幫你操作電腦

它不是單獨存在的功能。Anthropic 還把這套能力跟 Dispatch 接在一起。Dispatch 是上週在 Claude Cowork 推出的功能,讓使用者能在手機和桌機之間持續對話,任務也能一路接著做,不會每次都從頭講。

我覺得這個方向比單純聊天合理很多。過去很多 agent 產品停在 demo,或是工程師自己玩的 workflow。現在 Claude 直接碰你的真實電腦,產品主張就清楚了:它不是助手口頭建議,而是數位工讀生真的下去跑流程。

  • 使用者可從智慧型手機指派任務
  • Claude 會在使用者的電腦上執行動作
  • 可開 App、瀏覽網頁、填試算表
  • 官方示範包含匯出 PDF 與附加到會議邀請

當然,這裡最敏感的點也是最現實的點。Anthropic 說,Claude 在存取新的 App 前會先要求權限。這個設計很重要,因為 AI 一旦能控制你的機器,方便和風險就會一起往上升。

你可能會想問,這跟遠端桌面有什麼差別。差別在意圖理解。遠端桌面是你自己操作,Claude 這種 agent 則是理解任務後,自行拆步驟、找按鈕、處理中間流程。少掉的是你手動切換視窗的時間,多出來的是信任成本。

還有一個點不能忽略。桌面環境比 API 世界髒很多。API 是規格化的,桌面不是。按鈕位置會變,彈窗會跳,版本會不同,檔名也會撞。Claude 現在敢跨進這塊,代表 Anthropic 想吃的是更接近一般上班族日常工作的場景。

OpenClaw 爆紅後,大家都加速了

Anthropic 這個時間點出手,不太可能是巧合。今年 agentic AI 會突然變得這麼熱,OpenClaw 爆紅是很大的原因。它可以接 OpenAI 和 Anthropic 的模型,使用者透過 WhatsApp、Telegram 這類訊息 App 就能叫它做事。

OpenClaw 有一個很聰明的設計。它跑在使用者本機,能碰到本地檔案,也拿得到裝置上的上下文。這件事很關鍵,因為很多真實工作都卡在「知道你電腦裡有什麼」和「真的能動那些檔案」。如果 AI 只活在雲端聊天框,很多任務根本碰不到。

市場節奏明顯被拉快了。Nvidia 執行長 Jensen Huang 上週接受 CNBC 採訪時,直接說 OpenClaw 是「definitely the next ChatGPT」。這句話有點浮誇,但也說明大公司已經把 agent 當成主線,不是實驗室玩具。

“Definitely the next ChatGPT.”

Jensen Huang,Nvidia CEO,接受 CNBC 採訪談 OpenClaw

另一個訊號更直接。OpenAI 上個月找來 OpenClaw 創辦人 Peter Steinberger,公開說要推進「next generation of personal agents」。你看到這兩件事擺在一起,就知道現在不是誰先做聊天機器人,而是誰先把 AI 變成可交辦工作的個人軟體。

對 Anthropic 來說,壓力很現實。Claude 如果只是加入同一段討論,沒有意義。它得證明自己做事更準、出錯更少、權限管理更清楚,使用者才敢真的讓它碰檔案、碰日曆、碰工作資料。

說真的,這波競爭看起來像模型戰,實際上更像產品戰。模型能力差不多時,誰的介面更順、權限更細、失敗時更好救,使用者就會往哪邊靠。OpenClaw 把市場打熱後,Anthropic 現在等於被迫把 Claude 往前推一大步。

真正難的不是 demo,而是穩定度

Anthropic 自己也講得很保守。公司說,computer use 這塊還很早,成熟度還比不上 Claude 在寫程式或文字互動上的能力。它也提醒,Claude 仍可能犯錯,威脅模型也一直在變,防護得持續更新。

Claude 開始幫你操作電腦

這種保守不是場面話。桌面操作聽起來簡單,做起來超麻煩。按鈕位置會動,權限可能過期,網頁會跳 cookie 視窗,檔案名稱長得像雙胞胎,瀏覽器分頁一多就亂成一團。人類能快速補救,是因為我們知道自己想達成什麼。AI agent 還得慢慢證明它也有這種回復能力。

你把情境換成真實辦公室就更明顯。不是每個任務都像官方 demo 那麼乾淨。很多時候你的桌面有 18 個檔案版本,簡報裡還有沒更新的圖,Slack 正在跳通知,Outlook 又提醒登入過期。這種亂流才是 agent 真正要面對的日常。

  • Anthropic 明講功能仍在早期階段
  • Claude 可能犯錯
  • 公司表示已有 safeguard 降低風險
  • 存取新 App 前會先請求權限

所以重點根本不是 Claude 能不能完成一個漂亮 demo。重點是,它能不能在真實機器、真實檔案、半完成工作和各種小意外裡,還是把事情收好。這差很多。

我覺得 agent 產品最容易翻車的地方,就是「差一步」。它做了 90%,看起來很神,但最後 10% 需要人工救援。偏偏辦公室裡最花時間的,就是那些最後 10%。如果 Claude 每三次就卡一次,大家很快就會回去自己拿滑鼠。

安全面也不能輕鬆看。桌面控制牽涉到個人資料、公司機密、登入憑證,還有各種內部文件。只要權限提示不夠清楚,或操作紀錄不夠完整,企業 IT 部門大概第一時間就會皺眉。這不是模型分數高就能自動過關的問題。

跟競品比,Claude 走的是生態整合路線

Anthropic 不是第一個做這件事,但它切入的角度有點不同。OpenClaw 受歡迎,是因為它直接進到大家本來就在用的訊息 App,入口非常低。你不用學新介面,傳訊息就能叫它做事。這招很接地氣。

Claude 現在則是把「傳訊息交辦工作」這件事,綁得更靠近自家產品。透過 Dispatch 和 Claude Cowork,它想做的是跨裝置持續協作。手機下指令,桌機執行,對話脈絡還能保留。這比較像完整工作流,而不是單次任務機器人。

企業市場也開始動了。Nvidia 上週發布 NemoClaw,也就是 OpenClaw 的企業版。這個訊號很明白:公司不是只想要會聊天的助理,它們要的是可管理、可稽核、可控權限的 agent 工具。Claude 的桌面控制功能如果能把這幾點做好,就很有機會切進辦公場景。

  • Anthropic Claude: 手機 prompt 觸發電腦操作,可開 App、瀏覽網頁、編輯試算表
  • OpenClaw: 透過 WhatsApp、Telegram 等訊息 App 使用,跑在本機裝置
  • NemoClaw: Nvidia 上週公布的企業版 OpenClaw
  • OpenAI: 上月延攬 Peter Steinberger,主攻 personal agents

如果再往產品策略看,Claude 的優勢可能在一致性。很多使用者本來就拿 Claude 寫文件、整理資料、寫程式。現在再加上桌面操作,等於從「幫你想」延伸到「幫你做」。工作流會比較連續。

但它的劣勢也很清楚。OpenClaw 靠訊息 App 這條路,入口更自然。很多人每天打開 WhatsApp、Telegram 的次數,可能比打開 Claude 還多。誰離使用者原本習慣更近,誰就比較容易拿到第一批高頻使用。

商業上,最後比的可能不是模型本身,而是整體成本和導入難度。企業會問得很現實:能不能看 log、能不能限制哪些 App 可用、能不能指定哪些資料夾不能碰、出錯時誰負責。這些問題答不出來,再強的 demo 也很難進公司。

所以我會這樣看。Anthropic 押對方向了,但這個類別最後贏家,多半不是最會秀影片的那家,而是最會處理瑣碎細節的那家。權限提示、錯誤回復、App 相容性、操作紀錄、信任設計,這些聽起來很無聊,卻決定產品能不能活下來。

為什麼現在大家都在搶桌面 agent

這波桌面 agent 熱潮,背後其實是聊天機器人進入瓶頸。單純問答已經很成熟,使用者也慢慢習慣了。接下來要繼續提高黏著度,最直接的方法就是幫人省更多操作時間。從回答問題,走到代替點擊,商業價值就差很多。

對一般上班族來說,最煩的工作常常不是寫內容,而是整理格式、搬資料、附檔案、改行事曆、查網站、貼回試算表。這些事單次只花 2 分鐘,但一天累積 20 次,就是 40 分鐘。agent 如果能穩定吃掉這些零碎時間,大家自然會留下來。

對軟體公司來說,桌面 agent 也比純聊天更有防守力。聊天模型很容易被替換,今天用 Claude,明天換 GPT,對多數人差異沒那麼大。但一旦產品深入你的工作流、檔案系統、權限設定和日常習慣,切換成本就會上升。這才是各家真正想拿到的位置。

還有一點很現實。企業願意付錢的,通常不是「看起來聰明」,而是「真的省工時」。如果一個 agent 每位員工每週能省 2 到 3 小時,乘上 100 人團隊,就是每週 200 到 300 小時。這種數字拿去跟採購談,比模型 benchmark 漂亮多了。

台灣市場也不會缺席。很多中小企業沒有完整自動化系統,反而更依賴 Excel、瀏覽器、郵件和舊版桌面軟體。這種環境對 API 很不友善,卻很適合桌面 agent。因為它不要求你先把整家公司系統重做一遍,只要能在既有流程上幫忙點、幫忙填、幫忙整理,就有價值。

但這也表示,產品要面對更多雜訊。台灣辦公室常見的舊系統、混合語系介面、權限分級混亂、檔案命名沒規則,這些都會讓 agent 難度暴增。誰能在這種環境裡還保有穩定度,才真的有本事。

接下來要看什麼

短期最值得看的指標很簡單。Claude 能不能把重複性辦公任務做到讓人一週後還願意繼續用。一次成功不難,難的是不同 App、不同檔案系統、不同權限狀態下,還能維持穩定。

我預測接下來幾個月,競爭會集中在兩件事。第一,是跟日常軟體做更深整合。第二,是把權限系統和操作紀錄做得更清楚。前者決定好不好用,後者決定敢不敢用。

如果你是開發者,現在很值得注意這個方向。你可以開始觀察兩種機會。一種是替 agent 提供更穩定的操作介面,像是桌面自動化框架、權限管理、任務回放。另一種是把你的 SaaS 做成更容易被 agent 使用,減少脆弱的 UI 依賴。

如果你是一般使用者,我的建議比較保守。先拿低風險任務測試,例如整理會議附件、匯出文件、更新試算表、查詢固定網站。不要一開始就把財務資料、合約檔案或高權限帳號丟給它。先看它犯錯的模式,再決定要不要放更多工作進去。

最後一句很直接。Claude 能不能在桌面 agent 這局站穩,不看它會不會做一場漂亮表演,而看它能不能在你最煩、最碎、最容易出包的工作裡,連續一百次都不搞砸。做得到,聊天機器人就會開始像半成品。做不到,它還是只能留在聊天框裡。