[CHAIN] 5 分鐘閱讀OraCore 編輯部

RTK 讓 Claude Code 少燒 Token

RTK 主打把 Claude Code 的重複工作搬到本機執行,官方說法可把 Token 消耗降到 20% 左右。這篇拆解它怎麼運作、跟 Cursor 和 Windsurf 比起來差在哪。

分享 LinkedIn
RTK 讓 Claude Code 少燒 Token

如果你的 Claude Code 帳單一直往上衝,RTK 這工具真的會讓人多看一次用量頁面。作者在中文分享裡直接講,Token 消耗有機會砍到 20% 左右。這數字很兇,但背後邏輯其實很直白。

講白了,就是把重複工作搬回本機。不要每一步都叫 LLM 用文字講一遍。能跑 shell 的就跑 shell,能讀檔的就直接讀。模型只負責判斷,不負責碎念。

這種做法很像把 AI 助手從聊天框,改造成終端機工人。你可能會想問,真的差這麼多嗎?如果你的流程本來就很 chat-heavy,答案通常是會。

RTK 到底在做什麼

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

RTK 是一個開源的 command wrapper。它用單一 init 指令,接到多種 agent 工具。這種設計很像在 AI 工具外面包一層控制層。

RTK 讓 Claude Code 少燒 Token

它的目的不是讓模型變聰明。它是讓模型少說廢話。很多 Token 都浪費在重複提示、反覆讀上下文、還有每個指令都要解釋一次。

RTK 把這些動作交給本機。模型只要看結果,再決定下一步。這對終端機工作流很合拍,也很符合開發者的直覺。

作者列的接法很短,幾個命令就能看出方向:

  • rtk init -g --codexCodex
  • rtk init -g --opencodeOpenCode
  • rtk init -g --agent cursorCursor
  • rtk init --agent windsurfWindsurf

設好後,重開 AI 工具就能繼續用。RTK 會留在背景。你看到的是 agent 在工作。真正省錢的是,那些不必進入對話的步驟。

為什麼 Token 帳單會爆得這麼快

用過 coding agent 一週的人,大概都懂那種感覺。一個小任務,最後變成長對話。模型先讀 repo,再解釋命令,再等你回覆,接著又重講一次。

這種流程很方便,但很吃 Token。尤其是大型專案。上下文一長,成本就跟著上去。你以為只是改一個檔案,結果模型把整個資料夾都重看一遍。

Claude Code 本來就是偏 terminal-first 的設計。這已經比純聊天介面省一點。RTK 再往前推一步,把例行操作交給本機執行,讓 LLM 少碰那些低價值文字。

“Claude Code is my favorite coding assistant right now.” — Simon Willison

這句話很有意思。Simon Willison 不是在吹功能。他是在點出一個現實:好用的 coding assistant,最後都會碰到成本問題。

所以 RTK 的切入點很務實。它沒說自己會生出更強的程式碼。它只說,很多沒必要的文字往返可以少掉。老實說,這往往才是錢燒最快的地方。

跟一般 agent 用法比,差在哪

把 RTK 想成控制層就對了。它不是要取代模型。它是要減少模型開口的次數。只要機器能做,就別讓 LLM 用文字做。

RTK 讓 Claude Code 少燒 Token

差別看起來不大,實際上很明顯。一般 agent 會先講命令,再等輸出,再解釋下一步。RTK 則把這些流程盡量壓到本機。少一次對話,就少一段 Token。

如果你常用 CursorWindsurf,或像 Codex 這種終端機 agent,差異會更有感。因為這些工具本來就靠大量互動吃飯。

可以直接拿來做個對照:

  • 沒有 RTK 時,模型常要先描述命令。
  • 有 RTK 時,命令能直接在本機跑。
  • 沒有 RTK 時,重複讀檔會吃更多上下文。
  • 有 RTK 時,模型帶著更少文字往下走。
  • 沒有 RTK 時,聊天輪次容易變多。
  • 有 RTK 時,很多例行步驟可被壓縮。

中文文章提到的 80% 省量,應該先當成單一使用者的實測,不要直接拿來當通則。但方向很合理。只要你把聊天雜訊拿掉,節省速度會比很多人想像快。

誰最適合先試

RTK 最適合已經天天用 AI 工具的人。尤其是會一直跑小任務的人。像是 refactor、修 bug、跑 shell 指令、檢查檔案結構,這些都很容易累積 Token。

如果你本來就喜歡終端機,這工具會特別順手。它的介面不花俏。它的價值也不在畫面漂亮。它就是要讓 agent 像背景工人,而不是像一直插話的同事。

但也有代價。任何 wrapper 都會多一層抽象。你如果很在意流程透明度,可能會覺得這種做法太黑箱。這點我覺得要老實講。

如果你想先看類似的成本控制思路,可以對照我們整理過的 Claude Code 成本控制指南。重點其實很一致:少做無效輪次,帳單就會比較正常。

這波背後的產業脈絡

現在的 AI coding 工具,幾乎都在比誰更像「會做事的助理」。但真正的商業問題不是誰會講,而是誰講得少、做得多。Token 計價一上來,這件事就變得很現實。

對開發團隊來說,成本控制不是小事。假設一個團隊 20 人,每人每天多燒 50 萬 Token,一個月下來就很有感。你不用等到帳單炸裂,財務就會先來問。

這也是為什麼本機執行、shell-native、agent wrapper 這幾個詞最近一直冒出來。大家都在找方法,把模型從「全程聊天」改成「只做判斷」。這種路線不新,但現在特別值錢。

我覺得 RTK 的意義不在於它多炫。它的價值在於,它很清楚地碰到痛點:模型太愛講話。能少講一句,就少燒一點錢。

接下來怎麼看

如果你現在就用 Claude Code 或其他 agent 工具,我會建議你先試一輪 RTK。先看自己是不是那種高互動、高重複的工作型態。只要是,省量通常會很明顯。

我的預測很直接。接下來半年,這類控制層工具會越來越多。不是因為大家突然愛寫 wrapper,而是因為 Token 成本真的會逼人想辦法。誰能把無效對話壓下來,誰就更容易留在日常工作流裡。

問題只剩一個:你的 AI 工具現在是在幫你做事,還是在幫你燒錢?如果你已經開始懷疑帳單,那 RTK 值得排進測試清單。