RTK 讓 Claude Code 少燒 Token
RTK 主打把 Claude Code 的重複工作搬到本機執行,官方說法可把 Token 消耗降到 20% 左右。這篇拆解它怎麼運作、跟 Cursor 和 Windsurf 比起來差在哪。

如果你的 Claude Code 帳單一直往上衝,RTK 這工具真的會讓人多看一次用量頁面。作者在中文分享裡直接講,Token 消耗有機會砍到 20% 左右。這數字很兇,但背後邏輯其實很直白。
講白了,就是把重複工作搬回本機。不要每一步都叫 LLM 用文字講一遍。能跑 shell 的就跑 shell,能讀檔的就直接讀。模型只負責判斷,不負責碎念。
這種做法很像把 AI 助手從聊天框,改造成終端機工人。你可能會想問,真的差這麼多嗎?如果你的流程本來就很 chat-heavy,答案通常是會。
RTK 到底在做什麼
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
RTK 是一個開源的 command wrapper。它用單一 init 指令,接到多種 agent 工具。這種設計很像在 AI 工具外面包一層控制層。

它的目的不是讓模型變聰明。它是讓模型少說廢話。很多 Token 都浪費在重複提示、反覆讀上下文、還有每個指令都要解釋一次。
RTK 把這些動作交給本機。模型只要看結果,再決定下一步。這對終端機工作流很合拍,也很符合開發者的直覺。
作者列的接法很短,幾個命令就能看出方向:
rtk init -g --codex給 Codexrtk init -g --opencode給 OpenCodertk init -g --agent cursor給 Cursorrtk init --agent windsurf給 Windsurf
設好後,重開 AI 工具就能繼續用。RTK 會留在背景。你看到的是 agent 在工作。真正省錢的是,那些不必進入對話的步驟。
為什麼 Token 帳單會爆得這麼快
用過 coding agent 一週的人,大概都懂那種感覺。一個小任務,最後變成長對話。模型先讀 repo,再解釋命令,再等你回覆,接著又重講一次。
這種流程很方便,但很吃 Token。尤其是大型專案。上下文一長,成本就跟著上去。你以為只是改一個檔案,結果模型把整個資料夾都重看一遍。
Claude Code 本來就是偏 terminal-first 的設計。這已經比純聊天介面省一點。RTK 再往前推一步,把例行操作交給本機執行,讓 LLM 少碰那些低價值文字。
“Claude Code is my favorite coding assistant right now.” — Simon Willison
這句話很有意思。Simon Willison 不是在吹功能。他是在點出一個現實:好用的 coding assistant,最後都會碰到成本問題。
所以 RTK 的切入點很務實。它沒說自己會生出更強的程式碼。它只說,很多沒必要的文字往返可以少掉。老實說,這往往才是錢燒最快的地方。
跟一般 agent 用法比,差在哪
把 RTK 想成控制層就對了。它不是要取代模型。它是要減少模型開口的次數。只要機器能做,就別讓 LLM 用文字做。

差別看起來不大,實際上很明顯。一般 agent 會先講命令,再等輸出,再解釋下一步。RTK 則把這些流程盡量壓到本機。少一次對話,就少一段 Token。
如果你常用 Cursor、Windsurf,或像 Codex 這種終端機 agent,差異會更有感。因為這些工具本來就靠大量互動吃飯。
可以直接拿來做個對照:
- 沒有 RTK 時,模型常要先描述命令。
- 有 RTK 時,命令能直接在本機跑。
- 沒有 RTK 時,重複讀檔會吃更多上下文。
- 有 RTK 時,模型帶著更少文字往下走。
- 沒有 RTK 時,聊天輪次容易變多。
- 有 RTK 時,很多例行步驟可被壓縮。
中文文章提到的 80% 省量,應該先當成單一使用者的實測,不要直接拿來當通則。但方向很合理。只要你把聊天雜訊拿掉,節省速度會比很多人想像快。
誰最適合先試
RTK 最適合已經天天用 AI 工具的人。尤其是會一直跑小任務的人。像是 refactor、修 bug、跑 shell 指令、檢查檔案結構,這些都很容易累積 Token。
如果你本來就喜歡終端機,這工具會特別順手。它的介面不花俏。它的價值也不在畫面漂亮。它就是要讓 agent 像背景工人,而不是像一直插話的同事。
但也有代價。任何 wrapper 都會多一層抽象。你如果很在意流程透明度,可能會覺得這種做法太黑箱。這點我覺得要老實講。
如果你想先看類似的成本控制思路,可以對照我們整理過的 Claude Code 成本控制指南。重點其實很一致:少做無效輪次,帳單就會比較正常。
這波背後的產業脈絡
現在的 AI coding 工具,幾乎都在比誰更像「會做事的助理」。但真正的商業問題不是誰會講,而是誰講得少、做得多。Token 計價一上來,這件事就變得很現實。
對開發團隊來說,成本控制不是小事。假設一個團隊 20 人,每人每天多燒 50 萬 Token,一個月下來就很有感。你不用等到帳單炸裂,財務就會先來問。
這也是為什麼本機執行、shell-native、agent wrapper 這幾個詞最近一直冒出來。大家都在找方法,把模型從「全程聊天」改成「只做判斷」。這種路線不新,但現在特別值錢。
我覺得 RTK 的意義不在於它多炫。它的價值在於,它很清楚地碰到痛點:模型太愛講話。能少講一句,就少燒一點錢。
接下來怎麼看
如果你現在就用 Claude Code 或其他 agent 工具,我會建議你先試一輪 RTK。先看自己是不是那種高互動、高重複的工作型態。只要是,省量通常會很明顯。
我的預測很直接。接下來半年,這類控制層工具會越來越多。不是因為大家突然愛寫 wrapper,而是因為 Token 成本真的會逼人想辦法。誰能把無效對話壓下來,誰就更容易留在日常工作流裡。
問題只剩一個:你的 AI 工具現在是在幫你做事,還是在幫你燒錢?如果你已經開始懷疑帳單,那 RTK 值得排進測試清單。