RTK 讓 Claude Code 少燒 Token

OraCore Editors

返回首頁

[CHAIN] 2026年4月1日5 分鐘閱讀OraCore 編輯部

RTK 讓 Claude Code 少燒 Token

RTK 主打把 Claude Code 的重複工作搬到本機執行，官方說法可把 Token 消耗降到 20% 左右。這篇拆解它怎麼運作、跟 Cursor 和 Windsurf 比起來差在哪。

Windsurf rtk Cursor AI coding assistant Claude Code Claude 終端機 AI 工具 Token

分享 LinkedIn

如果你的 Claude Code 帳單一直往上衝，RTK 這工具真的會讓人多看一次用量頁面。作者在中文分享裡直接講，Token 消耗有機會砍到 20% 左右。這數字很兇，但背後邏輯其實很直白。

講白了，就是把重複工作搬回本機。不要每一步都叫 LLM 用文字講一遍。能跑 shell 的就跑 shell，能讀檔的就直接讀。模型只負責判斷，不負責碎念。

這種做法很像把 AI 助手從聊天框，改造成終端機工人。你可能會想問，真的差這麼多嗎？如果你的流程本來就很 chat-heavy，答案通常是會。

RTK 到底在做什麼

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

RTK 是一個開源的 command wrapper。它用單一 init 指令，接到多種 agent 工具。這種設計很像在 AI 工具外面包一層控制層。

它的目的不是讓模型變聰明。它是讓模型少說廢話。很多 Token 都浪費在重複提示、反覆讀上下文、還有每個指令都要解釋一次。

RTK 把這些動作交給本機。模型只要看結果，再決定下一步。這對終端機工作流很合拍，也很符合開發者的直覺。

作者列的接法很短，幾個命令就能看出方向：

rtk init -g --codex 給 Codex
rtk init -g --opencode 給 OpenCode
rtk init -g --agent cursor 給 Cursor
rtk init --agent windsurf 給 Windsurf

設好後，重開 AI 工具就能繼續用。RTK 會留在背景。你看到的是 agent 在工作。真正省錢的是，那些不必進入對話的步驟。

為什麼 Token 帳單會爆得這麼快

用過 coding agent 一週的人，大概都懂那種感覺。一個小任務，最後變成長對話。模型先讀 repo，再解釋命令，再等你回覆，接著又重講一次。

這種流程很方便，但很吃 Token。尤其是大型專案。上下文一長，成本就跟著上去。你以為只是改一個檔案，結果模型把整個資料夾都重看一遍。

Claude Code 本來就是偏 terminal-first 的設計。這已經比純聊天介面省一點。RTK 再往前推一步，把例行操作交給本機執行，讓 LLM 少碰那些低價值文字。

“Claude Code is my favorite coding assistant right now.” — Simon Willison

這句話很有意思。Simon Willison 不是在吹功能。他是在點出一個現實：好用的 coding assistant，最後都會碰到成本問題。

所以 RTK 的切入點很務實。它沒說自己會生出更強的程式碼。它只說，很多沒必要的文字往返可以少掉。老實說，這往往才是錢燒最快的地方。

跟一般 agent 用法比，差在哪

把 RTK 想成控制層就對了。它不是要取代模型。它是要減少模型開口的次數。只要機器能做，就別讓 LLM 用文字做。

差別看起來不大，實際上很明顯。一般 agent 會先講命令，再等輸出，再解釋下一步。RTK 則把這些流程盡量壓到本機。少一次對話，就少一段 Token。

如果你常用 Cursor、Windsurf，或像 Codex 這種終端機 agent，差異會更有感。因為這些工具本來就靠大量互動吃飯。

可以直接拿來做個對照：

沒有 RTK 時，模型常要先描述命令。
有 RTK 時，命令能直接在本機跑。
沒有 RTK 時，重複讀檔會吃更多上下文。
有 RTK 時，模型帶著更少文字往下走。
沒有 RTK 時，聊天輪次容易變多。
有 RTK 時，很多例行步驟可被壓縮。

中文文章提到的 80% 省量，應該先當成單一使用者的實測，不要直接拿來當通則。但方向很合理。只要你把聊天雜訊拿掉，節省速度會比很多人想像快。

誰最適合先試

RTK 最適合已經天天用 AI 工具的人。尤其是會一直跑小任務的人。像是 refactor、修 bug、跑 shell 指令、檢查檔案結構，這些都很容易累積 Token。

如果你本來就喜歡終端機，這工具會特別順手。它的介面不花俏。它的價值也不在畫面漂亮。它就是要讓 agent 像背景工人，而不是像一直插話的同事。

但也有代價。任何 wrapper 都會多一層抽象。你如果很在意流程透明度，可能會覺得這種做法太黑箱。這點我覺得要老實講。

如果你想先看類似的成本控制思路，可以對照我們整理過的 Claude Code 成本控制指南。重點其實很一致：少做無效輪次，帳單就會比較正常。

這波背後的產業脈絡

現在的 AI coding 工具，幾乎都在比誰更像「會做事的助理」。但真正的商業問題不是誰會講，而是誰講得少、做得多。Token 計價一上來，這件事就變得很現實。

對開發團隊來說，成本控制不是小事。假設一個團隊 20 人，每人每天多燒 50 萬 Token，一個月下來就很有感。你不用等到帳單炸裂，財務就會先來問。

這也是為什麼本機執行、shell-native、agent wrapper 這幾個詞最近一直冒出來。大家都在找方法，把模型從「全程聊天」改成「只做判斷」。這種路線不新，但現在特別值錢。

我覺得 RTK 的意義不在於它多炫。它的價值在於，它很清楚地碰到痛點：模型太愛講話。能少講一句，就少燒一點錢。

接下來怎麼看

如果你現在就用 Claude Code 或其他 agent 工具，我會建議你先試一輪 RTK。先看自己是不是那種高互動、高重複的工作型態。只要是，省量通常會很明顯。

我的預測很直接。接下來半年，這類控制層工具會越來越多。不是因為大家突然愛寫 wrapper，而是因為 Token 成本真的會逼人想辦法。誰能把無效對話壓下來，誰就更容易留在日常工作流裡。

問題只剩一個：你的 AI 工具現在是在幫你做事，還是在幫你燒錢？如果你已經開始懷疑帳單，那 RTK 值得排進測試清單。

// 相關文章

RTK 讓 Claude Code 少燒 Token

RTK 到底在做什麼

訂閱 AI 趨勢週報

為什麼 Token 帳單會爆得這麼快

跟一般 agent 用法比，差在哪

誰最適合先試

這波背後的產業脈絡

接下來怎麼看

Web3 溝通正在變成信任基礎設施

為什麼 Base 的 x402 協議比 1 億美元里程碑更重要

Gala Games 在 Web3 遊戲找回存在感

為什麼 Lace 2.0 比 Cardano 下一次硬分叉更重要

為什麼 Ethereum Treasury Buying 正在變成一筆差勁的長…

Yakovenko 警告：AI 可能破解 PQC 錢包