怎麼用 Python 呼叫 Claude 4.8

OraCore Editors

返回首頁

[AGENT] 2026年5月29日5 分鐘閱讀OraCore 編輯部

怎麼用 Python 呼叫 Claude 4.8

這篇教你用 Python 和 Anthropic SDK 呼叫 Claude 4.8，並加入快取重用重複請求。

API key Python cache Anthropic SDK Claude 4.8

分享 LinkedIn

這篇教你用 Python 和 Anthropic SDK 呼叫 Claude 4.8，並加入快取重用重複請求。

這篇給已經會寫 Python、想把 Claude 4.8 接進應用程式的開發者。照做完，你會拿到一個可執行的 Python 範例，能發送提示詞、接收模型回覆，還能把重複請求改成快取命中。

整個流程只用官方 Anthropic Python SDK，適合先做聊天助理、客服工具或內部知識問答的最小可行版本。

開始之前

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

Python 3.10+
Anthropic 帳號與 API key
可連網的終端機
pip 23+
官方文件：https://docs.anthropic.com/
官方 SDK repo：https://github.com/anthropics/anthropic-sdk-python

先把 API key 放進環境變數或秘密管理工具，不要直接寫進原始碼，這樣之後搬到伺服器也能沿用同一套設定。

Step 1: 安裝 Anthropic SDK

這一步的目的，是先讓你的 Python 環境具備呼叫 Claude API 的能力。

pip install anthropic

安裝完成後，進入 Python 互動環境測試匯入。你應該看不到 import error，代表套件已經可以使用。

Step 2: 設定 API key 環境變數

這一步的目的，是讓程式能驗證身分，但不用把密鑰寫死在程式裡。

export ANTHROPIC_API_KEY="YOUR_API_KEY"

如果你在 Windows PowerShell，改用 $env:ANTHROPIC_API_KEY="YOUR_API_KEY"。你應該能在 shell 中印出這個變數，並確認內容和 Anthropic 控制台裡的 key 一致。

Step 3: 建立最小 Claude Client

這一步的目的，是先做出一個能送出單一提示詞、並印出單一回覆的 Python 腳本。

from anthropic import Anthropic

client = Anthropic(api_key="YOUR_API_KEY"ाएर)

response = client.messages.create(
    model="claude-sonnet-4-8",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Explain Claude 4.8 in one paragraph."}
    ]
)

print(response.content[0].text)

執行後，你應該看到終端機輸出一段模型生成文字，而不是 API 錯誤。這代表模型呼叫已經從程式一路通到服務端。

Step 4: 加入提示詞快取層

這一步的目的，是讓相同提示詞第二次進來時直接回傳快取，減少重複請求。

from anthropic import Anthropic

class OptimizedClient:
    def __init__(self):
        self.client = Anthropic(api_key="YOUR_API_KEY")
        self.cache = {}

    def get_response(self, prompt: str, model: str = "claude-sonnet-4-8") -> str:
        if prompt in self.cache:
            return self.cache[prompt]

        response = self.client.messages.create(
            model=model,
            max_tokens=1024,
            messages=[{"role": "user", "content": prompt}]
        )
        self.cache[prompt] = response.content[0].text
        return self.cache[prompt]

用同一個提示詞連續呼叫兩次。你應該看到兩次輸出內容相同，而且第二次不再需要打 API，而是直接從記憶體快取回傳。

Step 5: 統一模型與 token 設定

這一步的目的，是把模型名稱和輸出長度集中管理，方便你之後切換 Claude 變體。

把 model 名稱放在一個地方，避免每個呼叫點都手動改字串。把 max_tokens 調成符合任務長度的值，短摘要用較小數字，長分析再提高。

接著送一個短提示詞和一個長提示詞。你應該看到短輸入得到精簡回覆，長輸入得到較完整回覆，而且程式只需要改參數，不需要改主流程。

指標	基準／優化前	結果／優化後
重複提示詞處理	每次都呼叫 API	相同提示詞直接命中快取
程式複雜度	單一直接呼叫	可重用 wrapper，含快取與模型參數
重複請求成本	重送一次就再耗一次 token	第二次請求略過 API

常見錯誤

把 API key 寫死在程式裡。修法：改用 ANTHROPIC_API_KEY 環境變數或秘密管理工具。
模型名稱拼錯。修法：送出前先對照 Anthropic 文件確認 Claude 4.8 的正確 model 字串。
以為相似提示詞也會命中快取。修法：先用完全相同的 prompt 當 key，若需要模糊比對，再加正規化規則。

接下來可以看什麼

下一步可以把這個範例升級成可重試、可記錄結構化 log 的版本，再接 Redis 這類持久化快取，讓 Claude 整合在重啟後也能保留命中資料。

// 相關文章

怎麼用 Python 呼叫 Claude 4.8

開始之前

訂閱 AI 趨勢週報

Step 1: 安裝 Anthropic SDK

Step 2: 設定 API key 環境變數

Step 3: 建立最小 Claude Client

Step 4: 加入提示詞快取層

Step 5: 統一模型與 token 設定

常見錯誤

接下來可以看什麼

Claude Code 動態工作流：AI 自寫 Harness

企業 AI 缺的是編排層

AI 代理用區塊鏈當信任層

8 種 RAG 模式把 Demo 變上線

當目標是文風不是事實時，微調比 RAG 更有效

OpenClaw把AI變成夜班員工