[AGENT] 5 分鐘閱讀OraCore 編輯部

怎麼用 Python 呼叫 Claude 4.8

這篇教你用 Python 和 Anthropic SDK 呼叫 Claude 4.8,並加入快取重用重複請求。

分享 LinkedIn
怎麼用 Python 呼叫 Claude 4.8

這篇教你用 Python 和 Anthropic SDK 呼叫 Claude 4.8,並加入快取重用重複請求。

這篇給已經會寫 Python、想把 Claude 4.8 接進應用程式的開發者。照做完,你會拿到一個可執行的 Python 範例,能發送提示詞、接收模型回覆,還能把重複請求改成快取命中。

個流程只用官方 Anthropic Python SDK,適合先做聊天助理、客服工具或內部知識問答的最小可行版本。

開始之前

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

  • Python 3.10+
  • Anthropic 帳號與 API key
  • 可連網的終端機
  • pip 23+
  • 官方文件:https://docs.anthropic.com/
  • 官方 SDK repo:https://github.com/anthropics/anthropic-sdk-python

先把 API key 放進環境變數或秘密管理工具,不要直接寫進原始碼,這樣之後搬到伺服器也能沿用同一套設定。

怎麼用 Python 呼叫 Claude 4.8

Step 1: 安裝 Anthropic SDK

這一步的目的,是先讓你的 Python 環境具備呼叫 Claude API 的能力。

pip install anthropic

安裝完成後,進入 Python 互動環境測試匯入。你應該看不到 import error,代表套件已經可以使用。

Step 2: 設定 API key 環境變數

這一步的目的,是讓程式能驗證身分,但不用把密鑰寫死在程式裡。

怎麼用 Python 呼叫 Claude 4.8
export ANTHROPIC_API_KEY="YOUR_API_KEY"

如果你在 Windows PowerShell,改用 $env:ANTHROPIC_API_KEY="YOUR_API_KEY"。你應該能在 shell 中印出這個變數,並確認內容和 Anthropic 控制台裡的 key 一致。

Step 3: 建立最小 Claude Client

這一步的目的,是先做出一個能送出單一提示詞、並印出單一回覆的 Python 腳本。

from anthropic import Anthropic
client = Anthropic(api_key="YOUR_API_KEY"ाएर)
response = client.messages.create(
    model="claude-sonnet-4-8",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Explain Claude 4.8 in one paragraph."}
    ]
)

print(response.content[0].text)

執行後,你應該看到終端機輸出一段模型生成文字,而不是 API 錯誤。這代表模型呼叫已經從程式一路通到服務端。

Step 4: 加入提示詞快取層

這一步的目的,是讓相同提示詞第二次進來時直接回傳快取,減少重複請求。

from anthropic import Anthropic

class OptimizedClient:
    def __init__(self):
        self.client = Anthropic(api_key="YOUR_API_KEY")
        self.cache = {}

    def get_response(self, prompt: str, model: str = "claude-sonnet-4-8") -> str:
        if prompt in self.cache:
            return self.cache[prompt]

        response = self.client.messages.create(
            model=model,
            max_tokens=1024,
            messages=[{"role": "user", "content": prompt}]
        )
        self.cache[prompt] = response.content[0].text
        return self.cache[prompt]

用同一個提示詞連續呼叫兩次。你應該看到兩次輸出內容相同,而且第二次不再需要打 API,而是直接從記憶體快取回傳。

Step 5: 統一模型與 token 設定

這一步的目的,是把模型名稱和輸出長度集中管理,方便你之後切換 Claude 變體。

把 model 名稱放在一個地方,避免每個呼叫點都手動改字串。把 max_tokens 調成符合任務長度的值,短摘要用較小數字,長分析再提高。

接著送一個短提示詞和一個長提示詞。你應該看到短輸入得到精簡回覆,長輸入得到較完整回覆,而且程式只需要改參數,不需要改主流程。

指標基準/優化前結果/優化後
重複提示詞處理每次都呼叫 API相同提示詞直接命中快取
程式複雜度單一直接呼叫可重用 wrapper,含快取與模型參數
重複請求成本重送一次就再耗一次 token第二次請求略過 API

常見錯誤

  • 把 API key 寫死在程式裡。修法:改用 ANTHROPIC_API_KEY 環境變數或秘密管理工具。
  • 模型名稱拼錯。修法:送出前先對照 Anthropic 文件確認 Claude 4.8 的正確 model 字串。
  • 以為相似提示詞也會命中快取。修法:先用完全相同的 prompt 當 key,若需要模糊比對,再加正規化規則。

接下來可以看什麼

下一步可以把這個範例升級成可重試、可記錄結構化 log 的版本,再接 Redis 這類持久化快取,讓 Claude 整合在重啟後也能保留命中資料。