[AGENT] 5 分鐘閱讀OraCore 編輯部

怎麼做 AI Agent 提示工程

這篇教你先定義 AI agent 的職責、系統規則、輸出格式與決策邊界,做出可測試的提示框架。

分享 LinkedIn
怎麼做 AI Agent 提示工程

這篇教你先定義 AI agent 的職責、系統規則、輸出格式與決策邊界,做出可測試的提示框架。

這篇給正在做 AI agent 的開發者看。照著做完,你會得到一套可直接上線測試的 prompt 架構,能先把角色、規則、輸出格式與邊界定清楚,再往 memory、RAG 或其他上下文層擴充。

這很重要,因為 prompt 設計是整個輸入堆疊的地基。基礎指令如果含糊,後面的歷史管理、知識注入與工具調用都更難控制,也更容易失真。

開始之前

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

  • 一個可用的 LLM 帳號,例如 OpenAI、Anthropic,或本機模型 runtime。
  • 你要測試的模型 API key。
  • Node 20+ 或 Python 3.11+,用來跑 prompt 測試腳本。
  • 支援 Markdown 與 JSON 的程式編輯器。
  • 一個 agent 任務樣本,例如分流、草擬、查詢。
  • 一個可記錄版本的地方,例如 GitHub 或簡單 changelog。

Step 1: 定義 agent 職責

這一步的產出是「單句職責聲明」,用來告訴模型自己是誰、要做什麼、成功長什麼樣。內容要具體,包含角色、任務與使用者價值,之後系統 prompt 和 user prompt 都會以它為錨點。

怎麼做 AI Agent 提示工程
You are a support triage agent. Classify each ticket, extract the core issue, and return a short next action.

驗收方式是把這句話唸出來,確認新同事能不能用一句話說出 agent 的目的。你應該看到的是明確角色,沒有混雜責任。

Step 2: 寫入系統規則

這一步的產出是「系統規則清單」,用來鎖定不可變動的行為。把語氣、安全限制、拒答條件與輸出約束放在這裡;會依任務變動的內容不要放進系統 prompt。

怎麼做 AI Agent 提示工程
System prompt example:
- Follow the user task unless it conflicts with policy.
- Output valid JSON only.
- Ask one clarifying question if the request is underspecified.
- Do not invent facts.

驗收方式是拿一個衝突型請求去測。你應該看到模型優先遵守較高層規則,維持指定格式,並且不會超出允許範圍即興發揮。

Step 3: 分離指令與資料

這一步的產出是「乾淨的指令資料邊界」,避免模型把 user content 當成新政策。請用清楚標籤、分隔符或結構化欄位,讓模型知道哪一段是指令,哪一段是 payload。

Instruction:
Summarize the ticket.

Data:
---
Customer says the login button does nothing on mobile.
---

驗收方式是在資料區塊裡放入干擾字句,例如「ignore previous instructions」。你應該看到 agent 把它當內容,而不是控制邏輯。

Step 4: 指定輸出格式

這一步的產出是「回應合約」,讓模型每次都照同一種結構輸出。請明確定義答案的欄位、順序與允許值,這能降低解析錯誤,也讓下游自動化更安全。

Return JSON with these fields:
{
  "category": "bug|question|billing|other",
  "summary": "string",
  "next_action": "string"
}

驗收方式是拿三種不同輸入去跑同一個 prompt。你應該看到每次都維持相同 schema,而且 JSON 外面沒有多餘散文。

Step 5: 加入決策邊界

這一步的產出是「可執行的限制規則」,用來定義 agent 不能做什麼。請明確寫出升級條件、低信心處理方式,以及模型何時必須停下來求助。邊界越清楚,agent 在複雜情境下越穩定。

If confidence is low, ask one clarifying question.
If the request requires external facts, say what is missing.
If the task is outside scope, refuse briefly and suggest the right path.

驗收方式是測試模糊與超出範圍的 prompt。你應該看到模型先停下來,不會亂猜,並且會給出短而一致的 fallback 回應。

指標基準/優化前結果/優化後
Prompt 模糊度角色與任務混在一起角色、規則、任務清楚分離
輸出穩定性自由格式回覆固定 JSON 合約
危險請求控制臨時性拒答明確拒答與升級規則

常見錯誤

  • 把系統規則和使用者指令混在一起。修法:把長期政策放在 system prompt,任務細節放在 user message。
  • Prompt 寫得太寬。修法:只保留一個主要職責與一個輸出合約。
  • 跳過驗證。修法:上線前先測衝突、模糊與超範圍輸入。

接下來可以看什麼

當你的 prompt 架構穩定後,下一步可以看 memory 管理、RAG 與 context engineering,讓 agent 能使用歷史與外部知識,同時不失去指令品質。