怎麼用 Amazon Nova 2 做審核
用 Amazon Bedrock 上的 Amazon Nova 2 Lite,透過結構化提示詞建立可解析的內容審核流程。

這篇教你用 Amazon Nova 2 Lite 在 Bedrock 上建立可解析的內容審核提示詞流程。
這篇給需要實作內容審核、但不想先走微調路線的開發者。照著做完,你會拿到一份可維護的審核政策、可直接丟進應用程式的 JSON 或 XML 提示詞格式,以及一個可重複測試的驗證流程。
做法參考 AWS 官方文章 Prompting Amazon Nova 2 for content moderation 與 MLCommons AILuminate repository,但你可以把分類換成自己的社群規範、商店政策或客服規則。重點是把規則寫進提示詞,讓你之後只改政策文字,不必重訓模型。
開始之前
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
- 一個 AWS 帳號
- 可用的 Amazon Bedrock 文件 與已啟用 Bedrock 的 AWS Region
- 可呼叫 Amazon Nova 2 Lite 的 Bedrock 權限
- AWS CLI v2,若你要先用終端機測試
- Node 20+ 或 Python 3.11+,若你要做應用程式整合
- 你的審核政策文字,或 AILuminate v1.1 分類作為起點
- AWS access key 與 secret access key,若你不使用 IAM role
Step 1: 定義審核政策
目的:先建立一份單一來源的政策文件,讓模型每次都照同一套規則判斷。你可以直接採用 AILuminate 分類,也可以替換成你自己的市場刊登、社群貼文或支援對話規則。

把每個分類寫成短句,並替每個標籤補上一行定義。再加上一個不違規代碼,例如 C0,讓應用程式能把安全內容明確歸類。文字要固定,之後提示詞才好維護。
驗收:你應該看到一份精簡的政策清單,裡面有清楚標籤、定義,以及可供程式儲存或顯示的不違規代碼。
Step 2: 組出結構化提示詞
目的:做出一個能讓模型穩定輸出的提示詞,方便後端直接解析。當你的應用程式需要可讀格式時,用 JSON 或 XML,把政策、待審核內容與輸出格式分開寫。

User: You are a text content moderator that detects policy violations and explains the decision.
Return ONLY JSON with this shape:
{
"policy_violation": "Yes or No",
"category_list": ["category codes"],
"explanation": "reason"
}
If there is no violation, use "C0".
[POLICY]
{{policy definitions}}
[TEXT]
{{content to moderate}}驗收:你應該看到一段合法 JSON,只有你要求的欄位,且安全內容會回傳 C0。
Step 3: 送出提示詞到 Amazon Nova 2 Lite
目的:把審核提示詞送進 Amazon Bedrock 上的 Amazon Nova 2 Lite,先確認模型回傳格式與分類品質。先用 AWS 建議的預設推論參數,等你驗證過輸出再調整。
如果你在意吞吐量,先用 temperature 0.7、top-p 0.9 測試;若延遲比解釋細節更重要,就先把 reasoning mode 關掉。請保持請求內容精簡,只送當次判斷需要的政策。
驗收:你應該看到模型回傳違規旗標、一個或多個分類代碼,以及與輸入內容相符的簡短說明。
Step 4: 解析並分流審核結果
目的:把模型輸出轉成應用程式可執行的決策。你可以把結果固定映射成允許、標記、移除或升級人工審查,並在後端保持一致。
例如,當回傳 Yes 且分類不是 C0,就視為命中審核規則,接著送進審查佇列或自動移除。若回傳 No 且是 C0,就放行並記錄決策,方便日後稽核與調校。
驗收:你應該看到應用程式對安全與違規樣本都做出正確動作,而且決策已寫入日誌或審核佇列。
Step 5: 用自己的樣本做測試
目的:在上線前,用真實的使用者內容驗證提示詞。先建立一組小型測試集,包含明顯違規、模糊案例與乾淨內容,這樣才能觀察誤判與漏判。
把同一份提示詞套到每個樣本,然後把模型輸出和你的預期標籤比對。如果你要加 few-shot 範例,只加能改善特定失敗案例的範例,不要一次塞太多。
驗收:你應該看到模型對測試集的分類大致符合政策,且邊界案例會先交由人工確認再發布。
常見錯誤
- 把政策文字和待審核內容混在同一段。修法:用清楚標籤或 JSON key 分開,讓模型知道哪一段是規則、哪一段是內容。
- 輸出格式寫得太模糊。修法:明確指定欄位、允許值,以及回傳必須是 JSON、XML 或自由文字。
- 每次政策變動都沿用同一份提示詞。修法:替政策文字做版本控管,規則改了就同步更新提示詞,而不是每次重訓模型。
接下來可以看什麼
等基本流程跑通後,可以再加評估集、邊界案例的人工作業,以及依政策類別調整的閾值,讓審核品質能持續優化。