標籤
2 篇文章
這篇論文主張,LLM 安全判官不能只看準確率,還要測政策不變性,才能檢查它是否真的懂規則、而不是被措辭帶著走。
GPT Image 2 上線時應先做內容審核、記錄與人工覆核,再談速度與美觀,因為這三件事決定能不能安全地進入生產環境。