[IND] 4 分鐘閱讀OraCore 編輯部

Skatteetaten 證明公部門 AI 應該看成果,不是看噱頭

Skatteetaten 的成功說明,公部門 AI 的評價標準應該是可量化成果、治理能力與公共信任,而不是模型新不新。

分享 LinkedIn
Skatteetaten 證明公部門 AI 應該看成果,不是看噱頭

Skatteetaten 的案例說明,公部門 AI 應該用成果、治理與信任來評價,而不是用新奇程度來打分。

Skatteetaten 拿下 Nordic DAIR 獎,重點不在它用了多少 AI,而在它把 AI 變成了可驗證的公共價值。它的稅務模型一年可帶來超過 30 億挪威克朗的價值,房地產銷售模型也能增加約 10 億挪威克朗,這種結果已經不是試驗,而是基礎設施。

第一個論點:公部門 AI 的第一標準是可見成果

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

Skatteetaten 最強的地方,不是它會不會講 AI 故事,而是它能把成果寫進財務與服務指標。扣除額與第二住宅模型每年超過 30 億挪威克朗的價值,房地產銷售模型再加上約 10 億挪威克朗,代表它不是在做示範專案,而是在改造稅務行政的產出結構。

Skatteetaten 證明公部門 AI 應該看成果,不是看噱頭

這種成果也反映在民眾體驗上。數位報稅與退稅服務每年帶來超過 2 億挪威克朗效益,且自動化計算讓納稅人能在結算後數週內收到退款。對公部門來說,速度本身不是價值,準確、可預期、可追溯的速度才是價值。

更重要的是,這種成果是可比較的。若一個 AI 專案只能展示模型精度,卻說不出節省多少工時、減少多少錯誤、縮短多少處理時間,那它最多是技術展示。Skatteetaten 的案例剛好相反,因為它把 AI 放進了稅務、評估與申報流程之中,直接對公共財政與公民服務負責。

第二個論點:規模化靠治理,不靠宣傳

很多政府機構都會做 PoC,但很少能把模型穩定運行到日常流程裡。Skatteetaten 的關鍵做法,是把模型、現代化 IT 平台、治理架構與 MLOps 一起建起來,讓 AI 不只是單點工具,而是可維運的系統能力。這一點非常重要,因為公部門最難的不是訓練一個模型,而是長期維持數十個模型在法規、營運與聲譽壓力下正常工作。

它的汽車出口處理就是最好的例子。據報導,流程從 60 天、30 名承辦人,縮短到 6 小時、4 名員工,這不是小幅優化,而是流程重構。若沒有明確的權責設計、資料品質控制與持續監測,這種效率提升根本不可能落地。

和私部門相比,公部門更不能靠「先上再說」的文化。企業即使出錯,往往還能用商業損失修補;政府機關若出錯,損失的是合法性與公信力。Skatteetaten 的做法證明,治理不是創新的阻力,而是讓創新能被大規模採用的前提。

第三個論點:公部門 AI 的真正護城河是信任

稅務機關處理的是敏感資料與高風險決策,因此透明度比酷炫功能更重要。Skatteetaten 採用法律評估、正式 AI 政策、倫理委員會,以及對偏移、偏誤、魯棒性與可解釋性的持續監控,這表示它把風險當成設計輸入,而不是上線後才補救的問題。這種做法看似保守,實際上才是高風險公共服務的正確姿勢。

Skatteetaten 證明公部門 AI 應該看成果,不是看噱頭

人類仍保留最終決策權,這點尤其關鍵。當系統影響的是退稅、估價或合規判定時,民眾需要知道判斷依據,也需要知道申訴入口在哪裡。若 AI 只追求自動化率,卻無法說清楚決策邏輯,那它提升的不是效率,而是系統性不信任。

這也是為什麼 Skatteetaten 的模式比許多「智慧政府」口號更有說服力。它沒有把責任交給模型,而是把模型放進可審核、可追蹤、可問責的行政流程。對公部門來說,真正的競爭力不是跑得最快,而是能在高標準下長期被信任。

反方可能怎麼說

最強的反對意見是:這是一個太特殊的案例。稅務機關有結構化資料、規則明確、KPI 清楚,而且財務回報能直接量化,所以它的成功不一定能外推到醫療、社福或地方政府。批評者還會說,效率提升很容易被拿來宣傳,但民眾是否真的理解自動化決策、是否還能有效挑戰結果,才是更難的問題。

這個質疑不是空穴來風,甚至應該被認真對待。不是每個公共領域都能像稅務一樣把成果換算成金額,也不是每個部門都能像 Skatteetaten 一樣快速整合資料與流程。若把它當成萬能模板,確實會誤導其他機關。

但這個批評只是否定了「照抄模型」,沒有否定「用成果評價公部門 AI」這個原則。Skatteetaten 證明的不是所有機關都能複製同樣的技術,而是所有機關都應該用可量化成果、嚴格治理與人類問責來驗證 AI。這三項標準才是可移植的核心,而不是某一個模型本身。

你能做什麼

如果你是工程師、PM 或創辦人,別再先講模型架構,先講你要改善哪個流程、節省多少時間、降低多少錯誤、由誰負責。把 AI 專案拆成單一工作流、單一指標、單一責任人,並在上線前就定義法遵、人工覆核與監控機制。只要你說不出成果、風險與問責,這就不是公共價值方案,只是一個原型。