[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-compute-equilibrium-beyond-unilateral-deviation-zh":3,"article-related-compute-equilibrium-beyond-unilateral-deviation-zh":30,"series-research-a1a790f4-7ab9-470a-ae45-1aea90cbefa9":83},{"id":4,"title":5,"content":6,"summary":7,"source":8,"source_url":9,"author":10,"image_url":11,"keywords":12,"language":18,"translated_content":10,"views":19,"is_premium":20,"created_at":21,"updated_at":21,"cover_image":11,"published_at":22,"rewrite_status":23,"rewrite_error":10,"rewritten_from_id":24,"slug":25,"category":26,"related_article_id":27,"status":28,"google_indexed_at":29,"x_posted_at":10,"tweet_text":10,"title_rewritten_at":10,"title_original":10,"key_takeaways":10,"topic_cluster_id":10,"embedding":10,"is_canonical_seed":20},"a1a790f4-7ab9-470a-ae45-1aea90cbefa9","找出更抗聯盟作弊的均衡","\u003Cp data-speakable=\"summary\">這篇論文在算一種更抗聯盟偏離的均衡，目標不是消滅作弊誘因，而是把聯盟想一起偏離的動機壓到最低。\u003C\u002Fp>\u003Cp>在博弈論裡，很多均衡概念只保證「單一玩家」不會獨自改策略就更好。這對 Nash equilibrium 或 correlated equilibrium 夠用，但一旦多個玩家能協調行動，問題就出現了。\u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2604.28186\">Computing Equilibrium beyond Unilateral Deviation\u003C\u002Fa> 直接碰這個缺口：如果完美的 coalition-proof 穩定性常常不存在，那能不能至少算出一個讓聯盟偏離誘因盡量小的結果？\u003C\u002Fp>\u003Cp>這篇工作的重點，不是把「聯盟永遠不會偏離」當成目標，而是把它改成一個可計算的最佳化問題。這個轉向很實際。因為像 strong Nash equilibrium、coali\u003Ca href=\"\u002Fnews\u002Ftokenization-moving-from-idea-to-infrastructure-zh\">tion\u003C\u002Fa>-proof equilibrium 這類更強的概念，常常太脆弱，甚至在不少遊戲裡根本不存在。與其追一個可能無解的理想，不如找出在既定衡量方式下，最不容易被聯盟利用的均衡。\u003C\u002Fp>\u003Ch2>這篇在修哪個痛點\u003C\u002Fh2>\u003Cp>標準均衡概念的盲點很清楚：它們主要防單人背叛，不太管群體合作。可是在很多策略場景裡，真正的風險不是某個人單飛，而是幾個人一起改口徑、一起換策略。對機制設計、多人系統、平台規則，或任何有協同行為的場景來說，這代表一個方案可能「看起來穩」，實際上卻很脆弱。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1777620227302-mjs9.png\" alt=\"找出更抗聯盟作弊的均衡\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>如果硬要要求每個聯盟都完全沒有偏離誘因，往往會卡在不存在性的問題上。這篇論文不是否定這個理想，而是改問：既然完全消滅不現實，那能不能把聯盟偏離的收益壓到最小？這個問題一換，整個研究方向就從「找不存在的東西」變成「找可算的最佳折衷」。\u003C\u002Fp>\u003Cp>作者處理的不是單一指標，而是三種常見的聯盟收益衡量：平均收益、加權平均收益，以及聯盟成員中的最大收益。這三種定義看起來很像，但實際上對可計算性會有不同影響。這也是這篇論文的重點之一：你怎麼定義「聯盟賺多少」，會直接決定問題難不難算。\u003C\u002Fp>\u003Ch2>方法到底怎麼運作\u003C\u002Fh2>\u003Cp>核心做法可以白話成一句：先定義「最好的一次聯盟偏離」有多大，再去找讓這個值最小的均衡。也就是說，與其要求聯盟偏離後完全沒好處，不如接受它可能有一點好處，但要把這個好處壓到最低。這是一種比較寬鬆、但保證存在的替代方案。\u003C\u002Fp>\u003Cp>在平均收益版本裡，目標是最小化一個聯盟偏離後的平均收益。接著作者把同樣的框架延伸到加權平均版本，讓不同成員的影響力可以不一樣；再延伸到最大收益版本，讓聯盟中單一成員能拿到多少，成為判定偏離誘因的核心。這三種版本都在同一個大框架下，但它們的計算難度不是同一回事。\u003C\u002Fp>\u003Cp>論文也明確指出一個負面結果：minimum-gain 的類比版本是計算上不可處理的。這點很重要，因為它幫這類「抗聯盟偏離」的目標劃出邊界。不是所有看起來合理的穩定性指標，都適合拿來做演算法問題。有些定義在理論上漂亮，但一碰到計算就會卡死。\u003C\u002Fp>\u003Cp>對開發者來說，這代表建模不是小事。你不是只是在選一個數學名詞，而是在選一個會不會算得動的目標函數。如果你的系統裡真的存在協同策略、串通、或多方一起改行為的可能，那偏離誘因到底用平均值、加權平均，還是最大值來衡量，會直接影響你最後能不能算出有用解。\u003C\u002Fp>\u003Ch2>論文實際證明了什麼\u003C\u002Fh2>\u003Cp>這份摘要沒有公開完整 benchmark 細節，也沒有實驗數據表，所以不能從這裡讀出實作效能或實測速度。它提供的是理論層面的結果：一個保證存在的均衡框架、一個 minimum-gain 版本的不可計算性結果，以及 average-gain 和 max-gain 版本的匹配複雜度結果。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1777620238356-uq1e.png\" alt=\"找出更抗聯盟作弊的均衡\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>更具體地說，作者對 average-gain 與 maximum-gain 這兩種情況都給出計算複雜度下界，然後再提出一個能對上這個下界的演算法。這種「下界 + 匹配演算法」的組合很有價值，因為它不只告訴你問題難，也告訴你在目前已知的理論範圍內，能做到哪一步。\u003C\u002Fp>\u003Cp>從工程角度看，這代表演算法不是隨便湊出來的可行解，而是和作者證明的最佳複雜度界線對齊。當一篇論文能把困難度和可解法一起講清楚，讀者就比較知道自己是在面對一個可落地但昂貴的問題，還是一個根本不值得期待高效率解的問題。\u003C\u002Fp>\u003Cp>作者也把這個框架套到 Exploitabil\u003Ca href=\"\u002Fnews\u002Fanthropic-claude-security-public-beta-zh\">ity\u003C\u002Fa> Welfare Fro\u003Ca href=\"\u002Fnews\u002Fanthropic-eyes-openai-valuation-lead-900b-zh\">nt\u003C\u002Fa>ier, EWF 上。這裡的問題是：在 exploitability 固定的情況下，最多可以拿到多少 social welfare。exploitability 在這裡是指「任何單邊偏離」能帶來的最大收益。這個應用把研究拉回一個很實務的權衡：你想要多少福利，就得接受多少可被利用的空間。\u003C\u002Fp>\u003Ch2>對開發者和研究者有什麼影響\u003C\u002Fh2>\u003Cp>就算你不是在做博弈理論，這個問題也很常見。多代理最佳化、市場機制、投票系統、分散式協調、機制設計，只要參與者有可能協同，單人穩定就不夠。系統可以對每個人都「單獨合理」，卻還是擋不住群體一起改變行為。\u003C\u002Fp>\u003Cp>這篇論文的價值在於，它沒有停在「聯盟很重要」這種提醒，而是往前走一步：如果完美的 coalition-proof 解不存在，那就算一個最小化聯盟誘因的解。這種想法對工程師比較有用，因為它提供的是一個明確目標、一個存在性框架，外加一個複雜度故事，讓你知道自己在算什麼、算到哪裡算得動。\u003C\u002Fp>\u003Cp>但限制也要看清楚。摘要沒有提到任何實驗驗證，所以我們不知道這些演算法在真實資料上的表現。它也沒有宣稱可以解決所有策略不穩定問題。它做的是更聚焦的事：在特定的收益衡量下，最小化聯盟偏離誘因，並指出某些版本在計算上就是不划算。\u003C\u002Fp>\u003Cp>如果把這篇論文的訊息濃縮成實作上的幾個提醒，大概可以這樣看：\u003C\u002Fp>\u003Cul>\u003Cli>當單人偏離太弱時，可以改看聯盟偏離。\u003C\u002Fli>\u003Cli>若要保留可計算性，平均收益或最大收益版本比較有希望。\u003C\u002Fli>\u003Cli>不要預設 coalition-proof equilibrium 一定存在。\u003C\u002Fli>\u003Cli>收益衡量方式不只是建模細節，還會決定複雜度。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>總結來說，這篇論文給的是一個更務實的穩定性目標：不是幻想完全擋住所有協同偏離，而是在不能完全阻止的前提下，找出最不容易被鑽漏洞的均衡。對需要處理群體策略行為的系統設計者來說，這是一個比傳統均衡更貼近現實的工具箱。\u003C\u002Fp>","這篇論文改算「不那麼容易被聯盟偏離」的均衡，並給出平均收益與最大收益兩種情況下的匹配複雜度結果。","arxiv.org","https:\u002F\u002Farxiv.org\u002Fabs\u002F2604.28186",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1777620227302-mjs9.png",[13,14,15,16,17],"game theory","coalition deviation","equilibrium computation","complexity theory","exploitability welfare frontier","zh",0,false,"2026-05-01T06:10:33.253813+00:00","2026-05-01T06:10:33.198+00:00","done","480bc194-8eda-4f99-a2b7-7b63cd63f814","compute-equilibrium-beyond-unilateral-deviation-zh","research","b52971ee-f9a1-4fb3-8d3e-625fda17fdcd","published","2026-05-01T09:00:07.596+00:00",{"tags":31,"relatedLang":42,"relatedPosts":46},[32,34,36,38,40],{"name":14,"slug":33},"coalition-deviation",{"name":16,"slug":35},"complexity-theory",{"name":15,"slug":37},"equilibrium-computation",{"name":17,"slug":39},"exploitability-welfare-frontier",{"name":13,"slug":41},"game-theory",{"id":27,"slug":43,"title":44,"language":45},"compute-equilibrium-beyond-unilateral-deviation-en","A new way to compute coalition-resistant equilibria","en",[47,53,59,65,71,77],{"id":48,"slug":49,"title":50,"cover_image":51,"image_url":51,"created_at":52,"category":26},"7c89c3bd-48cb-4b4e-942d-bbf0409fc392","cattle-trade-llm-bluffing-bargaining-benchmark-zh","Cattle Trade 要測 LLM 談判 bluffing","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779085437419-b0zw.png","2026-05-18T06:23:27.885037+00:00",{"id":54,"slug":55,"title":56,"cover_image":57,"image_url":57,"created_at":58,"category":26},"492aa1ec-02ce-491e-ad03-ae804f261f87","weak-rewards-persistent-llm-user-models-zh","弱回饋讓 LLM 記住偏好","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779084838002-5od2.png","2026-05-18T06:13:32.906335+00:00",{"id":60,"slug":61,"title":62,"cover_image":63,"image_url":63,"created_at":64,"category":26},"9580adce-69ec-4880-ad8b-227c384cb377","marlin-greener-llm-inference-datacenters-zh","MARLIN 用多代理 RL 省雲端推理資源","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779084247021-qzhd.png","2026-05-18T06:03:35.259834+00:00",{"id":66,"slug":67,"title":68,"cover_image":69,"image_url":69,"created_at":70,"category":26},"e3f8d32d-9094-4717-b9fd-d799de0e521b","weishenme-fensanshi-xitong-yanjiang-bi-buluoge-wenzhang-geng-zh","為什麼分散式系統演講比部落格文章更值得學","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779075234067-fff9.png","2026-05-18T03:33:21.6849+00:00",{"id":72,"slug":73,"title":74,"cover_image":75,"image_url":75,"created_at":76,"category":26},"0b28782b-fc24-49fc-bc5c-ec9c07c8ad46","wei-shen-me-sora-zheng-ming-ying-pian-ai-hai-mei-zhun-bei-ha-zh","為什麼 Sora 證明影片 AI 還沒準備好走向主流","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779059031003-tsg7.png","2026-05-17T23:03:22.155232+00:00",{"id":78,"slug":79,"title":80,"cover_image":81,"image_url":81,"created_at":82,"category":26},"aefdd28e-fccb-46ca-a78b-ad6ad718058d","microsoft-mdash-finds-16-windows-flaws-zh","Microsoft MDASH 找出 16 個 Windows 漏洞","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1779041037625-66oq.png","2026-05-17T18:03:35.214691+00:00",[84,89,94,99,104,109,114,119,124,129],{"id":85,"slug":86,"title":87,"created_at":88},"f18dbadb-8c59-4723-84a4-6ad22746c77a","deepmind-bets-on-continuous-learning-ai-2026-zh","DeepMind 押注 2026 連續學習 AI","2026-03-26T08:16:02.367355+00:00",{"id":90,"slug":91,"title":92,"created_at":93},"f4a106cb-02a6-4508-8f39-9720a0a93cee","ml-papers-of-the-week-github-research-desk-zh","每週 ML 論文清單，為何紅到 GitHub","2026-03-27T01:11:39.284175+00:00",{"id":95,"slug":96,"title":97,"created_at":98},"c4f807ca-4e5f-47f1-a48c-961cf3fc44dc","ai-ml-conferences-to-watch-in-2026-zh","2026 AI 研討會投稿時程整理","2026-03-27T01:51:53.874432+00:00",{"id":100,"slug":101,"title":102,"created_at":103},"9f50561b-aebd-46ba-94a8-363198aa7091","openclaw-agents-manipulated-self-sabotage-zh","OpenClaw Agent 會自己搞砸自己","2026-03-28T03:03:18.786425+00:00",{"id":105,"slug":106,"title":107,"created_at":108},"11f22e92-7066-4978-a544-31f5f2156ec6","vega-learning-to-drive-with-natural-language-instructions-zh","Vega：使用自然語言指示進行自駕車控制","2026-03-28T14:54:04.847912+00:00",{"id":110,"slug":111,"title":112,"created_at":113},"a4c7cfec-8d0e-4fec-93cf-1b9699a530b8","drive-my-way-en-zh","Drive My Way：個性化自駕車風格的實現","2026-03-28T14:54:26.207495+00:00",{"id":115,"slug":116,"title":117,"created_at":118},"dec02f89-fd39-41ba-8e4d-11ede93a536d","training-knowledge-bases-with-writeback-rag-zh","用 WriteBack-RAG 強化知識庫提升檢索效能","2026-03-28T14:54:45.775606+00:00",{"id":120,"slug":121,"title":122,"created_at":123},"3886be5c-a137-40cc-b9e2-0bf18430c002","packforcing-efficient-long-video-generation-method-zh","PackForcing：短影片訓練也能生成長影片","2026-03-28T14:55:02.688141+00:00",{"id":125,"slug":126,"title":127,"created_at":128},"72b90667-d930-4cc9-8ced-aaa0f8968d44","pixelsmile-toward-fine-grained-facial-expression-editing-zh","PixelSmile：提升精細臉部表情編輯的新方法","2026-03-28T14:55:20.678181+00:00",{"id":130,"slug":131,"title":132,"created_at":133},"cf046742-efb2-4753-aef9-caed5da5e32e","adaptive-block-scaled-data-types-zh","IF4：神經網路量化的聰明選擇","2026-03-31T06:00:36.990273+00:00"]