[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"tag-ai-benchmark":3},{"tag":4,"articles":11},{"id":5,"name":6,"slug":7,"article_count":8,"description_zh":9,"description_en":10},"d3eec64f-9a00-4779-9191-ba3d01cd8a14","AI benchmark","ai-benchmark",3,"AI benchmark 是用來比較模型能力、成本與可靠性的評測方法，從 ARC Prize 這類把分數與算力攤開的排行榜，到語言、推理與互動任務，都影響模型選型、部署成本與研究方向。","AI benchmarks compare model quality, cost, and reliability across tasks, from score-vs-compute leaderboards like ARC Prize to language, reasoning, and interactive evaluations. They shape model selection, deployment budgets, and research priorities.",[12,21],{"id":13,"slug":14,"title":15,"summary":16,"category":17,"image_url":18,"cover_image":18,"language":19,"created_at":20},"57fe6457-4c90-4c0d-84a2-c062d87421f8","stanford-2026-ai-index-charts-explained-zh","史丹佛 2026 AI Index 圖表解讀","史丹佛 2026 AI Index 用圖表拆解 AI 現況：模型變快、成本變高、美中差距縮小，但評測和治理都追不上。","research","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776427444966-lec9.png","zh","2026-04-17T12:03:47.109964+00:00",{"id":22,"slug":23,"title":24,"summary":25,"category":17,"image_url":26,"cover_image":26,"language":19,"created_at":27},"ffa8459f-678e-40b9-a513-dee6b02800bc","arc-prize-leaderboard-cost-performance-zh","ARC 排行榜把成本攤開來看","ARC Prize 排行榜把成本和分數放在同一張圖上，ARC-AGI-3 也把任務拉進互動環境。這篇看它怎麼逼 AI 團隊正視算力、Token 和實際可部署性。","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1775143855363-h1lx.png","2026-04-02T15:30:39.292235+00:00"]