[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-stanford-2026-ai-index-charts-explained-zh":3,"tags-stanford-2026-ai-index-charts-explained-zh":33,"related-lang-stanford-2026-ai-index-charts-explained-zh":49,"related-posts-stanford-2026-ai-index-charts-explained-zh":53,"series-research-57fe6457-4c90-4c0d-84a2-c062d87421f8":90},{"id":4,"title":5,"content":6,"summary":7,"source":8,"source_url":9,"author":10,"image_url":11,"keywords":12,"language":21,"translated_content":10,"views":22,"is_premium":23,"created_at":24,"updated_at":24,"cover_image":11,"published_at":25,"rewrite_status":26,"rewrite_error":10,"rewritten_from_id":27,"slug":28,"category":29,"related_article_id":30,"status":31,"google_indexed_at":32,"x_posted_at":10,"tweet_text":10,"title_rewritten_at":10,"title_original":10,"key_takeaways":10,"topic_cluster_id":10,"embedding":10,"is_canonical_seed":23},"57fe6457-4c90-4c0d-84a2-c062d87421f8","史丹佛 2026 AI Index 圖表解讀","\u003Cp>如果你想看懂 2026 年的 AI 現況，先看一個數字：AI 資料中心現在可吃掉 29.6 gigawatts 電力。這大概等於紐約州的尖峰用電。另一個數字也很猛：全球超過一半的人，已在三年內用上 AI。\u003C\u002Fp>\u003Cp>這份 \u003Ca href=\"https:\u002F\u002Faiindex.stanford.edu\u002Freport\u002F\" target=\"_blank\" rel=\"noopener\">Stanford AI Index\u003C\u002Fa> 很像一份冷靜版戰報。它談模型、採用率、就業、法規和基礎設施。看完你會發現，AI 不是單一路線在衝。它是速度很快、花錢很兇、而且評分表跟不上節奏的技術。\u003C\u002Fp>\u003Cp>說真的，這才是重點。模型一直變強，訓練和推論成本也一直往上走。大家都在追，包含企業、政府、研究者，還有那些做 benchmark 的人。只是很多人追得比 AI 慢。\u003C\u002Fp>\u003Ch2>AI 進步很快，但不是每條路都順\u003C\u002Fh2>\u003Cp>2026 AI Index 最直接的訊號，就是頂級模型還在持續進化。這種速度，幾年前講出來會像在吹牛。以 SWE-bench Verified 來看，軟體工程相關分數，從 2024 年左右的 60% 升到 2025 年接近 100%。對寫程式的人來說，這不是小事。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776427444966-lec9.png\" alt=\"史丹佛 2026 AI Index 圖表解讀\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這代表什麼？代表 coding assistant、bug fixing、a\u003Ca href=\"\u002Fnews\u002Fmm-webagent-hierarchical-multimodal-webpages-zh\">gent\u003C\u002Fa> workflow 的使用方式都要重想。以前你可能把 AI 當輔助工具。現在你得把它當半個同事看。當然，前提是你有做好驗證，不然它也可能半夜幫你把 production 搞爆。\u003C\u002Fp>\u003Cp>但報告也很直接：模型聰明度是鋸齒狀的。它可以在寫 code 時很強，卻在實體世界表現很差。像是物理推理、家務、長時間互動，這些都還很卡。這點很重要，因為會寫 code 的模型很實用，能\u003Ca href=\"\u002Fnews\u002Fwhite-house-backs-stablecoin-yield-fight-zh\">穩定\u003C\u002Fa>處理真實世界的模型，才是真的難。\u003C\u002Fp>\u003Cp>報告也提到，有些 AI 系統已經在 PhD 等級的科學、數學、語言測試上，達到或超過人類專家表現。這聽起來很誇張，沒錯，確實誇張。但 benchmark 贏，不代表真實場景也穩。只要任務一變髒、一變長、一變開放，模型就容易露餡。\u003C\u002Fp>\u003Cul>\u003Cli>SWE-bench Verified 分數，從 2024 約 60% 升到 2025 接近 100%。\u003C\u002Fli>\u003Cli>機器人只完成 12% 的居家任務。\u003C\u002Fli>\u003Cli>Waymo 已在 5 個美國城市營運。\u003C\u002Fli>\u003Cli>Baidu 的 Apollo Go 也在中國跑乘客服務。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>美中差距很小，但強項完全不同\u003C\u002Fh2>\u003Cp>地緣競爭這件事，現在比很多人想的更接近。報告引用 \u003Ca href=\"https:\u002F\u002Flmarena.ai\u002F\" target=\"_blank\" rel=\"noopener\">Arena\u003C\u002Fa> 的排名，也就是以前叫 \u003Ca href=\"\u002Fnews\u002Fllm-judge-reliability-conformal-transitivity-zh\">LM\u003C\u002Fa>SYS Chatbot Arena 的平台。從這些排名看，美國和中國在模型表現上幾乎貼身肉搏。\u003C\u002Fp>\u003Cp>2023 年初，\u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa> 的 ChatGPT 還有明顯領先。到了 2024 年，\u003Ca href=\"https:\u002F\u002Fdeepmind.google\u002F\" target=\"_blank\" rel=\"noopener\">Google\u003C\u002Fa> 和 \u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa> 把差距拉近。2025 年 2 月，DeepSeek 的 R1 一度追平美國最強模型。這種節奏，老實說很難用單一冠軍來解釋。\u003C\u002Fp>\u003Cp>到 2026 年 3 月，Anthropic 排名第一，xAI、Google、OpenAI 緊跟在後。中國的 DeepSeek 和 Alibaba 也沒有掉太遠。這代表競爭焦點不再只是誰先做出爆款模型，而是誰能把成本、穩定性、推論效率壓到更低。\u003C\u002Fp>\u003Cp>更深一層的差別，在基礎設施和研究產出。美國估計有 5,427 座資料中心，數量是其他國家的 10 倍以上。中國則在 AI 論文、專利、機器人輸出上領先。講白了，美國模型肌肉比較大，中國工業面比較廣。\u003C\u002Fp>\u003Cblockquote>“I am stunned that this technology continues to improve, and it’s just not plateauing in any way,” said \u003Ca href=\"https:\u002F\u002Fhcii.stanford.edu\u002Fpeople\u002Fyolanda-gil\" target=\"_blank\" rel=\"noopener\">Yolanda Gil\u003C\u002Fa>, a computer scientist at the University of Southern California and coauthor of the report.\u003C\u002Fblockquote>\u003Cp>我覺得這句話很準。很多人一直在猜 AI 何時撞牆。結果看起來，牆沒有來，天花板一直往上移。這也是為什麼現在不能只看模型名氣，要看它到底能不能穩定交付。\u003C\u002Fp>\u003Cul>\u003Cli>美國強在資本、前沿模型、資料中心。\u003C\u002Fli>\u003Cli>中國強在論文、專利、機器人產出。\u003C\u002Fli>\u003Cli>2026 年 3 月，Anthropic 排名第一。\u003C\u002Fli>\u003Cli>DeepSeek R1 在 2025 年 2 月曾追平美國最強模型。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>評測表，已經追不上產品了\u003C\u002Fh2>\u003Cp>如果你覺得 AI 的進步很難抓，原因之一就是評測本身跟不上。Stanford 報告很直白地說，模型很快就把 benchmark 天花板打穿了。有些測試設計得很爛。甚至有一個常見數學 benchmark，錯誤率高達 42%。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776427443725-1niy.png\" alt=\"史丹佛 2026 AI Index 圖表解讀\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>這種情況下，漂亮分數不一定有意義。模型可以在排行榜上很猛，實際上卻在對話、工具使用、流程切換時翻車。尤其是 agents 和 robots，標準化測試還很薄，很多根本還沒長出像樣的測法。\u003C\u002Fp>\u003Cp>透明度也變差了。競爭越兇，\u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa>、\u003Ca href=\"https:\u002F\u002Fdeepmind.google\u002F\" target=\"_blank\" rel=\"noopener\">Google DeepMind\u003C\u002Fa> 這些公司，越少公開訓練 code、參數量、資料集大小。這讓外部驗證更難，也讓安全研究更卡。\u003C\u002Fp>\u003Cp>所以現在看 benchmark，要多一層懷疑。它還是有用，但不能當全部。說白了，分數能看，但你得問：它到底漏了什麼？\u003C\u002Fp>\u003Cul>\u003Cli>一個常見數學 benchmark 的錯誤率達 42%。\u003C\u002Fli>\u003Cli>訓練資料若直接碰到 benchmark，分數會膨脹。\u003C\u002Fli>\u003Cli>AI agents 和 robots 的標準測試還不成熟。\u003C\u002Fli>\u003Cli>大模型實驗室公開的訓練細節越來越少。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>AI 已經在改變工作，但影響很不平均\u003C\u002Fh2>\u003Cp>AI 的普及速度，已經快過個人電腦和網際網路。報告說，全球超過一半的人，在 AI 主流化三年內就開始使用。還有 88% 的組織在用 AI，四分之三以上的大學學生也在用。這個擴散速度，真的很難裝沒看到。\u003C\u002Fp>\u003Cp>勞動市場的影響比較難量化，但一些訊號已經出來。2025 年一份 Stanford 經濟研究指出，22 到 25 歲的軟體開發者就業，從 2022 年以來下滑接近 20%。這不代表 AI 是唯一原因，景氣和利率也有影響。但時間點很難忽略。\u003C\u002Fp>\u003Cp>生產力提升則是真的有。報告引用的研究顯示，AI 在客服可提升 14% 生產力，在軟體開發可提升 26%。問題是，這些增益通常出現在結構清楚、輸出好驗證的工作。越需要判斷、脈絡、責任的工作，AI 就越容易卡住。\u003C\u002Fp>\u003Cp>企業也開始重新算人力帳。2025 年 McKinsey 調查顯示，三分之一組織預期 AI 會在未來一年縮編，尤其是服務、供應鏈、軟體角色。這不是全面裁員，但已經足夠影響招募和職缺設計。\u003C\u002Fp>\u003Cul>\u003Cli>全球超過一半的人，在三年內開始用 AI。\u003C\u002Fli>\u003Cli>88% 的組織在用 AI。\u003C\u002Fli>\u003Cli>四分之三以上的大學學生在用 AI。\u003C\u002Fli>\u003Cli>22 到 25 歲軟體開發者就業，從 2022 年起下滑近 20%。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>法規開始追，但速度還是慢半拍\u003C\u002Fh2>\u003Cp>大家對 AI 的感受很分裂。\u003Ca href=\"https:\u002F\u002Fwww.ipsos.com\u002F\" target=\"_blank\" rel=\"noopener\">Ipsos\u003C\u002Fa> 的調查顯示，59% 的人覺得 AI 利大於弊，但 52% 的人也說它讓自己不安。這兩句其實可以同時成立。畢竟，誰看到一個會寫 code、會生圖、會聊天的系統，不會有一點怕。\u003C\u002Fp>\u003Cp>信任落差更明顯。\u003Ca href=\"https:\u002F\u002Fwww.pewresearch.org\u002F\" target=\"_blank\" rel=\"noopener\">Pew Research Center\u003C\u002Fa> 的調查指出，73% 的專家認為 AI 會改善工作方式，但美國一般民眾只有 23% 同意。工作是最大分歧點，教育和醫療也有差距。選舉和人際關係方面，兩邊都更保守。\u003C\u002Fp>\u003Cp>法規正在動，但很不整齊。\u003Ca href=\"https:\u002F\u002Fartificialintelligenceact.eu\u002F\" target=\"_blank\" rel=\"noopener\">EU AI Act\u003C\u002Fa> 已開始執行第一批禁令，包含預測性警政和情緒辨識。日本、南韓、義大利也通過國家級 AI 法律。美國這邊，聯邦和州政府則在拉扯，州議會已通過創紀錄的 150 項 AI 相關法案。\u003C\u002Fp>\u003Cp>California 的 SB 53 和 New York 的 RAISE Act 很值得看。它們都偏向揭露、事故通報、吹哨保護。這比「先上線再說」的思路，明顯保守很多，也更像真的在管風險。\u003C\u002Fp>\u003Cp>我覺得這份報告最刺眼的地方，就是治理永遠慢一拍。技術跑一個時鐘，監管跑另一個時鐘。只要這兩個時鐘差太多，每次新模型上線，大家就還是得重問一次：到底誰來定義什麼叫安全夠用？\u003C\u002Fp>\u003Ch2>接下來最該盯的是電力，不是口號\u003C\u002Fh2>\u003Cp>2026 AI Index 好看的地方，在於它不把 AI 說成單一故事。模型在進步，基礎設施帳單也在變大。benchmark 很脆，工作影響不平均，政策反應又慢半拍。這種混亂，才比較像真實世界。\u003C\u002Fp>\u003Cp>如果要我做一個預測，我會說：接下來一年，AI 爭論會從「模型能不能做很厲害的事」，轉向「公司還能不能負擔一直擴張」。電力、水、晶片、法規，會跟模型品質一樣重要。你要看懂下一階段，得盯基礎設施數字，不只是分數。\u003C\u002Fp>\u003Cp>如果你現在就在做 AI 產品，建議很簡單。不要只信 leaderboard。請直接拿你的資料測，測失敗模式，測成本，測部署後的延遲。很多時候，真正卡住你的不是能力，而是錢和落地。\u003C\u002Fp>\u003Cp>如果你想接著看評測問題，可以回頭看我們整理的 \u003Ca href=\"\u002Fnews\u002Fai-benchmarks-are-broken\" target=\"_blank\" rel=\"noopener\">AI benchmarks 為什麼開始失真\u003C\u002Fa>。那篇和這份 Stanford 報告很接近，因為兩者都在講同一件事：分數表越來越難信，但風險卻越來越真。\u003C\u002Fp>","史丹佛 2026 AI Index 用圖表拆解 AI 現況：模型變快、成本變高、美中差距縮小，但評測和治理都追不上。","www.technologyreview.com","https:\u002F\u002Fwww.technologyreview.com\u002F2026\u002F04\u002F13\u002F1135675\u002Fwant-to-understand-the-current-state-of-ai-check-out-these-charts\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1776427444966-lec9.png",[13,14,15,16,17,18,19,20],"Stanford AI Index","AI 2026","AI benchmark","SWE-bench Verified","資料中心","美中 AI 競爭","AI 法規","人工智慧","zh",1,false,"2026-04-17T12:03:47.109964+00:00","2026-04-17T12:03:46.88+00:00","done","ddf7b3d3-9388-4635-9d43-ba9d80de2684","stanford-2026-ai-index-charts-explained-zh","research","ca152f29-641a-4c5b-8ca6-47a9a95b5d77","published","2026-04-18T09:00:07.191+00:00",[34,35,37,39,42,44,46,47],{"name":20,"slug":20},{"name":18,"slug":36},"美中-ai-競爭",{"name":13,"slug":38},"stanford-ai-index",{"name":40,"slug":41},"SWE-Bench Verified","swe-bench-verified",{"name":14,"slug":43},"ai-2026",{"name":15,"slug":45},"ai-benchmark",{"name":17,"slug":17},{"name":19,"slug":48},"ai-法規",{"id":30,"slug":50,"title":51,"language":52},"stanford-2026-ai-index-charts-explained-en","Stanford’s 2026 AI Index, explained with charts","en",[54,60,66,72,78,84],{"id":55,"slug":56,"title":57,"cover_image":58,"image_url":58,"created_at":59,"category":29},"667b72b6-e821-4d68-80a1-e03340bc85f1","turboquant-seo-shift-small-sites-zh","TurboQuant 與小站 SEO 變化","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778840440690-kcw9.png","2026-05-15T10:20:27.319472+00:00",{"id":61,"slug":62,"title":63,"cover_image":64,"image_url":64,"created_at":65,"category":29},"381fb6c6-6da7-4444-831f-8c5eed8d685c","turboquant-vllm-comparison-fp8-kv-cache-zh","TurboQuant 與 FP8 實測結果","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778839867551-4v9g.png","2026-05-15T10:10:36.034569+00:00",{"id":67,"slug":68,"title":69,"cover_image":70,"image_url":70,"created_at":71,"category":29},"c15f45ee-a548-4dbf-8152-91de159c1a11","llmbda-calculus-agent-safety-rules-zh","LLMbda 演算替 AI 代理人立安全規則","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778825503412-mlbf.png","2026-05-15T06:10:34.832664+00:00",{"id":73,"slug":74,"title":75,"cover_image":76,"image_url":76,"created_at":77,"category":29},"0c02225c-d6ff-44f8-bc92-884c8921c4a3","low-complexity-beamspace-denoiser-mmwave-mimo-zh","更簡單的毫米波波束域去噪器","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778814650361-xtc2.png","2026-05-15T03:10:30.06639+00:00",{"id":79,"slug":80,"title":81,"cover_image":82,"image_url":82,"created_at":83,"category":29},"9d27f967-62cc-433f-8cdb-9300937ade13","ai-benchmark-wins-cyber-scare-defenders-zh","為什麼 AI 基準賽在資安領域的勝利，應該讓防守方警醒","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778807450006-nofx.png","2026-05-15T01:10:29.379041+00:00",{"id":85,"slug":86,"title":87,"cover_image":88,"image_url":88,"created_at":89,"category":29},"bc402dc6-5da6-46fc-9d66-d09cb215f72b","why-linux-security-needs-patch-wave-mindset-zh","為什麼 Linux 安全需要「補丁浪潮」思維","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1778741449813-s2wn.png","2026-05-14T06:50:24.052583+00:00",[91,96,101,106,111,116,121,126,131,136],{"id":92,"slug":93,"title":94,"created_at":95},"f18dbadb-8c59-4723-84a4-6ad22746c77a","deepmind-bets-on-continuous-learning-ai-2026-zh","DeepMind 押注 2026 連續學習 AI","2026-03-26T08:16:02.367355+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"f4a106cb-02a6-4508-8f39-9720a0a93cee","ml-papers-of-the-week-github-research-desk-zh","每週 ML 論文清單，為何紅到 GitHub","2026-03-27T01:11:39.284175+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"c4f807ca-4e5f-47f1-a48c-961cf3fc44dc","ai-ml-conferences-to-watch-in-2026-zh","2026 AI 研討會投稿時程整理","2026-03-27T01:51:53.874432+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"9f50561b-aebd-46ba-94a8-363198aa7091","openclaw-agents-manipulated-self-sabotage-zh","OpenClaw Agent 會自己搞砸自己","2026-03-28T03:03:18.786425+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"11f22e92-7066-4978-a544-31f5f2156ec6","vega-learning-to-drive-with-natural-language-instructions-zh","Vega：使用自然語言指示進行自駕車控制","2026-03-28T14:54:04.847912+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"a4c7cfec-8d0e-4fec-93cf-1b9699a530b8","drive-my-way-en-zh","Drive My Way：個性化自駕車風格的實現","2026-03-28T14:54:26.207495+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"dec02f89-fd39-41ba-8e4d-11ede93a536d","training-knowledge-bases-with-writeback-rag-zh","用 WriteBack-RAG 強化知識庫提升檢索效能","2026-03-28T14:54:45.775606+00:00",{"id":127,"slug":128,"title":129,"created_at":130},"3886be5c-a137-40cc-b9e2-0bf18430c002","packforcing-efficient-long-video-generation-method-zh","PackForcing：短影片訓練也能生成長影片","2026-03-28T14:55:02.688141+00:00",{"id":132,"slug":133,"title":134,"created_at":135},"72b90667-d930-4cc9-8ced-aaa0f8968d44","pixelsmile-toward-fine-grained-facial-expression-editing-zh","PixelSmile：提升精細臉部表情編輯的新方法","2026-03-28T14:55:20.678181+00:00",{"id":137,"slug":138,"title":139,"created_at":140},"cf046742-efb2-4753-aef9-caed5da5e32e","adaptive-block-scaled-data-types-zh","IF4：神經網路量化的聰明選擇","2026-03-31T06:00:36.990273+00:00"]