[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-gpt-5-model-comparison-5-0-to-5-5-zh":3,"article-related-gpt-5-model-comparison-5-0-to-5-5-zh":33,"series-model-release-4a50f829-80a7-4303-9e77-6baf4df97903":85},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":25,"views":29,"created_at":30,"published_at":31,"topic_cluster_id":32},"4a50f829-80a7-4303-9e77-6baf4df97903","gpt-5-model-comparison-5-0-to-5-5-zh","GPT-5.0 到 5.5 怎麼選","\u003Cp data-speakable=\"summary\">\u003Ca href=\"\u002Ftag\u002Fopenai\">OpenAI\u003C\u002Fa> 的 GPT-5 家族從 40 萬 Token 擴到 100 萬 Token，GPT-5.5 目前在多項 \u003Ca href=\"\u002Ftag\u002Fbenchmark\">benchmark\u003C\u002Fa> 領先。\u003C\u002Fp>\u003Cp>OpenAI 在不到 9 個月內，丟出 6 個 GPT-5 變體。這種節奏很兇，真的不是慢慢修模型那種玩法。\u003C\u002Fp>\u003Cp>如果你只看一個數字，那就是 GPT-5.5 的 93.6% GPQA Diamond。再加上 82.7% Terminal-Bench 2.0，這東西已經不是單純聊天機器人了。\u003C\u002Fp>\u003Ctable>\u003Cthead>\u003Ctr>\u003Cth>模型\u003C\u002Fth>\u003Cth>發布時間\u003C\u002Fth>\u003Cth>Context\u003C\u002Fth>\u003Cth>API 價格 \u002F 100 萬 Token\u003C\u002Fth>\u003Cth>代表成績\u003C\u002Fth>\u003C\u002Ftr>\u003C\u002Fthead>\u003Ctbody>\u003Ctr>\u003Ctd>GPT-5.0\u003C\u002Ftd>\u003Ctd>2025-08-07\u003C\u002Ftd>\u003Ctd>40 萬輸入 \u002F 12.8 萬輸出\u003C\u002Ftd>\u003Ctd>$1.25 \u002F $10\u003C\u002Ftd>\u003Ctd>AIME 2025：94.6%\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>GPT-5.1\u003C\u002Ftd>\u003Ctd>2025-11-13\u003C\u002Ftd>\u003Ctd>40 萬，27.2 萬輸入\u003C\u002Ftd>\u003Ctd>$1.25 \u002F $10\u003C\u002Ftd>\u003Ctd>簡單任務快 2 到 3 倍\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>GPT-5.2\u003C\u002Ftd>\u003Ctd>2025-12-11\u003C\u002Ftd>\u003Ctd>40 萬，27.2 萬輸入\u003C\u002Ftd>\u003Ctd>$1.75 \u002F $14\u003C\u002Ftd>\u003Ctd>AIME 2025：100%\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>GPT-5.3 Instant\u003C\u002Ftd>\u003Ctd>2026-03-03\u003C\u002Ftd>\u003Ctd>40 萬\u003C\u002Ftd>\u003Ctd>約 $0.30 \u002F 約 $1.20\u003C\u002Ftd>\u003Ctd>幻覺比 5.2 少 26.8%\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>GPT-5.4\u003C\u002Ftd>\u003Ctd>2026-03-05\u003C\u002Ftd>\u003Ctd>100 萬，僅 API\u003C\u002Ftd>\u003Ctd>$2.50 \u002F $15\u003C\u002Ftd>\u003Ctd>OSWorld-Verified：75.0%\u003C\u002Ftd>\u003C\u002Ftr>\u003Ctr>\u003Ctd>GPT-5.5\u003C\u002Ftd>\u003Ctd>2026-04-23\u003C\u002Ftd>\u003Ctd>100 萬，僅 API\u003C\u002Ftd>\u003Ctd>$5 \u002F $30\u003C\u002Ftd>\u003Ctd>GPQA Diamond：93.6%\u003C\u002Ftd>\u003C\u002Ftr>\u003C\u002Ftbody>\u003C\u002Ftable>\u003Ch2>GPT-5 家族為什麼長這麼快\u003C\u002Fh2>\u003Cp>講白了，就是 OpenAI 把模型拆細了。以前你可能只要選一個 \u003Ca href=\"\u002Ftag\u002Fchatgpt\">ChatGPT\u003C\u002Fa> 模型，現在要看速度、成本、推理、長上下文、還有 \u003Ca href=\"\u002Ftag\u002Fagent\">agent\u003C\u002Fa> 工作能力。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780007581188-95de.png\" alt=\"GPT-5.0 到 5.5 怎麼選\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-5\u002F\" target=\"_blank\" rel=\"noopener\">GPT-5.0\u003C\u002Fa> 在 2025 年 8 月 7 日\u003Ca href=\"\u002Fnews\u002Fxai-launches-grok-build-terminal-coding-zh\">推出\u003C\u002Fa>。它是統一系統，內含快速基礎模型和較深的推理層 GPT-5 Thinking。路由器會自動切模式，少了手動切換的麻煩。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-5-1\u002F\" target=\"_blank\" rel=\"noopener\">GPT-5.1\u003C\u002Fa> 接著把重點放在效率。簡單任務可以快 2 到 3 倍。這種優化很務實，因為日常工作最常卡住的，通常不是最難題，而是大量瑣碎請求。\u003C\u002Fp>\u003Cul>\u003Cli>GPT-5.0：統一路由，40 萬輸入 context，12.8 萬輸出 context\u003C\u002Fli>\u003Cli>GPT-5.1：自適應推理，價格不變，但簡單任務更快\u003C\u002Fli>\u003Cli>GPT-5.2：AIME 2025 直接拿到 100%\u003C\u002Fli>\u003Cli>GPT-5.4 與 GPT-5.5：100 萬 Token API context，還能做 computer use\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>每個模型差在哪裡\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-5-2\u002F\" target=\"_blank\" rel=\"noopener\">GPT-5.2\u003C\u002Fa> 主要在推理能力上拉高門檻。它在 AIME 2025 拿到 100%，在 ARC-AGI-1 Pro mode 也超過 90%。對工程師來說，這代表它更適合硬題目，不適合拿來省錢亂跑。\u003C\u002Fp>\u003Cp>\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-5-4\u002F\" target=\"_blank\" rel=\"noopener\">GPT-5.4\u003C\u002Fa> 的重點是 computer use。它可以點介面、跑命令、驗證輸出，再回頭修正。這種工作流很像半自動代理人，不是傳統聊天模型能直接做到的。\u003C\u002Fp>\u003Cp>OpenAI 在 GPT-5 發表時說過一句話：\u003Cblockquote>“The model is a significant leap in intelligence, and our most capable model yet,” OpenAI said in its GPT-5 launch announcement.\u003C\u002Fblockquote>這句話很直白。它等於把 GPT-5 家族定位成一組取捨，而不是單一答案。\u003C\u002Fp>\u003Cul>\u003Cli>GPT-5.2：偏推理，適合數學、程式、嚴格驗證\u003C\u002Fli>\u003Cli>GPT-5.3：偏便宜，適合大量文字與搜尋回答\u003C\u002Fli>\u003Cli>GPT-5.4：偏 agent，適合長流程、桌面操作、工具鏈\u003C\u002Fli>\u003Cli>GPT-5.5：偏全能，但價格也最硬\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>GPT-5.4 為何改變 agent 工作流\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fevaluating-computer-use\u002F\" target=\"_blank\" rel=\"noopener\">OSWorld-Verified\u003C\u002Fa> 是看模型能不能操作電腦的指標。GPT-5.4 拿到 75.0%，人類基準是 72.4%。這不是小差距，因為它代表模型開始能處理真實軟體介面。\u003C\u002Fp>\n\u003Cfigure class=\"my-6\">\u003Cimg src=\"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780007590324-py79.png\" alt=\"GPT-5.0 到 5.5 怎麼選\" class=\"rounded-xl w-full\" loading=\"lazy\" \u002F>\u003C\u002Ffigure>\n\u003Cp>對開發者來說，這很實際。你不一定要它寫出最漂亮的答案，但你會在乎它能不能登入後台、按按鈕、抓結果、再繼續下一步。\u003C\u002Fp>\u003Cp>這也解釋了為什麼 GPT-5.4 對 agent 很有吸引力。它不是只會回文字，而是能把一個任務拆成多個操作步驟，然後自己跑完一輪。\u003C\u002Fp>\u003Cul>\u003Cli>OSWorld-Verified：GPT-5.4 75.0%，人類 72.4%\u003C\u002Fli>\u003Cli>SWE-Bench Pro：GPT-5.4 是 57.7%\u003C\u002Fli>\u003Cli>FrontierMath：GPT-5.4 是 47.6%\u003C\u002Fli>\u003Cli>Tool search 讓 token 用量少 47%\u003C\u002Fli>\u003C\u002Ful>\u003Cp>但別太快高潮。\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-5-4\u002F\" target=\"_blank\" rel=\"noopener\">GPT-5.4\u003C\u002Fa> 的 100 萬 Token context 是 API-only，而且超過 27.2 萬 input tokens 之後，價格會繼續往上疊。長上下文很爽，帳單也很有感。\u003C\u002Fp>\u003Ch2>為什麼 GPT-5.5 會被最多團隊注意\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fopenai.com\u002Findex\u002Fgpt-5-5\u002F\" target=\"_blank\" rel=\"noopener\">GPT-5.5\u003C\u002Fa> 目前就是家族裡的成績王。它在 GPQA Diamond 拿到 93.6%，Terminal-Bench 2.0 是 82.7%，OSWorld-Verified 也有 78.7%。這幾個數字都很硬，特別是對知識工作和 coding 場景。\u003C\u002Fp>\u003Cp>它的 Pro 版本還有 90.1% BrowseComp 和 39.6% FrontierMath Tier 4。這表示它不只是會答題，也能在搜尋、數學、\u003Ca href=\"\u002Fnews\u002F5-midjourney-alternatives-for-image-creators-zh\">工具\u003C\u002Fa>操作上維持高水準。\u003C\u002Fp>\u003Cp>問題只有一個：貴。GPT-5.5 的 API 價格是每 100 萬 input tokens $5、output tokens $30。跟 GPT-5.4 的 $2.50 和 $15 比，直接翻倍。\u003C\u002Fp>\u003Cul>\u003Cli>GPT-5.5：最強，但不適合全量預設\u003C\u002Fli>\u003Cli>GPT-5.4：便宜一半，適合大量 agent 任務\u003C\u002Fli>\u003Cli>GPT-5.3 Instant：大約 $0.30 \u002F $1.20，最省錢\u003C\u002Fli>\u003Cli>GPT-5.2：推理夠強，但成本比 5.3 高\u003C\u002Fli>\u003C\u002Ful>\u003Cp>如果你做的是客服、摘要、搜尋回覆，GPT-5.3 很可能更合理。你不需要每次都上最貴模型，真的沒必要。\u003C\u002Fp>\u003Ch2>開發者現在該怎麼選\u003C\u002Fh2>\u003Cp>我的建議很簡單。高流量任務先放 GPT-5.3。推理很難的地方用 GPT-5.2。需要桌面操作或多步 agent，就上 GPT-5.4。只有在你真的想拼最高成績時，才把 GPT-5.5 拉進來。\u003C\u002Fp>\u003Cp>如果你做的是產品，路由策略比單一模型名更重要。因為不同請求的失敗成本差很多。寫文案錯一點，問題不大。財務分析錯一點，就會出事。\u003C\u002Fp>\u003Cp>另外一個現實是版本會變。OpenAI 已經提到 GPT-5.2 Thinking 會在 \u003Ca href=\"\u002Fnews\u002Frustweek-2026-turns-rust-into-shipped-code-zh\">2026\u003C\u002Fa> 年 6 月 3 日退場。這代表你不能只靠一次測試就上線，還要準備 fallback 和版本切換。\u003C\u002Fp>\u003Cul>\u003Cli>便宜流量：GPT-5.3\u003C\u002Fli>\u003Cli>硬推理：GPT-5.2\u003C\u002Fli>\u003Cli>agent 與桌面操作：GPT-5.4\u003C\u002Fli>\u003Cli>最高整體表現：GPT-5.5\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>GPT-5 家族背後的產業脈絡\u003C\u002Fh2>\u003Cp>\u003Ca href=\"https:\u002F\u002Fopenai.com\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa> 這波做法，其實很像雲端服務的產品切分。不是一個模型打天下，而是用不同價格和能力，去對應不同工作負載。\u003C\u002Fp>\u003Cp>這對\u003Ca href=\"\u002Ftag\u002F台灣開發者\">台灣開發者\u003C\u002Fa>很重要。很多團隊會先看 benchmark，再看 API 價格，最後才發現自己的資料流量根本不適合用最貴模型。講白了，模型選錯，成本就會爆。\u003C\u002Fp>\u003Cp>我覺得接下來的重點，不會只是更高分數。真正有價值的是更穩的工具使用、更長的任務記憶，還有更少的失誤回滾。這些才是產品能不能落地的核心。\u003C\u002Fp>\u003Cp>如果你已經在做 AI 產品，現在最值得做的事不是追新聞，而是把模型路由寫好。先定義便宜路徑，再定義高風險路徑，最後才考慮要不要用 GPT-5.5 當預設。\u003C\u002Fp>\u003Ch2>結論：別只看分數，先看工作型態\u003C\u002Fh2>\u003Cp>這一代 GPT-5 家族很清楚地告訴你一件事：沒有單一最佳模型。只有最適合你任務的模型。\u003C\u002Fp>\u003Cp>如果你要我直接給答案，我會說：日常用 GPT-5.3，難題用 GPT-5.2，agent 用 GPT-5.4，頂規場景再上 GPT-5.5。先這樣配，通常最划算。\u003C\u002Fp>","OpenAI 的 GPT-5 家族從 40 萬 Token 擴到 100 萬 Token，GPT-5.5 目前在多項 benchmark 領先，開發者該看價格、速度、推理還是 agent 工具能力。","felloai.com","https:\u002F\u002Ffelloai.com\u002Fthe-ultimate-chatgpt-model-comparison\u002F",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780007581188-95de.png","model-release","zh","3dea00fc-0edf-4a95-8809-803f0bea1b35",[17,18,19,20,21,22,23,24],"GPT-5","ChatGPT","OpenAI","LLM","模型比較","API","agent","benchmark",[26,27,28],"GPT-5 家族已經分成速度、成本、推理、agent 四種路線。","GPT-5.5 成績最好，但 API 價格也最高。","對開發者來說，模型路由比單看 benchmark 更重要。",3,"2026-05-28T22:32:39.07861+00:00","2026-05-28T22:32:39.052+00:00","0ccb5d2e-69f1-4354-a3e0-cb370221cd95",{"tags":34,"relatedLang":44,"relatedPosts":48},[35,37,39,40,42],{"name":19,"slug":36},"openai",{"name":18,"slug":38},"chatgpt",{"name":21,"slug":21},{"name":17,"slug":41},"gpt-5",{"name":20,"slug":43},"llm",{"id":15,"slug":45,"title":46,"language":47},"gpt-5-model-comparison-5-0-to-5-5-en","GPT-5.0 to 5.5: Which ChatGPT Model Wins?","en",[49,55,61,67,73,79],{"id":50,"slug":51,"title":52,"cover_image":53,"image_url":53,"created_at":54,"category":13},"466021f3-b8a4-4ecb-ad64-8070beaf9cbc","gemini-1-5-pro-002-flash-002-2-0-flash-update-zh","Gemini 1.5 與 2.0 Flash 更新上線","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780999389960-97qh.png","2026-06-09T10:02:27.849751+00:00",{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":13},"66ce4542-3c93-4a0c-ab52-5e6f90a36212","minimax-m3-kai-fang-quan-zhong-xie-cheng-shi-reng-neng-ying-zh","MiniMax M3 證明開放權重在寫程式上仍能贏","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780968786191-lele.png","2026-06-09T01:32:30.829528+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":13},"948a7dc4-b172-42f9-9bef-abcbbffaca18","gemini-35-flash-pricing-benchmarks-zh","Gemini 3.5 Flash 價格與長上下文解析","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780840978961-6b9n.png","2026-06-07T14:02:29.835438+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":13},"5507f140-5223-4f68-ade6-30d9e5457638","gemma-4-12b-specs-benchmarks-run-locally-zh","怎麼做 Gemma 4 12B 本地部署","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780777971165-4bit.png","2026-06-06T20:32:24.857611+00:00",{"id":74,"slug":75,"title":76,"cover_image":77,"image_url":77,"created_at":78,"category":13},"ef42a437-8b06-4ff5-a135-ece7662c01f4","best-kimi-models-2026-k2-5-vs-k2-thinking-zh","2026 最佳 Kimi 模型：K2.5 對 K2 Thinking","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780770790333-x3lk.png","2026-06-06T18:32:39.410186+00:00",{"id":80,"slug":81,"title":82,"cover_image":83,"image_url":83,"created_at":84,"category":13},"fd2ad557-5c09-4758-964d-cda1c3c87a4c","kimi-k2-6-open-source-coding-agent-swarm-zh","Kimi K2.6 開源加上 Agent Swarm","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780761795960-0zg9.png","2026-06-06T16:02:21.702099+00:00",[86,91,96,101,106,111,116,121,126,131],{"id":87,"slug":88,"title":89,"created_at":90},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":122,"slug":123,"title":124,"created_at":125},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","2026-03-29T04:52:57.886544+00:00",{"id":127,"slug":128,"title":129,"created_at":130},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":132,"slug":133,"title":134,"created_at":135},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]