[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"article-apple-siri-gemini-distilled-models-zh":3,"article-related-apple-siri-gemini-distilled-models-zh":28,"series-model-release-e112e76f-ec3b-408f-810e-e93ae21a888a":85},{"id":4,"slug":5,"title":6,"content":7,"summary":8,"source":9,"source_url":10,"author":11,"image_url":12,"cover_image":12,"category":13,"language":14,"translated_content":11,"related_article_id":15,"keywords":16,"key_takeaways":11,"views":25,"created_at":26,"published_at":27,"topic_cluster_id":11},"e112e76f-ec3b-408f-810e-e93ae21a888a","apple-siri-gemini-distilled-models-zh","Apple Siri 牽手 Gemini 的真相","\u003Cp>Apple 這次不是單純買 API。它買的是 \u003Ca href=\"https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs\" target=\"_blank\" rel=\"noopener\">Google Gemini\u003C\u002Fa> 在資料中心的完整使用權。然後再拿來訓練更小的模型，塞回 \u003Ca href=\"https:\u002F\u002Fwww.apple.com\u002F\" target=\"_blank\" rel=\"noopener\">Apple\u003C\u002Fa> 自家裝置。\u003C\u002Fp>\u003Cp>講白了，這是「大模型教小模型」的蒸餾路線。重點不是把 Gemini 直接搬進 iPhone。重點是把它的能力壓縮成 Apple 跑得動的版本。\u003C\u002Fp>\u003Cp>這件事很 Apple。它一向討厭把太多東西丟上雲端。可是在生成式 AI 這題上，硬體限制和隱私要求一起卡住，Apple 只好找外援。\u003C\u002Fp>\u003Ch2>Apple 到底買了什麼\u003C\u002Fh2>\u003Cp>《\u003Ca href=\"https:\u002F\u002Fwww.theinformation.com\u002F\" target=\"_blank\" rel=\"noopener\">The Information\u003C\u002Fa>》的說法很直接。Apple 和 Google 有一份協議。Apple 可以在資料中心完整使用 Gemini。不是只拿到一個薄薄的 API 包裝。\u003C\u002Fp>\u003Cp>這差很多。因為 Apple 要的不是聊天框。它要的是訓練素材。它想用 Gemini 當老師，去教自己的 student model。\u003C\u002Fp>\u003Cp>這種做法很適合手機。因為手機最怕三件事：記憶體不夠、電池掉太快、延遲太高。大型 LLM 很猛，但不一定適合塞進 iPhone。\u003C\u002Fp>\u003Cp>所以 Apple 真正在買的，是訓練效率。它買的是一條比較短的路。不是終點。\u003C\u002Fp>\u003Cul>\u003Cli>Apple 拿到的是資料中心層級的 Gemini 存取權。\u003C\u002Fli>\u003Cli>目標是蒸餾出更小的模型。\u003C\u002Fli>\u003Cli>小模型要適合 iPhone 和其他 Apple 裝置。\u003C\u002Fli>\u003Cli>重點是降低推論成本，不是追求最大參數量。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>為什麼蒸餾比新聞標題更重要\u003C\u002Fh2>\u003Cp>模型蒸餾不是新招。大模型先產生答案、標註或行為軌跡，再讓小模型學。這樣做，學生模型通常沒那麼全能，但速度快很多，吃的資源也少很多。\u003C\u002Fp>\u003Cp>對 Apple 來說，這幾乎是唯一合理的路。Siri 被罵很久了。你如果直接把巨型模型放進每支 iPhone，成本和耗電都會很難看。\u003C\u002Fp>\u003Cp>Apple 自己也早就在走效率路線。它的 \u003Ca href=\"https:\u002F\u002Fmachinelearning.apple.com\u002F\" target=\"_blank\" rel=\"noopener\">Apple Machine Learning Research\u003C\u002Fa> 很多東西都偏向裝置端。它不是要最大，而是要最省。\u003C\u002Fp>\u003Cp>這種策略很像 Apple 一貫的產品哲學。少一點炫技，多一點整合。少一點雲端依賴，多一點本機處理。\u003C\u002Fp>\u003Cp>你可以把兩種模型簡單比一下：\u003C\u002Fp>\u003Cul>\u003Cli>大模型：懂很多，但很吃算力。\u003C\u002Fli>\u003Cli>小模型：懂得少一點，但跑得快。\u003C\u002Fli>\u003Cli>雲端助手：容易升級，但很吃網路。\u003C\u002Fli>\u003Cli>裝置端助手：更私密，但訓練門檻更高。\u003C\u002Fli>\u003C\u002Ful>\u003Ch2>這對 Siri 和 Apple Intelligence 代表什麼\u003C\u002Fh2>\u003Cp>Apple 的 \u003Ca href=\"https:\u002F\u002Fwww.apple.com\u002Fapple-intelligence\u002F\" target=\"_blank\" rel=\"noopener\">Apple Intelligence\u003C\u002Fa> 路線很清楚。它想把 AI 做成系統功能，不是做成一個獨立聊天頁面。這種設計會直接壓到 Siri 的表現。\u003C\u002Fp>\u003Cp>因為 Siri 不只要會回答。它還要會改寫文字、整理摘要、理解上下文，甚至跨 App 做事。這些功能都很吃模型品質。\u003C\u002Fp>\u003Cp>Gemini 這條線，等於幫 Apple 補訓練資料。Apple 可以拿更強的 teacher model，去磨自己的小模型。理論上，這會讓 Siri 更像樣。\u003C\u002Fp>\u003Cp>但別把蒸餾想得太神。小模型會變快，沒錯。可如果 Apple 切得太狠，能力也會一起縮水。速度變快，不代表真的變聰明。\u003C\u002Fp>\u003Cblockquote>“There are no shortcuts to building a great product.” — Tim Cook, Apple CEO, Apple Q3 2016 earnings call.\u003C\u002Fblockquote>\u003Cp>這句話拿來看今天的 Siri，還是很準。Apple 可以借 Google 的訓練能力。可最後的體驗，還是要看它怎麼整合進 iOS、Shortcuts、Messages、Mail。\u003C\u002Fp>\u003Cp>如果整合做不好，模型再強也沒用。使用者只會覺得 Siri 還是那個老樣子。\u003C\u002Fp>\u003Ch2>Apple 跟其他 AI 玩家怎麼比\u003C\u002Fh2>\u003Cp>Apple 的路線，跟 OpenAI 和 Google 很不一樣。\u003Ca href=\"https:\u002F\u002Fopenai.com\u002F\" target=\"_blank\" rel=\"noopener\">OpenAI\u003C\u002Fa> 主打大模型和聊天體驗。\u003Ca href=\"https:\u002F\u002Fai.google.dev\u002Fgemini-api\u002Fdocs\" target=\"_blank\" rel=\"noopener\">Google Gemini\u003C\u002Fa> 則是把模型塞進搜尋、Android 和雲端服務。\u003C\u002Fp>\u003Cp>Apple 反過來。它先看裝置能不能跑，再看模型能不能縮。這很慢，但很符合它的硬體生意。\u003C\u002Fp>\u003Cp>另外，\u003Ca href=\"https:\u002F\u002Fwww.anthropic.com\u002F\" target=\"_blank\" rel=\"noopener\">Anthropic\u003C\u002Fa> 也是值得參考的對手。它在企業和助理型產品裡，走的是比較穩的模型路線。Apple 這次的選擇，某種程度也反映出市場已經進入「誰能把模型塞進真實產品」的階段。\u003C\u002Fp>\u003Cp>如果只看數字，差距就很現實。大型 frontier model 常常需要更大的記憶體和算力。手機端模型則要在有限電量下，維持低延遲回應。這不是同一個戰場。\u003C\u002Fp>\u003Cul>\u003Cli>OpenAI：偏向通用能力和聊天入口。\u003C\u002Fli>\u003Cli>Google：偏向雲端整合和搜尋分發。\u003C\u002Fli>\u003Cli>Apple：偏向裝置端、系統整合、隱私。\u003C\u002Fli>\u003Cli>Anthropic：偏向企業應用和助理型工作流。\u003C\u002Fli>\u003C\u002Ful>\u003Cp>所以這次合作的重點，不是誰比較強。重點是誰能把強模型，變成可部署的小模型。這才是手機 AI 的現實。\u003C\u002Fp>\u003Ch2>這其實是 Apple 的老套路\u003C\u002Fh2>\u003Cp>Apple 很少第一個跳下去。它通常先看別人把坑踩完，再把東西做成產品。這次 AI 也差不多。它沒有急著跟所有人拼公開聊天機器人。\u003C\u002Fp>\u003Cp>它先把重點放在系統功能。像照片、語音、搜尋、摘要，這些都比較像底層能力，不像單獨的 AI 產品頁。\u003C\u002Fp>\u003Cp>這種做法有一個好處。使用者不需要學新介面。AI 直接藏在系統裡。你打字、修圖、找資料，它自己出現。\u003C\u002Fp>\u003Cp>但這種做法也有風險。因為一旦 Siri 還是卡卡的，使用者會直接怪 Apple。沒人會管你背後是不是用了 Gemini。\u003C\u002Fp>\u003Cp>我覺得 Apple 這次最聰明的地方，是它沒有硬拚「最大模型」。它拚的是「最適合裝置的模型」。\u003C\u002Fp>\u003Ch2>背景脈絡：為什麼現在非做不可\u003C\u002Fh2>\u003Cp>生成式 AI 已經變成平台基本盤。手機作業系統如果沒有 AI 功能，體驗就會顯得落後。這不是行銷問題，是產品節奏問題。\u003C\u002Fp>\u003Cp>同時，使用者也越來越在意資料去哪裡。把每個問題都丟到雲端，對 Apple 來說本來就不漂亮。尤其是在 iPhone 這種靠信任吃飯的產品上。\u003C\u002Fp>\u003Cp>所以 Apple 必須找一個折衷。它需要更好的模型能力，也需要控制資料流向。Gemini 蒸餾方案，剛好卡在這個中間點。\u003C\u002Fp>\u003Cp>這也是為什麼很多人會把這件事看得很大。不是因為合作本身多華麗。是因為它說明 Apple 已經接受一件事：單靠自己慢慢磨，不一定夠快。\u003C\u002Fp>\u003Cp>而且市場也不會等它。Android 陣營、OpenAI、Microsoft、Google，都在把 AI 直接塞進產品。Apple 如果太慢，Siri 會繼續被拿來當笑話。\u003C\u002Fp>\u003Ch2>接下來要看什麼\u003C\u002Fh2>\u003Cp>接下來我會盯兩件事。第一，Apple 會不會真的把蒸餾後的小模型放進 Siri。第二，這些功能會不會在日常操作裡真的有感。\u003C\u002Fp>\u003Cp>如果 Siri 能更快理解指令、改寫文字、跨 App 找資料，那這筆合作就算值回票價。反過來，如果只是 demo 好看，實際還是常常答非所問，那問題就不在 Gemini。\u003C\u002Fp>\u003Cp>我的判斷很簡單。Apple 會低調用 Google 的模型幫忙，然後把成果包成自家功能。它大概率不會把合作講得太大聲。\u003C\u002Fp>\u003Cp>真正的問題只有一個：Apple 能不能把 teacher model 變成你我每天都會用到的 Siri 體驗？如果答案是可以，那 iPhone 的 AI 會開始像樣。要是還是不行，那就代表 Apple 這回只是又多買了一點時間。\u003C\u002Fp>","Apple 付費取得 Google Gemini 的資料中心存取權，目標是蒸餾出更小的模型，塞進 Siri 和裝置端 AI。這招很務實，也很 Apple。","theverge.com","https:\u002F\u002Ftheverge.com\u002Fnews\u002F860521\u002Fapple-siri-google-gemini-ai-personalization",null,"https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Fcover-1774759977164-0lm185.png","model-release","zh","97f66dfa-c6b5-451a-933d-f1a4863e2547",[17,18,19,20,21,22,23,24],"Apple","Siri","Gemini","蒸餾模型","Apple Intelligence","LLM","人工智慧","iPhone",3,"2026-03-29T04:52:57.886544+00:00","2026-03-29T04:52:57.862+00:00",{"tags":29,"relatedLang":44,"relatedPosts":48},[30,31,33,34,36,38,40,42],{"name":23,"slug":23},{"name":17,"slug":32},"apple",{"name":20,"slug":20},{"name":22,"slug":35},"llm",{"name":21,"slug":37},"apple-intelligence",{"name":24,"slug":39},"iphone",{"name":18,"slug":41},"siri",{"name":19,"slug":43},"gemini",{"id":15,"slug":45,"title":46,"language":47},"apple-siri-gemini-distilled-models-en","Apple’s Siri bet now includes Google’s Gemini","en",[49,55,61,67,73,79],{"id":50,"slug":51,"title":52,"cover_image":53,"image_url":53,"created_at":54,"category":13},"466021f3-b8a4-4ecb-ad64-8070beaf9cbc","gemini-1-5-pro-002-flash-002-2-0-flash-update-zh","Gemini 1.5 與 2.0 Flash 更新上線","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780999389960-97qh.png","2026-06-09T10:02:27.849751+00:00",{"id":56,"slug":57,"title":58,"cover_image":59,"image_url":59,"created_at":60,"category":13},"66ce4542-3c93-4a0c-ab52-5e6f90a36212","minimax-m3-kai-fang-quan-zhong-xie-cheng-shi-reng-neng-ying-zh","MiniMax M3 證明開放權重在寫程式上仍能贏","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780968786191-lele.png","2026-06-09T01:32:30.829528+00:00",{"id":62,"slug":63,"title":64,"cover_image":65,"image_url":65,"created_at":66,"category":13},"948a7dc4-b172-42f9-9bef-abcbbffaca18","gemini-35-flash-pricing-benchmarks-zh","Gemini 3.5 Flash 價格與長上下文解析","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780840978961-6b9n.png","2026-06-07T14:02:29.835438+00:00",{"id":68,"slug":69,"title":70,"cover_image":71,"image_url":71,"created_at":72,"category":13},"5507f140-5223-4f68-ade6-30d9e5457638","gemma-4-12b-specs-benchmarks-run-locally-zh","怎麼做 Gemma 4 12B 本地部署","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780777971165-4bit.png","2026-06-06T20:32:24.857611+00:00",{"id":74,"slug":75,"title":76,"cover_image":77,"image_url":77,"created_at":78,"category":13},"ef42a437-8b06-4ff5-a135-ece7662c01f4","best-kimi-models-2026-k2-5-vs-k2-thinking-zh","2026 最佳 Kimi 模型：K2.5 對 K2 Thinking","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780770790333-x3lk.png","2026-06-06T18:32:39.410186+00:00",{"id":80,"slug":81,"title":82,"cover_image":83,"image_url":83,"created_at":84,"category":13},"fd2ad557-5c09-4758-964d-cda1c3c87a4c","kimi-k2-6-open-source-coding-agent-swarm-zh","Kimi K2.6 開源加上 Agent Swarm","https:\u002F\u002Fxxdpdyhzhpamafnrdkyq.supabase.co\u002Fstorage\u002Fv1\u002Fobject\u002Fpublic\u002Fcovers\u002Finline-1780761795960-0zg9.png","2026-06-06T16:02:21.702099+00:00",[86,91,96,101,106,111,116,121,122,127],{"id":87,"slug":88,"title":89,"created_at":90},"58b64033-7eb6-49b9-9aab-01cf8ae1b2f2","nvidia-rubin-six-chips-one-ai-supercomputer-zh","NVIDIA Rubin 把六顆晶片塞進 AI 機櫃","2026-03-26T07:18:45.861277+00:00",{"id":92,"slug":93,"title":94,"created_at":95},"0dcc2c61-c2a6-480d-adb8-dd225fc68914","march-2026-ai-model-news-what-mattered-zh","2026 年 3 月 AI 模型新聞重點","2026-03-26T07:32:08.386348+00:00",{"id":97,"slug":98,"title":99,"created_at":100},"214ab08b-5ce5-4b5c-8b72-47619d8675dd","why-small-models-are-winning-on-device-ai-zh","小模型為何吃下裝置端 AI","2026-03-26T07:36:30.488966+00:00",{"id":102,"slug":103,"title":104,"created_at":105},"785624b2-0355-4b82-adc3-de5e45eecd88","midjourney-v8-faster-images-higher-costs-zh","Midjourney V8 變快了，也變貴了","2026-03-26T07:52:03.562971+00:00",{"id":107,"slug":108,"title":109,"created_at":110},"cda76b92-d209-4134-86c1-a60f5bc7b128","xiaomi-mimo-trio-agents-robots-voice-zh","小米 MiMo 三模型瞄準代理、機器人與語音","2026-03-28T03:05:08.779489+00:00",{"id":112,"slug":113,"title":114,"created_at":115},"9e1044b4-946d-47fe-9e2a-c2ee032e1164","xiaomi-mimo-v2-pro-1t-moe-agents-zh","小米 MiMo-V2-Pro 登場：1T MoE 模型","2026-03-28T03:06:19.002353+00:00",{"id":117,"slug":118,"title":119,"created_at":120},"c4b6186f-bd84-4598-997e-c6e31d543c0d","cursor-composer-2-agentic-coding-model-zh","Cursor Composer 2 走向代理式寫碼","2026-03-28T03:13:06.422716+00:00",{"id":4,"slug":5,"title":6,"created_at":26},{"id":123,"slug":124,"title":125,"created_at":126},"c679b51f-194a-463b-87fc-7695256ff752","mimo-v2-pro-vs-omni-vs-flash-2026-zh","MiMo V2 Pro、Omni、Flash 怎麼選","2026-04-02T01:18:43.576128+00:00",{"id":128,"slug":129,"title":130,"created_at":131},"3b988fd7-6749-4f01-ba25-c0ad7486dc31","z-ai-glm-5v-turbo-design2code-claude-zh","GLM-5V-Turbo 在 Design2Code 贏了…","2026-04-02T04:03:36.31741+00:00"]