[TOOLS] 10 分鐘閱讀OraCore 編輯部

Gemini Live 讓你少切 App

我拆 Gemini Live 新增 Connected Apps 的玩法,整理成 Android 助理設計可直接抄的動作清單、fallback 與模板。

分享 LinkedIn
Gemini Live 讓你少切 App

Gemini Live 在 Android 多接了更多 Connected Apps,重點不是炫技,是讓你少切 App、直接在對話裡把事做完。

我用 Gemini Live 在 Android 有一陣子了。老實說,前面那套一直讓我有點煩:嘴巴上說是「自然對話」,實際上我問到一半,還是得自己跳出去開別的 App。要查行程、設計提醒、放音樂、看地圖,甚至只是設個計時器,最後都像在幫它補作業。它不是不能聊,是聊完之後常常沒辦法真的動手,這種卡住感很傷。

我後來看到 9to5Google 上 Abner Li 的整理,才知道這次更新的重點是 Connected Apps 範圍擴大,而且 Live 在 Android 上開始更像一個能直接下指令的控制層。這不是那種看起來很熱鬧、實際沒差的改版;我會在意,是因為它碰到的剛好是我最討厭的那種摩擦:對話已經開始了,結果還要切走。

我最不爽的,不是 Gemini Live 不聰明,是它太常只能講不能做

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。

不會寄垃圾信,隨時可取消。

Gemini Live on Android can now access more first- and third-party Connected Apps.

翻譯一下就是:Live 不再只是陪你聊天,它開始能直接碰到更多你真的會用的服務。Google 這次講得很直白,核心是把語音對話、文字輸入、以及外部服務接起來,讓你不用一直在不同介面之間來回跳。這句話聽起來很產品稿,但我覺得它至少講對一件事:助理最怕的不是答錯,而是答完之後還得你自己收尾。

Gemini Live 讓你少切 App

我之前最常遇到的場景是旅遊規劃。先問航班,再問飯店,再補地圖,再塞一個提醒。理論上這些都是助理該幫忙的事,結果實際上我常常是先跟它聊,聊完再自己開別的 App 完成。那就很尷尬,因為我等於把腦力花兩次:一次是講清楚需求,一次是自己把流程補完。

實操寫法很簡單:如果你在做 AI 助理,不要先想「它能回答什麼」,先想「它能直接完成什麼」。只要使用者還要離開對話去做收尾,你的產品就還沒真的進入工作流。

這次真正有料的不是介面,而是 Connected Apps 的範圍

Google 這次把重點放在更多第一方與第三方 Connected Apps 上,像是 Home、Hotels、Flights、Workspace、Image generation、Shopping、Utilities、YouTube、YouTube Music,另外還有 Spotify。我會說這比 UI 改版重要得多,因為介面再漂亮,能做的事太少,最後還是會變成展示用。

在這之前,Gemini Live 主要是接 Google Calendar、Tasks、Keep、Maps,還有一些 OEM 對應服務。那套不是沒用,但很窄。行事曆和地圖很合理,筆記和任務也算基本盤,可是如果你想把 Live 真的當成日常入口,光這些不夠。人每天最常叫助理做的事,很多都很土:設鬧鐘、播音樂、查飯店、看航班、控制家裡設備。這些不性感,但很常用。

  • Home 讓我想到的是直接做智慧家庭控制,不用再切到別的控制面板。
  • Flights 和 Hotels 會讓旅遊查詢少掉很多碎片化步驟。
  • Workspace 才是我最在意的,因為它開始碰到工作內容本身。
  • Utilities 雖然很無聊,但 timer 和 alarm 這種小事才是高頻需求。

我之前試過把助理當成預設入口,結果常常卡在最後一步。它知道我要什麼,但不能直接幫我做完。這種體驗最煩,因為你會以為自己快完成了,結果還是得手動收尾。Connected Apps 不是萬靈丹,但至少把很多原本會斷掉的地方補起來了。

實操寫法:你如果在設計助理產品,先列出使用者最常「問完還要離開去做」的十個動作,然後把這些動作直接接進對話流程。不要逼使用者自己猜哪個功能藏在哪個頁面。

Utilities 很無聊,但它其實是在測產品有沒有真的能用

Google 特別提到 Utilities,意思很直接:timer 和 alarm 這類功能現在也能在 Live 裡面處理。這種東西乍看很小,我反而覺得它最誠實。因為真正決定一個助理是不是好用的,往往不是它能不能講大道理,而是它能不能把這些小事順手做掉。

Gemini Live 讓你少切 App

我自己最常用的就是這類低門檻、高頻率動作。做菜時要計時、開會時要提醒、工作時要抓一段專注時間。這些需求沒有什麼技術含量,但就是每天都會碰到。如果助理連這些都要我跳出來找功能,那我根本不會想再用第二次。

這裡有個很現實的 UX 問題:使用者不會只因為你很會聊天就原諒你。你如果在大任務上做得漂亮,卻連計時器都不穩,整個產品還是會被當成半成品。反過來說,只要這些小動作夠順,使用者就會開始相信它。

  • 先把高頻小動作做順。
  • 讓它們跟對話共用同一個畫面。
  • 把「不用切 App」當成基本要求,不要當賣點。

實操寫法:你做 AI 助理時,先把最常見的 5 個小任務列出來,像是設鬧鐘、加提醒、存筆記、查狀態、播內容。這些先做到穩,再談更複雜的工作流。順序錯了,產品會很虛。

Live 變得更像 Gemini 主體,不再像旁邊掛一個語音玩具

9to5Google 的說法很準,Live 現在已經「幾乎跟 Gemini app 本體打平」,至少在 overlay 那條線上是這樣。這句話我認同,因為它點出一個我一直很在意的問題:如果同一個產品有兩個模式,但能力差很多,使用者就會開始背規則。誰要記得哪個模式能做什麼?很煩。

我比較喜歡的方向,是讓文字、語音、外部動作都在同一條上下文裡。你可以先打字,再接著講話,然後直接觸發服務,中間不要斷。這樣使用者不用切換心智模型,也不用重建上下文。助理最值錢的地方,本來就是幫你保留脈絡,不是幫你製造新脈絡。

不過這次還是有一個明顯缺口:Messages 的送出能力還沒進來。Google 早就提過這件事,但現在還沒完全開。這種缺口很容易讓人誤會產品已經到位,結果一試就撞牆。我會把這當成提醒:模式之間如果有能力差異,就要講清楚,不然信任感掉得很快。

實操寫法:如果你的產品有文字模式和語音模式,請先做能力盤點。把兩邊能做的事列成表,差異越大,越要明講。不要讓使用者自己猜,猜錯一次就不想再猜第二次。

第三方支援才是這種功能能不能活下來的關鍵

第一方服務能補基本盤,但真正讓我覺得這次更新有機會站穩的,是第三方支援。Android 本來就不是一個整齊劃一的世界,機型、地區、OEM、預設服務全都亂七八糟。你如果只顧自己家的服務,最後就是做出一個很完整、但只在小圈子裡好用的東西。

Connected Apps 的思路比較務實:讓更多服務可以掛進同一條對話裡。這樣一來,使用者不需要記得某個功能在哪個 App,也不用被迫接受單一入口。對我來說,這種設計比單點功能加強更像真的在解決問題,因為它處理的是「整體流程」不是「某個按鈕」。

我以前看過不少助理產品死在這裡。發表會看起來很漂亮,demo 也很順,可是一旦碰到實際環境,少一個服務、少一個權限、少一個整合,整件事就垮了。這次 Google 至少是往更廣的整合面走,不是只在自家服務裡打轉。

實操寫法:如果你在做整合,別只先接最順手的第一方。去列出使用者真正在用的服務,尤其是競品或第三方。你不處理使用者現實中的工具組合,就只是在做一個漂亮的死巷。

我會怎麼用這次更新:把助理當成「不中斷的工作流」

如果要我一句話講這次更新的價值,我會說:它讓 Gemini Live 更像一個不中斷的工作流入口,而不是一個會講話的功能。這差很多。前者是你真的會打開來用,後者通常只會在你想試玩時出現一下。

我會拿它做的場景很實際:查旅遊資訊、設提醒、開計時器、播音樂、看地圖、順手接 Workspace。這些事情本來就常常連在一起,沒必要拆成一堆獨立步驟。只要對話還在,動作就應該接著走,不要中斷。

對開發者來說,這次最值得抄的不是某個功能名,而是它背後的流程觀。先讓對話能接動作,再讓動作能保留上下文,最後才去想要不要加更多花俏能力。順序反了,產品很容易變成一堆功能拼盤。

實操寫法:你在設計 AI 產品時,先問自己一個問題——使用者能不能在同一條對話裡把事情做完?如果答案是否定的,先補工作流,再補模型能力。這比一直堆新功能實際多了。

可抄的模板

# Android 助理的 Connected Apps 設計模板

## 目標
讓使用者在同一條對話裡完成任務,不必離開聊天介面。

## 1. 先列出高頻動作
- 設定 timer
- 設定 alarm
- 建立行事曆事件
- 新增 task
- 儲存 note
- 查地圖路線
- 搜尋航班
- 搜尋飯店
- 控制智慧家庭
- 播放音樂
- 生成圖片
- 查 Workspace 文件

## 2. 把動作對應到服務
| 使用者動作 | 對應服務 |
|---|---|
| 設定 timer | Utilities |
| 設定 alarm | Utilities |
| 建立行事曆事件 | Calendar |
| 新增 task | Tasks |
| 儲存 note | Keep |
| 查路線 | Maps |
| 搜尋航班 | Flights |
| 搜尋飯店 | Hotels |
| 控制裝置 | Home |
| 播放音樂 | YouTube Music / Spotify |
| 生成圖片 | Image generation |
| 查工作文件 | Workspace |

## 3. 保留上下文
對話過程中要保留:
- intent
- entities
- 時間
- 地點
- 帳號狀態

## 4. 明確處理失敗
如果某個動作不能做,不要裝沒事。

範例回覆:
-「我現在還不能從 Live 直接送出 Messages,但我可以先幫你草擬。」
-「這個動作目前不支援,我可以改幫你開啟對應 App。」

## 5. 先做小事
優先處理最常被重複使用的功能:
- timers
- alarms
- reminders
- quick search
- note capture
- playback control

## 6. 產品規則
如果使用者能在 10 秒內完成任務,就應該留在同一個 live interface。
如果要多次切 App,流程大概就壞了。

## 7. 系統提示詞片段
你是一個在 Android 裡運作的 live assistant。請維持同一條對話,不要逼使用者切換 App。當 connected app 能完成任務時,直接呼叫它。若能力缺失,請清楚說明限制,並提供最接近的替代動作。

這個模板我最想保留的地方,是它逼你先想「動作」再想「功能」。很多 AI 產品做爛,不是模型不行,是產品團隊一開始就把問題想成功能清單。你只要把目標改成「讓使用者不要離開對話就完成事情」,設計會立刻收斂很多。

原始來源是 9to5Google 的文章,作者是 Abner Li;我上面拆的框架和模板,是我根據這篇報導延伸出來的工作流寫法,不是原文直接給的結論。