SingNova-H Studio把本機AI變成PC

OraCore Editors

返回首頁

[TOOLS] 2026年5月21日10 分鐘閱讀OraCore 編輯部

SingNova-H Studio把本機AI變成PC

我拆 SingNova-H Studio 怎麼把 200 TOPS、本機推理和 RISC-V dataflow 組成可用的 local AI PC，最後附可直接套用的評估模板。

on-device inference TOPS dataflow architecture RISC-V local AI PC

分享 LinkedIn

我拆 SingNova-H Studio 怎麼把 200 TOPS、本機推理和 RISC-V dataflow 組成可用的 local AI PC，最後附可直接套用的評估模板。

我最近看一堆「AI PC」發表，老實說很膩。不是貼個 NPU 標籤就想算數，就是把雲端能力硬塞進本機，講得像使用者終於被照顧了，結果一用還是要登入、要連線、要交資料。我真正在意的不是行銷詞，是這台機器能不能把模型留在身邊跑，別再把本機推理講成附加功能。

所以我看到 Nanyang Singtech 發表 SingNova-H Studio 時，注意力直接被兩個字抓住：RISC-V dataflow，再加上 200 TOPS。這不是單純換殼的筆電規格，而是想把 local large models 這件事做成一台真的能用的 PC。我先不信廣告，先拆它的方法論。

Nanyang Singtech 說自己是由 Nanyang Technological University 孵化，並在 ATxSG 首次亮相。這種資料通常很愛把技術講得很滿，但工程細節又藏得很深。我反而覺得這種時候最適合拆：到底是架構真的有料，還是只是把「AI PC」三個字包裝得比較像樣。

別再把 AI PC 當貼紙看

訂閱 AI 趨勢週報

每週精選模型發布、工具應用與深度分析，直送信箱。不定期，不騷擾。

不會寄垃圾信，隨時可取消。

“...first RISC-V dataflow architecture AI PC with 200 TOPS for local large models.”

翻譯一下就是：它想賣的不是一台「有 AI 功能的電腦」，而是一台把本機模型運算放在核心位置的機器。這差很多。前者是功能表上的一格，後者是整台機器的設計起點。你如果真的在做推理、RAG、embedding、code assistant，差別會很快浮現。

我之前幫團隊整理本機推理環境時，最煩的就是這種名詞遊戲。廠商都說支援 local AI，但一問就露餡：沒有離線能力、沒有穩定 runtime、沒有持續負載下的數字。講白了，能 demo 不等於能工作。

實操上，我現在都先問三件事：第一，離線能不能跑；第二，持續 30 分鐘後會不會掉速；第三，runtime 是不是你能真的拿來接工作流，不是只能看展示影片。這三題過不了，AI PC 這個名詞我就先打折。

如果你也在看這類產品，我建議先把 RISC-V International 的基本資料看過，再把 TOPS 當成粗略指標，不要當聖經。TOPS 能告訴你大概有多少吞吐，但不能告訴你這台機器在真實工作負載下到底順不順。

RISC-V 的重點不是潮，是可改

“...RISC-V dataflow architecture...”

這句話的白話版是：這台機器不是只靠一顆通用 CPU 硬扛，而是想用更可客製的架構去處理模型運算。RISC-V 本身的價值，不在於它比較帥，而在於它讓硬體團隊比較能自己調整路徑，不必完全卡在單一大廠的節奏裡。

我會特別注意 dataflow，因為 local AI 真正麻煩的地方，常常不是算力不夠，而是資料怎麼流、怎麼搬、怎麼餵進去。模型推理很多時候就是大量矩陣運算、token 流動、記憶體搬移。如果架構是為這種模式設計的，熱、耗電、延遲就比較有機會壓下來。

我看過太多「加速」其實只是把 CPU 包裝一下，名字換得很玄，體感還是一樣卡。dataflow 這件事比較像正經路線，因為它關心的是資料路徑本身，不是只看峰值跑分。這種設計如果做得好，最直接的好處就是少一些無謂等待。

實操寫法很簡單：你在看硬體時，不要只問「支援什麼模型」，要問「這顆晶片是為什麼工作型態設計的」。再來是 memory bandwidth、precision、scheduler 在持續負載下怎麼表現。這些細節通常比任何「AI-ready」標章更有用。

先看它是不是為持續推理設計，不是只看 burst 數字。
問清楚記憶體路徑，因為很多 local model 都死在這裡。
確認是不是有針對 workload 的加速，而不是泛用算力口號。

200 TOPS 很大聲，但不等於很好用

“...with 200 TOPS for local large models...”

這句話的意思是：它想讓你相信本機跑大模型是可行的。這我不反對，但我會先把 200 TOPS 當成門票，不當成答案。因為峰值吞吐跟真實工作體感，常常是兩回事。跑 benchmark 很漂亮，接上你自己的 prompt chain 就開始喘，這種戲碼我看太多了。

「local large models」這幾個字其實比 TOPS 更重要。它代表目標不是只做小型 edge inference，而是希望你真的把模型留在本機，少碰雲端。這對隱私、延遲、離線使用、還有避免月租帳單，都是實打實的好處。

我之前做過一個內部 code-assist flow，模型單獨跑還行，一加上 retrieval、長上下文和幾個並發請求，硬體就開始露出原形。那次我學到一個很不爽但很有用的事：峰值算力不是可用吞吐，尤其不是你每天要面對的吞吐。

實操上，我會把 200 TOPS 當起點，然後追問 sustained throughput、token latency、記憶體大小、量化支援、還有 30 分鐘後的熱穩定性。比較時不要只拿規格表對規格表，直接拿一個真實工作流測：一段 prompt、一個 retrieval、一段 generation。這樣比較不會被數字騙。

如果你想看主流市場怎麼講 local AI，我會順手看 Intel Core Ultra 跟 AMD Ryzen AI。不是因為它們一定更強，而是因為它們代表主流敘事。你先知道大廠怎麼定義「本機 AI」，才看得出新產品到底是補位，還是真的不一樣。

真正的產品是 local large models，不是那台機殼

“...for local large models...”

這句話我會直接翻成：它不是賣一台普通 PC 再附送 AI，而是把「本機跑模型」當成主要用途。這個差別很大。因為只要你開始跑 embeddings、reranking、code generation、甚至多模態流程，硬體就不再是背景板，而是整個工作流的地基。

我喜歡 local large models，是因為控制權回來了。你決定資料在哪裡跑、模型怎麼換、更新怎麼控，不用每次都看雲端 API 臉色。這點很現實。尤其是你做產品或內部工具時，最煩的就是外部服務一改版，你的流程就跟著壞，還得跟團隊解釋「不是我寫爛，是對方偷偷改了」。

實操寫法是先畫需求表，不要先看硬體。列出你要跑的模型大小、context 長度、是否需要 embedding、是否要同時做 generation、並發數多少。再回頭看機器能不能 cover。這樣你比較不會被「可跑某某模型」這種話術牽著走。

還有一個常被忽略的點是 runtime。硬體再漂亮，runtime 不順就是廢。你要看有沒有標準工具、有沒有文件、有沒有 API，至少不要把自己鎖進一個只能看 demo 的黑盒子。能接工作流，才叫產品。

先定義你要跑的模型，再買硬體。
不要只看吞吐，要看延遲和穩定性。
確認 runtime 能不能離開 vendor demo 獨立使用。

NTU 孵化代表它不是純嘴砲，但也別先高潮

“...a deep-tech company incubated by Nanyang Technological University (NTU)...”

這句話的白話版是：它背後大概率有研究底子，不是完全空手喊口號。這對我來說是加分，但不是蓋章通過。學術孵化通常意味著團隊真的碰過架構問題、效率問題、硬體限制，不是只會做簡報。

不過我也踩過這種坑：研究型團隊很會做 prototype，不代表很會做產品。從實驗室走到能給開發者用，中間差的是文件、SDK、支援、供應鏈，還有一堆很無聊但很致命的細節。這些東西不性感，可是少一個都會卡。

實操上，我會去看研究和落地中間那條橋。它有沒有 developer page？有沒有 SDK？有沒有範例？有沒有明確的 workload 定位？如果答案都很空，那你看到的可能只是研究成果的包裝版，不是能進工作流的東西。

NTU 本身是可信的錨點，這沒問題。問題是，可信不等於可買。硬體世界最常見的教訓就是：第一版發表通常只是開始，真正決定它是不是有用的，是後面能不能讓開發者直接上手。

ATxSG 這種場子，最會把半成品照得很漂亮

“At this year’s ATxSG technology exhibition...”

這句話的意思是：它是在一個很懂基礎建設、連線、邊緣部署的場子亮相。這其實選得不錯，因為 local AI PC 本來就不是純消費電子，它牽涉的是延遲、資料流、部署成本、還有本機算力怎麼跟現場需求對接。

但展會也很會騙人。燈打亮、demo 跑順、講者語氣很穩，很多看起來很厲害的東西，一離開 booth 就沒了。我對這種發表一向都只給「有意圖」分數，不直接給「可用」分數。因為那中間差很遠。

實操寫法是：你看到展會發表，不要只問它多新，要問它離開展場後還剩什麼。文件在哪？SDK 在哪？定價在哪？支援窗口在哪？如果這些都沒有，那就是表演。如果有，才值得進一步測。

我也會建議去看 ATxSG 官方網站，先理解這個場子到底在對誰說話。你會更容易判斷這台機器是給開發者、企業採購，還是只給媒體標題用的。

可抄的模板

# local AI PC 評估模板

用在任何宣稱能跑本機大模型的機器上。

## 1) 廠商怎麼說
- 產品名稱：
- 架構：
- 宣稱 TOPS：
- 記憶體配置：
- 支援的模型類型：
- runtime / 軟體堆疊：

## 2) 我一定要驗證的事
- 能不能完全離線跑一個有用的模型？
- 持續 30 分鐘後延遲有沒有飄？
- 多請求並發時會不會崩？
- 記憶體壓力上來後表現如何？
- runtime 能不能離開 demo 獨立使用？
- docs、SDK、API 是否真的存在？

## 3) 我的測試工作流
- 模型：
- context 長度：
- prompt 類型：
- retrieval 步驟：
- 輸出長度：
- 並發數：
- 功耗 / 散熱限制：

## 4) pass / fail
- 峰值吞吐：
- 持續吞吐：
- token latency：
- 散熱表現：
- 離線可靠度：
- 開發者體驗：

## 5) 最後決定
- 買 / 再測 / 不買
- 原因：
- 什麼會讓我改變判斷：

## 6) 丟給廠商的短問題
1. 這台機器最適合什麼 workload？
2. 持續性能是多少，不是峰值。
3. 本機實際能跑多大的模型？
4. 開發者第一天拿得到什麼工具？
5. runtime 壞掉時怎麼支援？

這段是我把原始發表拆完之後，整理成能直接拿去問廠商、做 PoC、做採購比對的版本。原始來源是 The Manila Times / Globe Newswire 這篇；前面那些判讀和模板是我自己的整理，不是原文照抄。

// 相關文章

SingNova-H Studio把本機AI變成PC

別再把 AI PC 當貼紙看

訂閱 AI 趨勢週報

RISC-V 的重點不是潮，是可改

200 TOPS 很大聲，但不等於很好用

真正的產品是 local large models，不是那台機殼

NTU 孵化代表它不是純嘴砲，但也別先高潮

ATxSG 這種場子，最會把半成品照得很漂亮

可抄的模板

Magenta RealTime 2 讓你在 DAW 裡即時改曲

開源 AI 工具在價值上已經贏過 Claude 付費方案

500 個 AI agent 專案，現在能做什麼

Chocolatey 的 Go 安裝變成政策

Go 支援政策把發版變清單

RustDesk 自架遠端存取部署指南