為什麼 Sora 證明影片 AI 還沒準備好走向主流
Sora 很驚艷,但它也證明影片 AI 仍不夠可靠、成本太高,且很容易被濫用,因此還沒準備好成為主流工具。

Sora 很驚艷,但它也證明影片 AI 仍不夠可靠、成本太高,且很容易被濫用。
Sora 是最清楚的證據:影片 AI 已經跨過「能不能做出來」的展示門檻,卻還沒跨過「能不能放心用」的產品門檻。OpenAI 在 2024 年 2 月公開預覽時,影片的連貫性確實驚人,但同時也暴露出物理邏輯、左右一致性與因果連續性的問題。到了 2024 年 12 月,Sora 先在美國與加拿大的 ChatGPT Plus、Pro 使用者中推出,討論焦點已經從「能不能生成影片」變成「誰敢拿它當真」。答案很明確:不敢。後來 Sora app 在 2026 年 4 月關閉,更把這件事說死了。
第一個論點
訂閱 AI 趨勢週報
每週精選模型發布、工具應用與深度分析,直送信箱。不定期,不騷擾。
不會寄垃圾信,隨時可取消。
第一個原因很簡單:看起來像真的,不等於真的可靠。OpenAI 自己就承認,模型在複雜物理模擬、左右辨識與時間一致性上仍有明顯限制。這不是影片系統的小瑕疵,而是核心能力的裂縫。影片本來就該保留運動、物件恆常性與場景連續性;如果模型連這些都守不住,那它產出的東西再漂亮,也只是短暫迷惑人眼的假象。

這個落差在高風險場景尤其致命。圖像可以被當成藝術、概念圖或靈感草稿,但生成影片很容易被誤認為證據、教學或紀錄。Sora 早期展示之所以震撼,正是因為它像真實影像;問題也正出在這裡。OpenAI 雖然加入可見浮水印與 C2PA metadata,但在 Sora 2 發布後不到一週,第三方工具就出現了移除浮水印的方法。當 provenance 標記能被輕易拆掉,信任層就塌了,模型反而更像一台高效率的造假機器。
第二個論點
Sora 也暴露了另一個硬現實:影片生成的經濟模型,撐不起真正的規模化使用。上線後的報導指出,Sora 全球使用者一度接近 100 萬,之後跌破 50 萬;同時,因為影片生成的算力需求極高,服務每天估計要燒掉約 100 萬美元。這不是健康的消費級產品曲線,而是典型的「展示很漂亮,真正上量就出血」的樣子。
這個成本結構也解釋了為什麼產品後來走不下去。OpenAI 沒有公開完整關閉原因,但外界報導把它與算力短缺、成本壓力,以及公司把重心轉回核心企業產品連在一起。這就是關鍵教訓:一個文字轉影片模型可以吐出驚人的片段,但如果每分鐘輸出都在吞掉昂貴推理預算,商業模式很快就會縮到只剩少數人玩得起。市場不會長期獎勵一個「很酷、很貴、很難管」的工具,市場要的是能天天用、能穩定接進工作流的系統。
反方可能怎麼說
最強的反方論點是:每一個新媒體剛開始都不成熟。早期圖像模型也會畫錯手、臉和文字,但最後還是改變了創作流程。支持者會說,Sora 的缺陷只是時間問題,只要更多訓練、更大算力,這些錯誤都能修掉;真正的價值,是讓任何人只要描述一個場景,就能得到一段可用的影片草稿。這個說法不是空話,因為 demo 的品質確實夠高,創作門檻也確實被拉低了。

還有一個政策面的辯護也站得住腳。OpenAI 的確做了浮水印、metadata、內容限制與紅隊測試,對性、暴力、仇恨、名人與 IP 相關內容也設了提示與限制。這表示團隊不是忽視風險,而是知道風險很大,並且試著去管理它。
但這些防線都不夠,原因很具體。浮水印可被移除,版權預設引發反彈,而 app 帶有類 TikTok 的社交層,會把產品推向病毒式傳播,而不是受控使用。一個成本高、可驗證性弱、又容易被濫用的模型,不可能直接成為大眾信任的基礎。我承認 Sora 是重要的研究里程碑,但我不同意它已經準備好進入穩定的主流部署。
你能做什麼
如果你是工程師,先別追求更漂亮的樣片,先把時間一致性、來源標記與每秒生成成本做穩;如果你是 PM,別把使用者驚喜誤認成產品成熟,把濫用監控、權限設計與單位經濟納入上線門檻;如果你是創辦人,不要把「影片生成」當成一個天然成立的品類,真正會贏的產品,是能把生成影片做得可信、便宜、可治理,而不只是發表會上看起來很強。