← 術語表

Multimodal

概念

定義

能在同一架構中處理或產生多種資料型態的模型,例如文字、圖片、音訊與影片。GPT-4o、Gemini、Claude vision 與 Sora 都屬於相關例子。