返回首頁

標籤

多模態模型

多模態模型把影像、文字、程式碼與語音放進同一套推理流程,適合代理式工作流、視覺理解與人機互動。這裡聚焦模型架構、長上下文、微調策略與部署成本,從 Qwen3.5 視覺分層訓練到 Kimi K2.5、MiMo 這類新模型的實作差異。

4 篇文章