標籤

DeepSeek

DeepSeek 代表新一輪開源與低成本大模型競爭，牽動推論效率、KV cache、GPU 配置與雲端部署成本。從模型架構到 NVIDIA 供應鏈，它正在改寫 AI 基礎設施的估值與選型。

10 篇文章

中國正在贏得 AI 冷戰，因為它在建整個堆疊，不是在做展示

中國在 AI 競爭中領先的關鍵，不是單一模型或跑分，而是從晶片、算力到模型與分發的整體堆疊。

5 個面向看 DeepSeek 如何用免費、低 API 價格、開放權重、數學模型與市場壓力改寫 AI 定價。

中國 AI 正改走低成本、開源與海外商用路線。DeepSeek、Qwen 等模型帶動全球使用，企業也把重心放到代理工具與出海銷售。

中國 AI 實驗室主打開源模型，正在壓低推理成本，也逼 OpenAI、Anthropic 這類美國閉源 лаборатory 重新想商業模式。

10 款可本地部署的開源 LLM，從 8GB 到 136GB VRAM 都有對應選擇，適合比對推理、寫程式、長上下文與代理任務。

中國實驗室已經領跑開源 AI，西方團隊應把這件事視為新的起跑線，而不是短期波動。

5 步完成 Codex 透過 DeepSeek 的接入，含 CCX、CC Switch 與重啟檢查細節。

DeepSeek 讓市場重新算 AI 成本，但 NVIDIA 仍握有 GPU、CUDA 與資料中心供應鏈。本文用數字、競品與產業脈絡，拆解股價能否回升。

B300 有 288GB HBM3e 和 8TB/s 頻寬。這篇直接比 H200，拆解 DeepSeek 推論、KV cache、雲端成本與部署取捨。

Raschka 的 LLM Architecture Gallery 把 GPT-2、Llama 3、OLMo 2、DeepSeek、Qwen 等模型的層數、注意力與 KV cache 數字攤開來比，工程師一眼就能看出部署差異。