標籤
DeepSeek
DeepSeek 代表新一輪開源與低成本大模型競爭,牽動推論效率、KV cache、GPU 配置與雲端部署成本。從模型架構到 NVIDIA 供應鏈,它正在改寫 AI 基礎設施的估值與選型。
3 篇文章

產業動態/4月3日
DeepSeek 之後,NVIDIA 股價會回來嗎
DeepSeek 讓市場重新算 AI 成本,但 NVIDIA 仍握有 GPU、CUDA 與資料中心供應鏈。本文用數字、競品與產業脈絡,拆解股價能否回升。

產業動態/4月3日
NVIDIA B300 對 H200:DeepSeek 實…
B300 有 288GB HBM3e 和 8TB/s 頻寬。這篇直接比 H200,拆解 DeepSeek 推論、KV cache、雲端成本與部署取捨。

技術研究/4月2日
Sebastian Raschka 的 LLM 架構圖鑑
Raschka 的 LLM Architecture Gallery 把 GPT-2、Llama 3、OLMo 2、DeepSeek、Qwen 等模型的層數、注意力與 KV cache 數字攤開來比,工程師一眼就能看出部署差異。