DeepSeek-V4 是 DeepSeek 迄今为止最具野心的开源权重模型发布之一。该系列包含 DeepSeek-V4-Pro,一个拥有 1.6T 参数的 Mixture-of-Experts 模型,激活参数为 490 亿,以及 DeepSeek-V4-Flash,一个较小的 2840 亿参数 MoE 模型,激活参数为 130 亿。两款模型均支持最长 一百万 token 的上下文长度。
这个组合听起来令人兴奋,但也带来了一个实际问题:你真的能在本地运行 DeepSeek-V4 吗?
大约 11 分钟