DeepSeek 模型的演变:DeepSeek-V3 与 DeepSeek-V3-0324
DeepSeek AI 团队继续完善其旗舰语言模型,DeepSeek-V3-0324(于 2025 年 3 月发布)代表了对原始 DeepSeek-V3(2024 年 12 月)的重大升级。这两个模型都采用了专家混合(MoE)架构,但在性能、可访问性和技术优化方面有所不同。
核心架构差异
特性 | DeepSeek-V3 | DeepSeek-V3-0324 |
---|---|---|
总参数 | 671B | 685B |
活跃参数 | 每个令牌 37B | 每个令牌 37B |
训练数据 | 14.8T 令牌 | 扩展语料库,具有 MIT 许可 |
推理速度 | ~20 令牌/秒(在高端 GPU 上) | 针对实时响应进行了优化 |
许可证 | 自定义 | MIT |
大约 2 分钟