DeepSeek-V4 là một trong những phát hành mô hình open-weight tham vọng nhất của DeepSeek cho đến nay. Gia đình này bao gồm DeepSeek-V4-Pro, một mô hình Mixture-of-Experts (MoE) với 1.6T tham số và 49B tham số kích hoạt, và DeepSeek-V4-Flash, một mô hình MoE nhỏ hơn với 284B tham số và 13B tham số kích hoạt. Cả hai mô hình đều hỗ trợ độ dài ngữ cảnh lên đến một triệu token.
Khoảng 13 phút