DeepSeek-V4 es uno de los lanzamientos de modelos de pesos abiertos más ambiciosos de DeepSeek hasta ahora. La familia incluye DeepSeek-V4-Pro, un modelo Mixture-of-Experts (MoE) de 1.6T parámetros con 49B parámetros activados, y DeepSeek-V4-Flash, un modelo MoE más pequeño de 284B parámetros con 13B parámetros activados. Ambos modelos soportan una longitud de contexto de hasta un millón de tokens.
Alrededor de 9 min