DeepSeek-V4 est l’une des sorties de modèles open-weight les plus ambitieuses de DeepSeek à ce jour. La famille comprend DeepSeek-V4-Pro, un modèle Mixture-of-Experts (MoE) de 1,6T de paramètres avec 49 milliards de paramètres activés, et DeepSeek-V4-Flash, un modèle MoE plus petit de 284 milliards de paramètres avec 13 milliards de paramètres activés. Les deux modèles supportent une longueur de contexte allant jusqu’à un million de tokens.
Environ 9 min