DeepSeek-V4 — один из самых амбициозных релизов моделей с открытыми весами от DeepSeek на сегодняшний день. Семейство включает DeepSeek-V4-Pro, модель Mixture-of-Experts с 1.6 триллиона параметров и 49 миллиардов активированных параметров, и DeepSeek-V4-Flash, меньшую MoE-модель с 284 миллиардами параметров и 13 миллиардами активированных параметров. Обе модели поддерживают длину контекста до одного миллиона токенов.
Около 7 мин