DeepSeek-V4 to jedna z najbardziej ambitnych otwartych wersji modeli z wagami od DeepSeek do tej pory. Rodzina obejmuje DeepSeek-V4-Pro, model Mixture-of-Experts (MoE) o 1,6 biliona parametrów z 49 miliardami aktywowanych parametrów, oraz DeepSeek-V4-Flash, mniejszy model MoE o 284 miliardach parametrów z 13 miliardami aktywowanych parametrów. Oba modele obsługują długość kontekstu do jednego miliona tokenów.
Około 7 minut