DeepSeek-V4 是 DeepSeek 迄今為止最具野心的開放權重模型發佈之一。該系列包含 DeepSeek-V4-Pro,一個擁有 1.6T 參數的 Mixture-of-Experts 模型,啟用參數達 49B,以及較小的 DeepSeek-V4-Flash,一個擁有 284B 參數的 MoE 模型,啟用參數為 13B。兩款模型均支援最高 一百萬個 token 的上下文長度。
這樣的組合聽起來令人興奮,但也帶來一個實際問題:你真的能在本地運行 DeepSeek-V4 嗎?
大约 11 分鐘