DeepSeek-V4はDeepSeekがこれまでにリリースした中で最も野心的なオープンウェイトモデルの一つです。このファミリーには、1.6Tパラメータ、49Bアクティベートパラメータを持つMixture-of-ExpertsモデルのDeepSeek-V4-Proと、より小型の284Bパラメータ、13BアクティベートパラメータのMoEモデルであるDeepSeek-V4-Flashが含まれます。両モデルとも最大100万トークンのコンテキスト長をサポートしています。
この組み合わせは非常に魅力的ですが、実際にDeepSeek-V4をローカルで動かせるのかという現実的な疑問も生じます。
約6分