DeepSeek-V4는 지금까지 DeepSeek에서 공개한 가장 야심찬 오픈 웨이트 모델 중 하나입니다. 이 시리즈에는 49B 활성화 파라미터를 가진 1.6T 파라미터 Mixture-of-Experts 모델인 DeepSeek-V4-Pro와 13B 활성화 파라미터를 가진 더 작은 284B 파라미터 MoE 모델인 DeepSeek-V4-Flash가 포함되어 있습니다. 두 모델 모두 최대 백만 토큰의 컨텍스트 길이를 지원합니다.
이 조합은 매우 흥미롭지만, 실질적인 질문이 생깁니다: 실제로 DeepSeek-V4를 로컬에서 실행할 수 있을까요?
약 3 분