Эволюция моделей DeepSeek: DeepSeek-V3 против DeepSeek-V3-0324
Эволюция моделей DeepSeek: DeepSeek-V3 против DeepSeek-V3-0324
Команда DeepSeek AI продолжает совершенствовать свои флагманские языковые модели, и DeepSeek-V3-0324 (выпущенная в марте 2025 года) представляет собой значительное обновление по сравнению с оригинальной DeepSeek-V3 (декабрь 2024 года). Обе модели используют архитектуру Mixture-of-Experts (MoE), но различаются по производительности, доступности и технической оптимизации.
Основные архитектурные различия
Особенность | DeepSeek-V3 | DeepSeek-V3-0324 |
---|---|---|
Всего параметров | 671B | 685B |
Активные параметры | 37B на токен | 37B на токен |
Обучающие данные | 14.8T токенов | Расширенный корпус с лицензией MIT |
Скорость вывода | ~20 токенов/сек (на высокопроизводительных GPU) | Оптимизировано для ответов в реальном времени |
Лицензия | Индивидуальная | MIT |
Обновление V3-0324 вводит улучшенные технологии балансировки нагрузки и поддержку квантизации, что позволяет быстрее развертывать на потребительском оборудовании, таком как Apple M3 Ultra Mac Studio (достигая >20 токенов/сек).
Улучшения производительности
- Логика и кодирование: Первые пользователи сообщают, что V3-0324 превосходит Claude 3.7 Sonnet в задачах фронтенд-дизайна и решении математических задач без специализированного запроса.
- Готовность к мультимодальности: V3-0324 включает архитектурные усовершенствования для будущей мультимодальной интеграции, в отличие от своего предшественника.
- Обязательство к открытому исходному коду: В отличие от ограничительной лицензии V3, лицензия MIT V3-0324 позволяет коммерческое использование и модификацию.
Доступность и развертывание
- Бесплатный доступ: Обе модели доступны через OpenRouter, но V3-0324 предлагает расширенные лимиты бесплатного уровня (131,072 контекстное окно).
- Локальное развертывание: 4-битная квантизированная версия V3-0324 уменьшает занимаемое дисковое пространство с 641 ГБ до 352 ГБ, что делает ее осуществимой для высокопроизводительных локальных установок.
- Совместимость API: V3-0324 сохраняет обратную совместимость с конечными точками API V3, требуя минимальных изменений в коде для миграции.
Рекомендации по областям применения
- V3-0324: Идеально подходит для коммерческих приложений, требующих быстрой итерации (например, помощники по кодированию в реальном времени) или проектов, нуждающихся в гибкости открытого исходного кода.
- Оригинальная V3: Подходит для устаревших систем, уже интегрированных со старой структурой цен API ($0.27/M входные токены).
Выпуск V3-0324 отражает стратегию DeepSeek по демократизации передового ИИ, одновременно сокращая разрыв в производительности с проприетарными моделями, такими как GPT-4. Разработчики хвалят ее баланс скорости и возможностей, особенно в сценариях с низкой задержкой.
Для вычислительно интенсивных задач рассмотрите облачные решения, такие как LightNode, чтобы оптимизировать затраты на вывод.