DeepSeek-V4 — один из самых амбициозных релизов моделей с открытыми весами от DeepSeek на сегодняшний день. Семейство включает DeepSeek-V4-Pro, модель Mixture-of-Experts с 1.6 триллиона параметров и 49 миллиардов активированных параметров, и DeepSeek-V4-Flash, меньшую MoE-модель с 284 миллиардами параметров и 13 миллиардами активированных параметров. Обе модели поддерживают длину контекста до одного миллиона токенов.
Google DeepMind выпустила Gemma 4 в начале 2026 года, и 31-миллиардная версия с инструктивной настройкой попала в самую точку: достаточно большая, чтобы конкурировать с проприетарными моделями в бенчмарках на рассуждения, и достаточно маленькая, чтобы работать на приличной потребительской видеокарте. Она набирает 85,2% на MMLU Pro и 89,2% на AIME 2026 без инструментов — это ставит её в один ряд с моделями вдвое большего размера.
Запуск Kimi-K2-Instruct локально может показаться сложным на первый взгляд — но с правильными инструментами и последовательными шагами это оказывается удивительно просто. Независимо от того, являетесь ли вы разработчиком, желающим поэкспериментировать с продвинутыми AI-моделями, или человеком, который хочет полностью контролировать процесс инференса без использования облачных API, это руководство проведёт вас через весь процесс шаг за шагом.