AI Категория

Как запустить DeepSeek-V4 локально: руководство по настройке Pro и Flash

DeepSeek-V4 — один из самых амбициозных релизов моделей с открытыми весами от DeepSeek на сегодняшний день. Семейство включает DeepSeek-V4-Pro, модель Mixture-of-Experts с 1.6 триллиона параметров и 49 миллиардов активированных параметров, и DeepSeek-V4-Flash, меньшую MoE-модель с 284 миллиардами параметров и 13 миллиардами активированных параметров. Обе модели поддерживают длину контекста до одного миллиона токенов.

Около 7 мин

Как запустить GLM-5 локально: Полное пошаговое руководство

Введение

GLM-5 — это последняя открытая большая языковая модель от Z.ai, содержащая 744 млрд параметров (40 млрд активных) с архитектурой Mixture-of-Experts (MoE). Эта мощная модель отлично справляется с рассуждениями, программированием и агентными задачами, что делает её одной из лучших открытых LLM на сегодняшний день.

Около 5 мин

Как установить vLLM: Полное руководство

Вы хотите узнать, как установить vLLM, современную библиотеку Python, предназначенную для раскрытия мощных возможностей LLM? Это руководство проведет вас через процесс, обеспечивая использование потенциала vLLM для трансформации ваших AI-проектов.

Введение в vLLM

vLLM — это не просто еще один инструмент; это ворота к эффективному использованию мощи больших языковых моделей (LLM). Он поддерживает различные графические процессоры NVIDIA, такие как V100, T4 и серии RTX20xx, что делает его идеальным для вычислительно интенсивных задач. Благодаря совместимости с различными версиями CUDA, vLLM без проблем адаптируется к вашей существующей инфраструктуре, независимо от того, используете ли вы CUDA 11.8 или последнюю версию CUDA 12.1.

Около 3 мин