Tag: SGLang

Como Executar o Xiaomi MiMo-V2-Flash Localmente: Um Guia Completo de Instalação

O MiMo-V2-Flash da Xiaomi representa um avanço no design eficiente de modelos de IA, apresentando 309 bilhões de parâmetros totais, sendo apenas 15 bilhões ativos durante a inferência. Essa arquitetura Mixture-of-Experts oferece desempenho excepcional mantendo exigências razoáveis de hardware para implantação local. Neste guia abrangente, vamos mostrar diversas formas de rodar o MiMo-V2-Flash localmente na sua máquina.

Por volta de 5 min

Como Rodar o MiniMax M2 Localmente: Guia Completo de Implantação Passo a Passo

Rodar o MiniMax M2 localmente te dá controle total sobre este poderoso modelo de IA projetado para tarefas de programação e agentes. Seja para evitar custos de API, garantir a privacidade dos dados ou personalizar o modelo para suas necessidades específicas, a implantação local é o caminho ideal. Este guia abrangente vai te conduzir por cada passo do processo.

Por volta de 12 min

Como Executar o Kimi-K2-Instruct Localmente: Um Guia Completo

Executar o Kimi-K2-Instruct localmente pode parecer complicado no começo — mas com as ferramentas e passos certos, é surpreendentemente simples. Seja você um desenvolvedor querendo experimentar modelos avançados de IA ou alguém que deseja controle total sobre a inferência sem depender de APIs na nuvem, este guia irá conduzi-lo por todo o processo passo a passo.

Por volta de 4 min