Tag: LLM

Como Executar DeepSeek-V4 Localmente: Guia de Configuração Pro e Flash

DeepSeek-V4 é uma das liberações de modelo open-weight mais ambiciosas da DeepSeek até agora. A família inclui o DeepSeek-V4-Pro, um modelo Mixture-of-Experts com 1,6T de parâmetros e 49B de parâmetros ativados, e o DeepSeek-V4-Flash, um modelo MoE menor com 284B de parâmetros e 13B de parâmetros ativados. Ambos os modelos suportam um comprimento de contexto de até um milhão de tokens.

Por volta de 9 min

Como Rodar GLM-5 Localmente: Guia Completo Passo a Passo

Introdução

GLM-5 é o mais recente modelo de linguagem grande open-source da Z.ai, com 744B parâmetros totais (40B ativos) e arquitetura MoE. Este modelo poderoso se destaca em raciocínio, programação e tarefas agentivas, tornando-se um dos melhores LLMs open-source disponíveis atualmente.

Por volta de 5 min

Como Implantar e Usar o MiniMax-M1-80k: Um Guia Completo

O MiniMax-M1-80k representa um modelo de linguagem de grande escala com pesos abertos revolucionário, conhecido por seu desempenho extraordinário em tarefas de contexto longo e desafios complexos de engenharia de software. Se você deseja aproveitar seu poder para seu projeto ou ambiente de produção, este guia aprofunda como implantar e usar efetivamente o MiniMax-M1-80k.

Por volta de 3 min

Desbloqueando Todo o Potencial do QwQ-32B com Ollama

Introdução

Imagine ter o poder de um grande modelo de linguagem ao seu alcance sem depender de serviços em nuvem. Com Ollama e QwQ-32B, você pode alcançar exatamente isso. O QwQ-32B, desenvolvido pela equipe Qwen, é um modelo de linguagem com 32 bilhões de parâmetros projetado para capacidades de raciocínio aprimoradas, tornando-o uma ferramenta robusta para raciocínio lógico, codificação e resolução de problemas matemáticos.

Por volta de 3 min