Etiquetas: LLM

Cómo Ejecutar DeepSeek-V4 Localmente: Guía de Configuración Pro y Flash

DeepSeek-V4 es uno de los lanzamientos de modelos de pesos abiertos más ambiciosos de DeepSeek hasta ahora. La familia incluye DeepSeek-V4-Pro, un modelo Mixture-of-Experts (MoE) de 1.6T parámetros con 49B parámetros activados, y DeepSeek-V4-Flash, un modelo MoE más pequeño de 284B parámetros con 13B parámetros activados. Ambos modelos soportan una longitud de contexto de hasta un millón de tokens.

Alrededor de 9 min

Cómo Ejecutar GLM-5 Localmente: Guía Completa Paso a Paso

Introducción

GLM-5 es el último modelo de lenguaje grande open-source de Z.ai, con un total de 744B parámetros (40B activos) y arquitectura MoE. Este potente modelo destaca en razonamiento, codificación y tareas agenticas, convirtiéndolo en uno de los mejores LLM open-source disponibles hoy en día.

Alrededor de 5 min

Cómo Desplegar y Usar MiniMax-M1-80k: Una Guía Completa

MiniMax-M1-80k representa un modelo de lenguaje a gran escala de peso abierto revolucionario, conocido por su rendimiento extraordinario en tareas de contexto largo y desafíos complejos de ingeniería de software. Si buscas aprovechar su poder para tu proyecto o entorno de producción, esta guía profundiza en cómo desplegar y usar eficazmente MiniMax-M1-80k.

Alrededor de 3 min

Desbloqueando el Potencial Completo de QwQ-32B con Ollama

Introducción

Imagina tener el poder de un modelo de lenguaje grande al alcance de tu mano sin depender de servicios en la nube. Con Ollama y QwQ-32B, puedes lograr precisamente eso. QwQ-32B, desarrollado por el equipo de Qwen, es un modelo de lenguaje de 32 mil millones de parámetros diseñado para capacidades de razonamiento mejoradas, lo que lo convierte en una herramienta robusta para el razonamiento lógico, la codificación y la resolución de problemas matemáticos.

Alrededor de 3 min