Google DeepMind lanzo Gemma 4 a principios de 2026, y la variante de 31B ajustada por instruccion llega a un punto ideal: lo bastante grande como para competir con modelos privativos en benchmarks de razonamiento, y lo bastante pequeno para ejecutarse en una GPU de consumo decente. Consigue un 85.2% en MMLU Pro y un 89.2% en AIME 2026 sin herramientas, lo que la pone en la misma conversacion que modelos con el doble de parametros.
Alrededor de 11 min
Ejecutar Kimi-K2-Instruct localmente puede parecer complicado al principio — pero con las herramientas y pasos adecuados, es sorprendentemente sencillo. Ya seas un desarrollador que quiere experimentar con modelos avanzados de IA o alguien que desea tener control total sobre la inferencia sin depender de APIs en la nube, esta guía te llevará paso a paso por todo el proceso.
Alrededor de 4 min