Google DeepMind merilis Gemma 4 di awal 2026, dan varian instruction-tuned 31B-nya ada di titik yang pas: cukup besar untuk bersaing dengan model proprietary di benchmark reasoning, cukup kecil untuk dijalankan di GPU konsumen yang layak. Dia mendapat skor 85.2% di MMLU Pro dan 89.2% di AIME 2026 tanpa tools, yang menempatkannya di liga yang sama dengan model dua kali ukurannya.
Sekitar 10 menit