Als Z.ai (ehemals Zhipu AI) im Januar 2026 GLM-Image veröffentlichte, fügten sie nicht einfach ein weiteres Modell zum überfüllten Bildgenerierungsmarkt hinzu – sie stellten die Architekturannahmen, die das Feld dominierten, grundlegend in Frage. GLM-Image kombiniert ein autoregressives Sprachmodell mit 9 Milliarden Parametern mit einem Diffusionsdecoder mit 7 Milliarden Parametern und schafft so ein hybrides System mit 16 Milliarden Parametern, das etwas Bemerkenswertes erreicht: Es ist das erste Open-Source, industrielle, diskrete autoregressive Bildgenerierungsmodell, das in bestimmten Fähigkeiten tatsächlich mit proprietären Giganten konkurriert und dabei frei für jedermann nutzbar und modifizierbar ist.
Ungefähr 13 min