Khi Z.ai (trước đây là Zhipu AI) phát hành GLM-Image vào tháng 1 năm 2026, họ không chỉ đơn thuần thêm một mô hình nữa vào lĩnh vực tạo ảnh vốn đã đông đúc—mà còn thách thức căn bản các giả định kiến trúc đã thống trị lĩnh vực này. GLM-Image kết hợp mô hình ngôn ngữ autoregressive 9 tỷ tham số với bộ giải mã diffusion 7 tỷ tham số, tạo thành hệ thống lai 16 tỷ tham số đạt được điều đáng chú ý: đây là mô hình tạo ảnh autoregressive rời rạc cấp công nghiệp mã nguồn mở đầu tiên thực sự có thể cạnh tranh với các ông lớn độc quyền về một số khả năng cụ thể, đồng thời được cung cấp miễn phí cho bất kỳ ai sử dụng và chỉnh sửa.
Khoảng 24 phút