Tag: LLM

Hướng Dẫn Cài Đặt DeepSeek-V4 Cục Bộ: Phiên Bản Pro và Flash

DeepSeek-V4 là một trong những phát hành mô hình open-weight tham vọng nhất của DeepSeek cho đến nay. Gia đình này bao gồm DeepSeek-V4-Pro, một mô hình Mixture-of-Experts (MoE) với 1.6T tham số và 49B tham số kích hoạt, và DeepSeek-V4-Flash, một mô hình MoE nhỏ hơn với 284B tham số và 13B tham số kích hoạt. Cả hai mô hình đều hỗ trợ độ dài ngữ cảnh lên đến một triệu token.

Khoảng 13 phút

Cách Chạy GLM-5 Tại Máy: Hướng Dẫn Chi Tiết Từng Bước

Giới thiệu

GLM-5 là mô hình ngôn ngữ lớn mã nguồn mở mới nhất từ Z.ai, với tổng cộng 744 tỷ tham số (40 tỷ tham số hoạt động) sử dụng kiến trúc MoE. Mô hình mạnh mẽ này nổi bật trong các tác vụ suy luận, lập trình và tác vụ tác nhân, khiến nó trở thành một trong những LLM mã nguồn mở tốt nhất hiện nay.

Khoảng 8 phút

Cách Triển Khai và Sử Dụng MiniMax-M1-80k: Hướng Dẫn Toàn Diện

MiniMax-M1-80k là một mô hình ngôn ngữ lớn open-weight đột phá, nổi tiếng với hiệu suất xuất sắc trong các tác vụ ngữ cảnh dài và các thách thức kỹ thuật phần mềm phức tạp. Nếu bạn muốn tận dụng sức mạnh của nó cho dự án hoặc môi trường sản xuất của mình, hướng dẫn này sẽ đi sâu vào cách triển khai và sử dụng hiệu quả MiniMax-M1-80k.

Khoảng 6 phút

Khám Phá Tiềm Năng Đầy Đủ của QwQ-32B với Ollama

Giới thiệu

Hãy tưởng tượng bạn có sức mạnh của một mô hình ngôn ngữ lớn ngay trong tầm tay mà không cần phụ thuộc vào dịch vụ đám mây. Với Ollama và QwQ-32B, bạn có thể đạt được điều đó. QwQ-32B, được phát triển bởi đội ngũ Qwen, là một mô hình ngôn ngữ với 32 tỷ tham số được thiết kế để nâng cao khả năng suy luận, biến nó thành một công cụ mạnh mẽ cho suy luận logic, lập trình và giải quyết các bài toán toán học.

Khoảng 4 phút