Tag: LLM

Comment Exécuter DeepSeek-V4 Localement : Guide d’Installation Pro et Flash

DeepSeek-V4 est l’une des sorties de modèles open-weight les plus ambitieuses de DeepSeek à ce jour. La famille comprend DeepSeek-V4-Pro, un modèle Mixture-of-Experts (MoE) de 1,6T de paramètres avec 49 milliards de paramètres activés, et DeepSeek-V4-Flash, un modèle MoE plus petit de 284 milliards de paramètres avec 13 milliards de paramètres activés. Les deux modèles supportent une longueur de contexte allant jusqu’à un million de tokens.

Environ 9 min

Comment exécuter GLM-5 localement : Guide complet étape par étape

Introduction

GLM-5 est le dernier grand modèle de langage open-source de Z.ai, avec 744 milliards de paramètres au total (40 milliards actifs) et une architecture MoE. Ce modèle puissant excelle en raisonnement, codage et tâches agentiques, ce qui en fait l’un des meilleurs LLM open-source disponibles aujourd’hui.

Environ 5 min

Comment déployer et utiliser MiniMax-M1-80k : un guide complet

MiniMax-M1-80k représente un modèle de langage open-weight à grande échelle révolutionnaire, reconnu pour ses performances extraordinaires sur les tâches à contexte long et les défis complexes en ingénierie logicielle. Si vous souhaitez exploiter sa puissance pour votre projet ou environnement de production, ce guide vous plonge en détail dans la manière de déployer et d’utiliser efficacement MiniMax-M1-80k.

Environ 4 min

Débloquer le Plein Potentiel de QwQ-32B avec Ollama

Introduction

Imaginez avoir le pouvoir d'un grand modèle de langage à portée de main sans dépendre des services cloud. Avec Ollama et QwQ-32B, vous pouvez y parvenir. QwQ-32B, développé par l'équipe Qwen, est un modèle de langage de 32 milliards de paramètres conçu pour des capacités de raisonnement améliorées, ce qui en fait un outil robuste pour le raisonnement logique, la programmation et la résolution de problèmes mathématiques.

Environ 3 min